唐杉博士:人工智能芯片发展及挑战
数据派THU
共 5018字,需浏览 11分钟
·
2021-12-23 07:22
清华大数据软件团队官方微信公众号 来源:DataFunTalk 本文约4200字,建议阅读10分钟
本文与你讨论人工智能芯片的架构特征、发展趋势、以及AI DSA架构给AI软件栈带来的挑战。
Al DSA产生的背景和产业现状 百花齐放的Al DSA硬件 Al DSA软件栈面临的挑战
不论是模型的规模还是算力需求,都是呈指数形式的增长。同时,由于摩尔定律放缓,通用处理器的性能提升已经十分有限。因此,计算需求与处理能力的提升之间存在较大的GAP。 第二,AI计算现在无处不在,AI计算任务多样且复杂。例如,在云上、边缘侧与端设备上,不同的场景下面包括不同的训练和推理的需求,差异是非常大的。在云上进行训练,可能需要非常高的吞吐量,非常高的精度,以及非常强的扩展性等等;而在端上,情况更加复杂,会有计算量需求巨大的情况,如自动驾驶可能需要P级算力;同时,也会有能耗和成本非常受限的应用,像可穿戴设备中的AI计算等等。
传统架构+DSA。在传统架构的基础上增加新的DSA的硬件以及相应的指令。例如GPU增加Tensor Core这种专用的加速器。它的优势是灵活通用,性能比较平衡,而劣势是相对更专用的DSA在特定应用场景下的能效比、性价比。 Al领域专用架构,即针对AI的新架构。例如Google TPU,它的设计是专门针对有限的AI应用场景,牺牲一定的通用性和灵活性来换取更高的能效或者性价比。
AI DSA诞生的大背景是:传统通用芯片无法满足新的计算模式的需求; AI DAS需要实现软硬件的全栈解决方案; AI DSA的发展方向取决于AI算法和应用的发展以及底层芯片技术的支撑,未来很长一段时间仍然可能是多种架构并存; 由于软件硬件不同层次间还无法形成清晰的边界,巨大的软硬件的设计空间混杂在一起,给设计和优化带来巨大挑战; 硬件架构的创新最终是以一个完整的软硬件技术栈提供给用户的,如果没有好的软件支持,硬件创新无法产生真正的收益。
编辑:黄继彦
校对:林亦霖
评论
分布式存储架构发展及技术挑战
从云和互联网的业务场景来看,其存储域主要采用基于服务器部署分布式存储服务的融合方式,它面临如下挑战 :1.数据保存周期与服务器更新周期不匹配。大数据、人工智能等新兴业务催生出海量数据,大量数据需按照其生命周期策略(例如 8~10 年)进行保存。2.性能可靠与资源利用率难以兼得。支
程序员面试吧
0
唐博士
北京唐博士医学科技有限公司是一家专门从事糖尿病相关产品的引进、经营和提供相关售后服务的医疗器械公司,目前主要经营由韩国AllMedicus公司生产的糖尿病相关产品,即唐博士(GlucoDr)血糖仪在中
唐博士
0
音视频行业发展面临的困境及挑战!
惊鸿一瞥,浮生如梦。一夜小雨,大地苍凉,落叶纷飞,一抬头,满目疮痍,繁华落尽。那个金灿灿,红艳艳,美滋滋的秋天又要跟我们说再见了。
今年的天气冷的格外要早,一晃眼,马上就是立冬了,还有不到两个月时间2020年也就离我们而去了。同时,从今年1月份开始通告全民佩戴口罩到目前为止我们依然需要出门戴口罩,并且这样的情况要恢复到过往正常状态,可能还要持续1-2年。
回顾一下2020年大概十个月的时间中,中国乃至世界发生的重大热点新闻事件。武汉封城,北京新发地新冠,北斗三号导航系统星座部署计划完成,一代赌王何鸿燊逝世,瑞幸咖啡业绩造假,中国“天问一号”火星探测开启,疫情“吹哨人”李文亮医生因新冠肺炎离世,杭州女子失踪碎尸案,昆明小学生研究抗
有壹说叁
0