AI芯片市场发展现状如何?AI芯片+大数据国际高峰论坛干货汇总

来源:食品实验室服务 日期:2021-8-30

智能化技术引发了三大产业变革,包括云计算将计算资源虚拟化,“革了IT基础设施的命”;物联网和边缘计算桥接消费网和产业网,“革了互联网的命”;AI构建起机器学习应用范式和图景,“革了自动化的命”。这是前不久上海市集成电路行业协会主办,上海集成电路产业投资基金管理有限公司合办的2021 AI芯片+大数据国际高峰论坛上,嘉楠科技董事长兼CEO张楠赓提到的。

 

其中最后一点表述还颇有意思,即AI作为一种炼丹术看起来的确是对传统自动化解决方案的革命——虽然在很多观点看来,两者可能是互补的关系。但无论如何,AI技术都被很多人称作是第四次工业革命;也给行业带来了大量机会,同时深刻改变着云、物联网等现代科技的组成部分。

AI人工智能是目前各国都期望在技术上抢占高地的领域,中国自前些年开始在AI方面就有一系列的产业政策布局,包括2017年《新一代人工智能发展规划》,《促进新一代人工智能产业发展三年行动计划(2018-2020)》,以及“十四五”规划人工智能三大布局,目标纲要全文,“智能”“智慧”相关表达出现了57次。
广告

AI本身是相当庞大的话题,中国人工智能产业发展联盟办公室主任石霖给出了下面这张图,自下而上地总结了“AI技术体系架构”。这是此前,石霖在主题演讲环节给出的一张图。AI芯片,是这个架构的底层驱动力。众所周知,按照训练与推理,以及云和端又可将AI芯片做进一步的划分。

AI芯片市场发展现状

Tractica、中国信息通信研究院的数据显示,2025年AI芯片市场规模会达到726亿美元;而中国国内的芯片市场规模到2024年可达785亿元人民币,市场规模保持40%-50%的增速。

AI芯片产业竞争激烈,从不同维度来看,市场参与者之间的竞争态势都在逐步走向白热化。如下图所示,不仅是终端侧参与不同领域市场竞争的AI芯片多样,而且云端侧的训练、推理也有越来越多的市场参与者加入角逐,而不只是英伟达、Intel这样的传统AI或GPU芯片厂商。

石霖谈到AI发展的几个趋势:目前AI云端应用场景正不断丰富,大数据分析、精准营销、商业决策等都实现了应用落地。而能源、交通、农业、公共事业等更多的商业场景,也能看到AI的逐步渗透。

与此同时,云受限于带宽、时延的限制,AI计算正下沉至边缘和终端。所以AI又表现出了云侧与边缘侧的协同发展。比如自动驾驶,端侧也逐步部署推断设备,由本地智能算法做对应的决策;安防领域,摄像头数量增加、高清需求都带来了带宽方面的压力,这就要求在端侧做特征提取,随后将过滤后的特征值发往云侧做计算。

端侧的场景需求变得多样化,不同应用场景对性能需求差异大,定制化成为端侧芯片的发展趋势。例如在互联网场景,算力<1TOPS,要求尺寸小、成本更低、可靠性高;安防设备算力要求4-20TOPS;自动驾驶要求20-4000TOPS算力,对功耗也越来越敏感,可靠性要求极高...

所以针对产品形态多样化、框架种类分散化、算法快速迭代化、应用场景碎片化等特点,信通院发起了AIIA DNN benchmark项目,“为应用企业提供(AI芯片)选型参考,为芯片企业提供第三方评测结果”。从石霖的陈述来看,这是个面向边缘、终端、云,以及推理、训练等不同场景的基准测试系统。评估工具不仅已经在Github开源,而且也得到了不少AI芯片市场参与者的支持;AIIA 2020年度首批《AI芯片技术选型目录》似乎也取得了不错的成果。

从信通院的角度可较大程度掌握AI芯片市场的发展趋势。而另一方面还可从投资的角度来看这一市场目前的情况。上面这张图是联想集团副总裁、联想创投集团高级合伙人宋春雨罗列,联想在AI方面的部分投资布局。从最上层垂直领域的投资,多少也能看出如今的AI热点在哪些部分。

底层芯片与传感器相关的部分,宋春雨特别提到了对于寒武纪和思特威等厂商的投资,前者是AI专用芯片领域颇有建树的企业,后者则在图像传感器领域占据一席之地——尤其BSI+全局快门CIS技术,思特威此前也在我们的活动上做过分享。往应用端走,宋春雨分享了更多在无人机工业数据采集、车载智能驾仓、交通图片深度识别、犯罪预测预防等方面的投资。
芯片设计和HPC,需要云

这两年但凡提到芯片设计,似乎绕不过去的一个话题就是EDA上云或芯片设计上云。即便这个话题最早可以追溯到10年前,如今云能够承载的弹性算力,以及安全性方面的显著提升,加上软件及系统层面的经验积累,芯片设计上云的时机似乎真的已经到了。

大会上微软公司大中华区首席技术官徐明强,提到了Microsoft Azure对于EDA的赋能,如今微软和一些主要的EDA厂商,以及设计、制造、封测全产业链均有合作。徐明强提到,“Azure云已经获得头部Foundry以及芯片设计公司的认证和支持。”

包括与台积电合作,在Azure云上验证7nm芯片设计;与Cadence、台积电合作,建立开放创新平台(OIP)虚拟设计环境(VDE)——台积电此前曾公开提到OIP VDE是台积电与OIP设计生态环境伙伴,以及领先的云端服务公司合作的成果,旨在云端提供完整的系统芯片设计环境;以及基于公有云服务商托管基础设施构建芯片设计和验证环境,即与Synopsys合作Synopsys Cloud Solution。

芯片设计不只是仿真需求极高的算力,实际上不同阶段的负载波动是比较大的,而且对于计算、存储、网络资源的需求各不相同。对于芯片设计企业而言,IT基础设施本身就是一笔巨大的投资:而且可能面临要么算力不够,要么大量算力闲置导致浪费的情况。芯片云的价值就在于可弹性扩展算力,“按需分配,EDA的IT提前进入共产主义。”徐明强打趣说。

徐明强举例谈到和台积电之间的合作,“台积电7nm数据中心的基础建设,按照需求需要扩张6倍,本地服务器无法达到最佳化。台积电与Synopsys、Cadence利用微软Azure上的高性能计算架构,在20分钟内就打开10万个虚拟运算元,大量缩短开发时间。”“包括台积电5nm工艺开发提前了9个月量产。”除了算力弹性扩展,其中一个重要的属性是安全性,“PDK文件可以放心地放到云上”。

上面这张图是EDA上云,几个不同的参与者角色:包括微软提供云基础架构,台积电提供PDK文件——各类工艺库,EDA工具厂商,及其上的设计。当然芯片设计上云的参与者可能还需要包括IP供应商。且各层级事实上还有更多参与者,比如基础设施部分毕竟还涉及到存储、networking等。

除了微软之外,这次AI芯片+大数据国际高峰论坛上,阿里云也列席了。不过阿里云主要谈的是云的高性能计算,及自家的E-HPC(弹性高性能计算)——探讨的就是更大的范畴了,芯片设计上云理应也在其范畴内。其中稍稍提到了HPC针对制造业的仿真,这类负载的计算特点包括“单节点高浮点性能,低延迟高带宽MPI通信,并行文件系统”阿里云高性能计算负责人何万青表示。

云计算拥抱HPC,所需实现的包括软硬件系统虚拟化、物理机性能与隔离、支持VM,裸金属与容器、RDMA网络管控、集群通信优化、HPC并行IO优化、高通量优化、并行IO优化、元数据节点性能优化。何万青列举了阿里云HPC的部分应用场景,包括EDA、能源、生命科学、气候模拟、工业制造等。他举例谈到吉利汽车仿真云平台就带来了40%的效率提升;另外,为新冠药物研发提供AI免费算力等。
AI芯片实现突破的各显神通

大会现场的AI芯片制造商也不少,无论是将芯片供应给下游的,还是芯片自用的。高通、百度就是其中的典型例子。高通作为终端侧手机芯片的主要供应商,骁龙SoC内的AI算力已无需赘言,包括这两年在DSP中加入专用的Tensor Core做AI加速;此外高通的AI芯片也部署到了企业、基础设施和汽车;这是从芯片供应商的角度,在AI芯片方面颇具代表性的企业。

而百度在AI领域最广为人知的应该是昆仑AI芯片。不过百度公司语音首席架构师、鸿鹄语音芯片总负责人贾磊在会上主要谈的是相关百度鸿鹄语音芯片的技术创新和产业应用。“鸿鹄是语音团队独立设计的。纯做软件算法的团队为什么要做芯片?”贾磊说,端到端建模是主要趋势,“我们的语音技术从传统DNN、CNN开始,发展到今天是端到端信号声学一体化建模,用一个模型来描述整个流程。”

贾磊提到语音领域“世界首个工业落地的注意力建模(SMLTA)”,如上图所示。SMLTA带来的语音识别解码器技术革命在于针对传统解码的指数级别空间膨胀,转而采用打分计算,固定4条路径解码。

语音识别的过程“被芯片化”,而传统的语音交互方式,“转化为端侧8个NN计算”,如上图所示。与此同时“鸿鹄是软件定义芯片,软件算法先进。”鸿鹄一代芯片的设计思路包括,“HIFI做NPU计算”(自定义指令集让神经网络计算能力比HiFi4最高能力提升4倍),“模型加载和计算并行”(据说为此做了专门的内存和cache设计),“高压缩率的模型,置于片内SRAM内部”,“一颗芯片,要独立解决多路信号增强和唤醒,充分解放主芯片”。

以上是规划中的鸿鹄二代芯片设计图,除了增加主控芯片外,还要“引入自己的NPU”。这代产品的设计思路除了增加适用于百度AI的端侧NPU之外,还在“多种网络激活和权重的低功耗的定浮点混合计算”,“模型检测部分置于片内,模型决策部分置于片外,实现成本和计算的双向优化”,“模型加载与NPU计算进一步并行化,更加合理的cache机制最大程度减小加载带宽压力”。

目前鸿鹄语音芯片已经在电视、扫地机器人、智能家电等领域开始应用,实现诸多家电的语音控制。

除了这些发展比较早的芯片相关企业,会上也有初创企业的声音。壁仞科技总裁徐凌杰在本次大会上提到了“人工智能芯片的突破之路”,徐凌杰提到,“新世界不需要模仿者”,要做的绝不是“低端替代、低价竞争”,而是“disruptive innovation,破坏式创新”。而“底层革新”才是人工智能芯片的突破口。

所谓的底层革新包含架构革新、生态革新与技术革新。“好的架构,通用性是基础。”徐凌杰说,“GPU以前其实也是专用芯片,如今英伟达GPU渲染的pipeline更丰富,就有了可编程性,有了CUDA、有了HPC,当矢量引擎也无法满足算力需求时,就加入Tensor Core。”“在通用性的基础上,再深耕专用性。”

“架构革新要求我们有原创芯片。而架构师是目前最大的缺口和瓶颈。”“架构师要懂硬件、软件,还要懂软件怎么造出来的,甚至是工艺本身,才能够设计出可稳定工作、性能优良的芯片。我们国家在这方面的人才很欠缺,教育也跟不上。”“壁仞科技在初创公司中脱颖而出,因为在原创架构上做投入和布局,大规模做原创性开发,构建强大的架构团队。”徐凌杰在展示壁仞科技未来的“架构布局”中就强调打造原创的体系架构,构建强大的架构团队。

至于生态革新,“生态其实比芯片本身更难。”壁仞科技提出以通用编程模型为中心的异构计算开发平台SUPAI,兼容现有异构计算软件生态,在开发者层面就更有优势。而技术革新,则是指通过创新的技术来突破,先进封装、极速互联、存算一体、软硬协同等均包含在内。这些大概是壁仞科技未来产出的指导方向。
AI领域其他层级的市场参与者

如文首那张架构图列出的,AI技术的市场参与者不仅有底层芯片,还有其上的各种层级。会上于其他层级发展较有代表性的是Intel、腾讯。Intel虽然在大众认知里是个不折不扣的芯片厂商,而且也造AI芯片,但这次会上分享的是相关于大数据分析平台构建的话题;而腾讯在AI方面的研究则更偏应用。

英特尔院士、大数据技术全球CTO、大数据分析和人工智能创新院院长戴金权表示,AI从实验室走向生产系统——尤其将AI技术应用到大规模的分布式场景中,并没有那么简单。因此Intel期望构建大数据分析和统一人工智能平台。比如说对图片中的对象做识别,最终应用到图片去重、图片搜索等场景,“就实验室角度并不是很复杂的事情。但是要把这些模型、算法落实到大规模的场景中,就会遇到很多的挑战。”

比如此前Intel与京东合作,对商品图片对象做特征提取。这些图片可能在大规模数据库、存储系统中,需要并发读取、处理,然后用深度学习模型做推理,结果还需要写回至大规模文件系统中。整个系统是个分布式流程,如果手动构建整个流程,从开发和运维的角度实则会遇上各种挑战。

这实际上就需要构建一个端到端的大数据AI应用,即从数据导入到最终推理。Intel构建了一款Analytics Zoo的开源软件,底层基于Intel的各种支持,如上图所示的技术栈——这个项目是开源在Github之上的。戴金权还分享了一些基于Analytics Zoo的案例,比如汉堡王,在用户点餐时可以根据其点餐来推荐更感兴趣的食品;韩国电信公司SK Telecom,基于Analytics Zoo做网络质量预测,收集不同基站的质量指标,预测网络健康程度。

比如对于后一个例子,除了构建AI模型,在具体实施时遇到的问题可能包括每个基站要输出大量的KPI数据,每5分钟就有新数据要传输。如果利用传统设计,手动管理各个集群,不同的工作流,在维持数据更新、实施工作流串联、开发运维等问题上都变得很复杂。将其整合到统一的端到端工作流,可提高开发效率,加快推理或训练速度。

腾讯量子实验室理论组负责人谢昌谕则从更偏应用端的角度,分享了AI赋能新药研发。谢昌谕说,制药领域有个法则叫Eroom's Law,就是把Moore's Law反着写的法则。“虽然技术日新月异发展,但制药成本却在持续增加,每隔9年就翻倍。”“昂贵的研发成本,而且周期很长,大部分药物开发到临床阶段90%都宣告失败。”这就要求革新。

在药物研发的整个过程里,量子计算和AI能够帮助前期3-6年的关键时期,如上图所示。通过前期的模拟和计算,不至于到后期才发现海量成本投入是没有意义的。

在深度学习之前,大规模应用机器学习,但机器学习需要深度依赖专家知识、人为设计。而深度学习是让AI自己去学习特征,更能提高预测准确性。“但药学数据本来也很稀少,数据污染普遍也比较严重,所以在这个领域的突破,还是要结合深度学习和专家知识两者。”谢昌谕表示。

今年的Briefings in Bioinformatics 2021上,腾讯“通过结合分子图和分子描述符作为改进的图神经网络(HRGCN+)的输入,提出了一种简单而高效的建模方法。评估结果表明,HRGCN+在11个与药物发现相关的数据集上具有出色的性能。”基于该模型,构成分子成药性评估平台,“我们与高效沟通合作,取得宝贵的数据,目前能够预测约50多个指标。”

除了分子性质预测之外,谢昌谕还谈到了分子与靶点的亲和力预测,以及合成路径设计。腾讯量子实验室在腾讯云上研发计算化学软件和平台,开发新量子组合算法和量子AI算法,期望建立化学及制药、材料等相关领域的生态系统。这就属于AI在新药研发方面的具体应用了。

论坛相关的分享内容较多,很多内容也是偏专业技术的,我们无法再做更多展开,有兴趣的同人可根据上述目录性质的阐述对相关内容做深挖。另外论坛上实则还有AI周边相关企业的分享,例如中国联通从5G的角度探讨,5G是如何助力AI发展的等等......这么多分享内容实则能够体现AI当前如火如荼的发展潮流,以及上下游之间在发展AI技术上的协同。在新的十四五期间,AI本身会发展成什么样,又将对多少行业产生革新,是我们拭目以待的。