系统厂商为何蜂拥做芯片？

系统厂商蜂拥自研芯片，有利于实现“系统＋算法＋软件＋芯片”集成式优化的智能产品，这是目前算法和芯片技术决定的。未来终端智能的基础瓶颈在芯片研发成本，开源的指令集与开工工具，全自动eda工具和先进封装工艺有望大幅降低芯片开发门槛，压缩开发时间并降低开发成本，推动终端智能的发展。
近年来，我们发现越来越多的系统厂商开始成立自己的芯片部门，开发并推出面向自有产品的芯片，以ai芯片和集成ai模块的soc芯片为主。
图1．系统厂商蜂拥做芯片
互联网厂商如阿里、百度和腾讯。阿里平头哥2018年成立后，2019年7、8、9月接连推出risc－v处理器、soc开发平台和ai云端推理芯片。百度在2018年7月推出云端ai训练和推理芯片后，2019年12月宣布将通过三星在2020年初量产。腾讯的参股公司燧原科技2019年12月发布云端ai训练芯片，将在腾讯云热启动。
手机厂商如小米、vivo和oppo。手机厂商除华为、苹果、三星较早开始自研芯片外，小米在2017年发布澎湃s1 soc芯片。2019年，vivo在11月发布联合三星开发的5g soc芯片，oppo预计明年发布协处理器m1。
电视厂商如创维、海信。2018年创维就发布了两款ai画质增强芯片，蜂鸟和变色龙。2019年，海信在7月成立青岛信芯，开展电视soc和ai芯片研发。
这个现象，从晶圆制造厂的客户构成可以得到印证。根据mentor和ic insights的统计数据，2012年，系统厂商在晶圆厂的营收占比仅为2％，到2018年这个比例达到17％。近5年复合增长率达到70％，同期fabless为6％，idm厂为9％。可见，越来越多的系统厂商进入自研芯片市场。
图2．晶圆厂营收构成
01
“系统＋算法＋软件＋芯片”
出现系统厂商做芯片的现象，我们认为主要是因为当前理想的智能化需要针对特定场景，设计ai系统、算法和软件，再根据算法特点设计加速芯片。即“系统＋算法＋软件＋芯片”的集成式优化，是实现高质量的ai应用的有效手段。
ai算法的泛化能力不足。
目前，ai算法需要依赖于应用场景，即研发人员需要根据各种边界条件确定来优化算法性能。如果更换一个场景，算法需要再调整。ai算法的泛化能力弱，导致只能实现定制化智能，限制了不同场景更大范围推广。
同时，ai算法是数据驱动的，特定场景需要大量的数据，在实际应用中还需要数据和算法的持续迭代优化，这个过程对技术、成本和运维要求较高。
ai芯片的优化依赖于与ai算法的协同优化。
目前，ai芯片开发需要软硬件协同优化基本是业界共识。早期，算法和硬件以单独优化为主。2009－2014年优化计算引擎，提高并行度；2014－2016年开始，随着模型规模方法，开始优化存储系统，但是，性能基本达到单独优化的极限。
理想的软硬件协同优化需要一种能够同时描述软件与硬件的语言，能够自动的实现功能划分，哪些在软件上运行，哪些在硬件上运行。但是，目前的系统复杂，功能划分多样，一般很难实现。
为实现一定程度的软硬件协同优化，有一些折衷的技术出现。如在芯片开发初期，可以通过arm＋nvdla搭建一个简单的soc虚拟原型，运行操作系统和nvdla的inference实例，这允许软件开发人员运行ai算法。这个soc原型成为软硬件开发的接口，通过软件工程师的反馈，硬件设计人员可以优化芯片架构和细节。
所以从技术链条看，场景产生数据，数据决定算法模型，算法模型决定芯片架构。因而，理想的智能化是定制化的。
这就容易理解为什么系统厂商纷纷入局，开发面向自己产品的ai芯片或＋ai soc芯片。同时，也有类似地平线这样开始做芯片的公司延伸做解决方案，也有云知声这样做ai平台的公司开始做芯片，都是为了打通“系统＋算法＋软件＋芯片”的集成优化链条。
02
瓶颈在哪里？
未来，智能化需要向更多场景，更多设备扩散。
云端智能的瓶颈在算法。
目前，主要的云服务厂商都推出了自己的ai推理芯片，如亚马逊的inferentia，阿里的含光800，微软的brainwave，谷歌的tpu，腾讯的燧源（来自参股公司），华为的昇腾910等。除微软的brainwave采用fpga外，其他厂商都是asic芯片。asic芯片是针对特定应用的专用芯片，例如谷歌的tpu针对语音识别、图像识别和搜索应用做了优化，阿里平头哥的含光800针对语音识别、机器视觉、决策智能做了优化。
虽然asic芯片开发难度大，成本高，周期一般1－2年，失败概率大。但是随着算法的升级，云服务厂商有足够动力、财力和能力升级芯片。
因而，云端智能的瓶颈还是算法，无论是云服务厂商，还是使用ai云服务的下游厂商，优化自身算法、系统和服务都是核心。
终端智能的瓶颈在芯片。
虽然算法也是核心之一，但高成本的芯片研发费用，限制了众多有限智能场景的推广。
终端应用要求低功耗，算力优先的ai芯片一般选择使用先进制程。例如手机＋ai soc芯片都采用最先进的7nm工艺制造，特斯拉的车用ai芯片采用14nm工艺制造。
制程越先进，设计成本越高。芯片设计成本构成一般包括eda软件、ip采购、芯片验证与流片、相关硬件和人力成本等。ibs数据显示，22nm制程之后每代技术设计成本增加均超过50％。设计一颗28nm soc芯片成本约为5000万美元，而7nm则需要3亿美元，3nm的设计成本可能达到15亿美元。
图3．先进制程下芯片设计成本大幅升级
数据来源：international business strategies
03
如何降低芯片成本？
目前有三个技术在朝着降低终端产品芯片成本的方向发展，分别是开源指令集、先进封装＋chiplet模式和全自动eda技术。
1、开源指令集
risc－v是一种简单、开源的精简指令集架构，于2010年主要由美国加州大学伯克利分校的团队发明。发明的初衷之一就是规避商业指令集（arm、x86等）高昂的专利和授权费用，同时采用模块化设计，降低芯片设计门槛和开发时间。
risc－v发展迅速。2015年成立等risc－v基金会，目前包括108家会员单位，其中白金会员18家，普通会员90家，并且会员数量在持续高速增长。其中，多家中国大中型企业级科研机构也加入了基金会，如中兴、华为、杭州中天、中科院计算所等。
我国力推risc－v指令集。2018年9月，中国risc－v产业联盟在上海成立，吸引了芯原控股、芯来科技、杭州中天微、北京君正等多家单位加入。同年11月，中国开放指令生态联盟成立，发起单位包括中科院计算所、北京大学、阿里－中天微、百度、中芯国际等近20家研究机构和企业，旨在构建指令集、架构、芯片、软件、整机应用等risc－v产业链。
近两年，risc－v生态逐步完善，芯片种类越发丰富。以国内创企芯来科技为例，公司目前可以提供对标arm m0－a55芯片的risc－v mcu ip，面向边缘计算、安全、存储等多种场景。在性能可比的情况下，相对arm芯片可以节约30％－50％成本。同时，阿里平头哥也在2019年7月推出了risc－v处理器玄铁910，还有北京君正、晶心科技等都有类似产品推出。
图4．芯来科技产品线
芯来科技官网
ai芯片方面，也有risc－v芯片上市。2018年9月，华米科技推出了基于risc－v的＋ai soc芯片黄山1号。2019年6月，该芯片已经在华米智能手表上量产。ai模块负责实现心脏生物特征识别引擎、心律异常监测引擎等功能。
risc－v模块化的设计可以缩短芯片开发周期，开源生态可以降低开发成本，可以预见，未来risc－v芯片必将在边缘计算和终端智能领域发会更大作用。
2、先进封装＋chiplet模式
终端智能一般以＋ai soc芯片形式出现，集成了mcu、ai加速模块、存储、i／o等。目前，英特尔、台积电等多企业开始在推广chiplet模式，有望使soc芯片开发成本降低、开发时间缩短、开发风险降低。
chiplet，直译为小芯片或芯粒，是一类满足特定功能的die。chiplet模式是通过die－to－die内部互联技术将多个模块芯片与底层基础芯片封装在一起，构成多功能的异构system in packages芯片。
图5． chiplet芯片相对单片soc和基于pcb的集成技术的优缺点
数据来源：semico research，华夏幸福产业研究院
chiplet模式的玩家致力于构建一个生态，这里有一个丰富的chiplet库可供选择，这些die既可以是逻辑，也可以是模拟的，可以来自不同工艺制程；集成商根据需求设计芯片架构，自由选择chiplet芯片交给制造商进行制造和封装，快速低成本的实现soc芯片的产出。
发展chiplet模式面临多种技术挑战。如die－to－die的数据互联标准问题，目前来自英特尔的aib标准已经免费开放，以支持chiplet生态系统建设，包括设计方法或服务供应商、代工厂、封装厂和系统供应商。另外，封装技术、芯片测试技术和开发工具问题，还需要进一步完善。更详细的内容，可以查看作者的文章《像搭积木一样造芯片？》。
目前，英特尔、台积电已经推出了自己的chiplet芯片，还有相关创企已经开始chiplet模式的实践。相信，chiplet模式定会催生新的商业模式和新的产业增长点。
值得一提的是，ai芯片非常适用于chiplet模式。因为在现有算法框架下，ai芯片专做ai加速，在chiplet模式下，可以与cpu、存储、传感、数模转换等芯片共存，不同工艺实现很好的兼容，同时更好优化成本。
3、全自动eda技术
如果把芯片设计和程序开发类比，芯片设计的自动化水平是很低的。
程序开发通常可以使用统一的编译器，实现高级编程语言与底层机器码的转换。但是，芯片设计中的版图设计（layout）通常需要人工实现，虽然有eda工具可以部分辅助人工绘制版图，但这个过程依然非常耗时，需要较深专业技能和大量经验来实现。
同时，程序开发中通常由很多开源程序包可以使用，如python、r语言，非常节省开发时间。但是，芯片开发领域，设计复用非常少，因为目前尚没有通用的电路标准格式。
美国darpa从2017年开始推动的两个eda项目旨在解决上面的问题。
idea （intelligent design of electronic assets）项目旨在实现一个全自动芯片版图生成器，使具有有限电子设计专业知识的用户，能够在24小时内完成电子硬件的物理设计。
posh（posh open source hardware）项目旨在发展可持续的开源硬件生态，以及相应的验证工具，同时提供一个开源硬件基础模组库，让大家可以自由调用模组库里的模块，避免重复设计问题。
同时，业界积极推进的eda＋ai技术，目前已经处于主动推荐阶段，未来几年有望进入全自动化阶段，即基于系统需求，自动实现芯片设计、封装和电路板的自动化设计。值得一提的是，这个阶段需要上述两个项目的支持。
图6． ai赋能eda技术路线图
结语
何时能实现全面智能化？也许是，当设计芯片像开发程序一样简单，制造芯片像搭积木一样灵活的时候。
当下，新冠肺炎疫情仍在持续。种种隔离之下，整个社会对智能化产品、云端应用的需求从未有这样迫切。毫无疑问，这场终将散去的瘟疫将会大大加速智能社会、数字社会的进程，激发终端智能的需求。
技术已经路上，我们期待全面智能化的到来！

系统厂商为何蜂拥做芯片？

VIP推荐