中关村元坤智造工厂,注册立享优惠!

国内专业的IC销售商
北京耐芯威科技有限公司
Beijing NaiXinWei Technology Co., Ltd.

产品与服务

算法技术持续加速演进 “与时俱进”成AI“芯”制胜关键

 

算法技术的持续加速演进,令如今的AI芯片产业涌现出越来越多的“软硬件不同步”问题。毕竟,开发周期长一直以来都是整个芯片产业的共性,业内预估在不出问题的情况下,通常一款AI芯片从立项到量产需要耗费2到3年的时间。相比之下,随着软件算法技术的渐趋轻量化,如今AI算法也呈现出近乎每几个月一刷新的趋势。至此,硬件架构究竟该如何“与时俱进”,与算法更新保持动态同步,提高整体性价比和市场竞争力,也成为了当下各AI芯片厂商无法规避且亟待解决的难题。
自AI芯片概念诞生之日起,如何跟进软件算法的演进一直都是困顿行业的大难题。尽管过去市场上很多传统芯片从峰值性能来看的确可以达到非常高的水平,但实际上在运行比较先进的新生算法时,芯片上的器件利用率却很低,犹如“大马拉小车”,归根结底就是芯片架构设计缺陷所致。如今,AI算法演进仍在不断加速,并呈现出各式各样、层出不穷的态势。这种形势下,业内厂商已无法只针对一种算法找到最优的芯片架构,这也是为何当下越来越多有实力背景的AI芯片设计公司开始投入大量算法工程师、提升对未来算法发展趋势预判性的重要原因。
对AI芯片来说,软件算法非常重要,没有软件算法可以说就没有AI芯片,OURS创始人兼CEO谭章熹曾强调:“芯片设计完成后,需要不停的更新软件及算法,其中,99%的工作是软件、开发工具SDK,我们需要不断的做训练。而且,算法发展的速度已越来越快,几乎每6个月内就会出现新的算法。因此,当开发一款芯片时,我们要考虑到硬件是否能够适用未来6个月的算法,这一点非常重要。”
当前,业界对于AI芯片的性能衡量还存在一个很大的误区,往往会把峰值算力当作衡量AI芯片性能的主要指标,地平线联合创始人兼副总裁黄畅博士认为:“我们真正需要的是有效算力,及其输出的算法性能。这需要从四个维度来衡量,即每瓦的峰值算力和每美元的峰值算力(由芯片架构、前后端设计和芯片工艺共同决定)、峰值算力的有效利用率(由算法和芯片架构决定)、以及有效算力转化为AI性能的比率(主要是速度和精度两个方面,由算法决定)。之前,业界普遍采用的是Resnet这样的算法模型,但是今天我们采用类似MobileNet这样更加精巧设计的小模型,可以用1/10的算力达到相同的精度和速度。但是,这些精巧设计的算法也给计算架构带来了挑战,往往使得传统设计的计算架构的有效利用率大幅下降,从最终的AI性能角度来说,甚至得不偿失。”
因此,黄畅表示:“在针对一些重要的应用场景中,地平线的最大特点就是对关键算法的发展趋势进行预判,前瞻性地将其计算特点融入到计算架构的设计当中,使得AI处理器经过一两年的研发,在推出的时候仍然能够很好地适应最新的主流算法。和其他典型的AI处理器相比,地平线的AI处理器随着算法的演进趋势,始终能够保持相当高的有效利用率,从而真正意义上受益于算法创新带来的优势。”
但编者认为,这种前瞻性的算法技术预判能力需要依托于强大的技术和资金背景,因此目前来看只能是少数玩家的玩法。而对于那些沉浮于AI芯片产业的绝大多数缺乏足够资金、资源以及算法开发能力的创业型玩家来说,从硬件架构的角度去做开发和创新相对来说更为实际,譬如当下大火的RISC-V指令集,AI芯片厂商大可借助这种精简化的指令集来对芯片架构做改进和创新,依托RISC-V的灵活与可扩展优势,再辅以一些创新型的优势芯片架构,可以为AI芯片腾出更多的空间去支持和拓展新的算法和应用,满足更多AIoT场景下的碎片化需求。如此,那些不曾拥有足够实力去研究先进算法预测未来趋势的芯片公司,也具备了更强的“追新”能力。