5月3日下午,AI领域最强独角兽寒武纪科技(Cambricon)在上海举办新品发布会,会上寒武纪正式发布了首款云端AI处理器等多款重磅新品,标志着国产AI芯片发展取得新突破,国产集成电路AI芯片的发展进度不仅没有被世界第一梯队落下,还隐隐有领头的趋势。
发布会上,寒武科技发布了第三代IP产品“寒武纪1M”,这是全球首个采用台积电7nm工艺制造,能耗比达到5Tops/W,即每瓦特5万亿次运算,并提供2Tops、4Tops、8Tops三种规模的处理器核,能满足不同场景、不同量级的AI处理需求,并支持多核互联。
寒武纪1M处理器延续了前两代IP产品寒武纪1H/1A卓越的完备性,单个处理器核即可支持CNN、RNN、SOM等多样化的深度学习模型,更进一步支持SVM、k-NN、k-Means、决策树等经典机器学习算法,支持本地训练,为视觉、语音、自然语言处理以及各类经典的机器学习任务提供灵活高效的计算平台,可广泛应用于智能手机、智能音箱、智能摄像头、智能驾驶等领域。
寒武纪科技今天发布的第二款重磅产品,是面向云端机器学习推断任务的“寒武纪MLU100”,采用寒武纪最新的MLUv01架构,1GHz主频平衡模式下等效理论峰值速度达每秒128万亿次定点运算,1.3GHz高性能模式下更可达每秒166.4万亿次定点运算。但是同时,典型板级功耗仅为80瓦,峰值功耗不超过110瓦。
至于首款云端智能芯片的性能到底有多强,寒武纪科技CEO陈天石在发布会现场公布了在R-CNN算法下MLU100与NVIDIA的Tesla V100和Tesla P4的计算延迟对比,数据显示MLU100的计算延迟为125ms,Tesla V100的延迟为174ms,Tesla P4的延迟为1069ms,在该项测试上MLU100竟赢了NVIDIA史上规模最大的GPU。
据介绍,MLU100云端智能芯片是寒武纪历时近2年研发的成果,也是其发展历程上全新的里程碑,标志着寒武纪已成为中国第一家(也是世界上少数几家)同时拥有终端和云端智能处理器产品的商业公司。
除此以外,寒武纪科技在合作伙伴方面也取得了诸多重大进展。
联想在发布会上宣布了国内首款搭载寒武纪MLU100智能处理卡的服务器平台Thinksystem SR650,打破了37项服务器基准测试的世界记录。
中科曙光发布了全球首款基于寒武纪MLU的云端服务器PHANERON系列,以及人工智能管理平台SothisAI,可以与寒武纪芯片及其开发环境实现无缝对接、深度融合。
科大讯飞则披露了与寒武纪芯片的深度合作研发项目,尤其是披露根据最新的测试结果,寒武纪智能处理器在语音智能处理上,能耗比领先竞争对手的云端GPU方案超过5倍,可使语音本地识别准确率相对传统处理器加速9.8%。
国产AI芯片商业化的脚步比大家想象的都要快,抛开其他IC芯片研发不谈,至少在AI芯片研究及商用上,客观的说我国已经走到了世界前列。