1M产品:稳固端的优势。
寒武纪1M芯片是公司第三代IP产品,在TSMC7nm工艺下8位运算的效能比达5Tops/watt(每瓦5万亿次运算),功耗比再次超越了竞争对手。不仅如此,该产品支持多核互联功能,并且可以灵活选择算力(2Tops/4Tops/8Tops)。对于语音识别来说,2Tops足矣,但是对于复杂的自动驾驶任务,可能需要16Tops以上的算力。通过灵活配置1M处理器,开发者可以实现资源的最大化利用,降低功耗和成本。1M的上一代1A仅支持终端的推理,而1M还支持终端的训练。通过将训练下放在终端,开发者可以避免敏感数据的传输,而且可以实现更迅速的相应。
MLU100芯片:中国制造挑战NVIDIA云的霸权。
NVIDIA的芯片被大量运用于云端的训练场景。本次寒武纪发布的MLU100芯片,采用寒武纪最新的MLUv01架构和TSMC16nm的先进工艺,可工作在平衡模式(1GHz主频)和高性能模式(1.3GHz主频)下,平衡模式下的等效理论峰值速度达每秒128万亿次定点运算,高性能模式下的等效理论峰值速度更可达每秒166.4万亿次定点运算。根据寒武纪公布的数据,其在执行人工智能网络运算时,比NVIDIA的TeslaV100拥有更低的计算延迟,且能耗低30%。寒武纪MLU100芯片及其板卡的成功发布,标志着中国制造正式打破了美国公司在人工智能训练芯片领域的霸权,并且达到了世界领先水平的高度。
下一步,形成生态。
NVIDIA在人工智能领域已经形成了生态。其从底层硬件、中间件到上层的开发语言、调试工具都形成了一套完善的产业链。寒武纪也在这方面加速追赶。通过寒武纪的NeuWare软件工具链,开发者可以方便地进行智能应用的开发,迁移和调优。未来,寒武纪还将发布专用的人工智能编程框架,进一步挖掘寒武纪架构的潜力。我们认为,只有形成了生态,寒武纪的护城河才算建好。
中国自主可控最尖端的成就之一。
中兴通讯的事件让国人意识到了核心技术的重要性。未来毫无疑问是人工智能的时代,而人工智能芯片在其中扮演的角色不亚于目前CPU在电脑体系中的角色。只有将人工智能芯片的核心技术掌握在手中,我国才能打破国际封锁,真正跻身于世界一流国家。寒武纪本次发布的两款芯片,代表着目前世界范围内人工智能芯片端、云的最高水准,是我国自主可控最尖端的成就之一。