在美国硅谷的辉煌历史中,惠普、苹果、亚马逊和谷歌等科技巨头都有着起家之地。同样,在中国的沙县小吃街上,国内首款大算力存算一体AI芯片也悄然诞生,它与这块街区之间的联系颇为神秘。
记得有一次,一群朋友聚集在热闹的小吃店里,他们边享受着香气四溢的小吃,边激烈讨论着未来的技术革新。有人梦想无人驾驶汽车,有人渴望机器人的陪伴,而吴强,则向往一种能陪伴他母亲的机器人,这种心愿背后,是对实现万物智能的渴望。他所创立的后摩智能,就是为了这一目标而生的。
经过两年的不懈努力,后摩智能终于推出了国内首款大算力存算一体智驾芯片鸿途H30,它拥有256TOPS最高物理算力,并且功耗仅35W。这款芯片已经被用于合作伙伴的无人小车上,将于6月份开始送测给Alpha客户。
存算一体,从字面理解,就是将计算和存储融为一体,这是一种更接近人类思维方式的计算方式,其效率远高于传统架构。在学术界,这种架构早已研究多年,现在它成为了解决AI存储墙问题的一剂良药。不过,不同类型的人工智能处理器,也会有不同的设计和优化策略。
鸿途H30采用数字存算一体架构,以SRAM作为核心数据缓冲区,对于Int8精度下的性能表现尤其出色,其IPU能效比达到了15Tops/W,比传统架构提升了7倍以上。在这个时代,当硬件瓶颈愈发明显时,如Moores定律放缓带来的挑战,这样的技术突破变得至关重要。
除了性能上的突破,鸿途H30还有其他六大技术创新点:包括大算力、高精度、低功耗、车规级标准、可量产以及通用性。为什么选择汽车市场?吴强笑言:“别说赛道卷,我首选就是因为别赛道卷。”但实际原因是,他看到智能驾驶领域蕴含巨大的发展潜力,以及未来无人驾驶将成为必备设施之一。
中国电动汽车百人会副理事长张永伟表示:“智能驾驶市场规模庞大,但仍处于加速阶段,为新技术、新企业提供了广阔空间。”这种创新对于工艺制程依赖度低,更具有竞争力的优势。而且,与终极目标相符的是,无限接近自然行走效率——这是吴强团队追求的大目标。
基于此,他们开发了一套专用的IPU(处理器架构)——天枢架构,以多核多线程扩展计算能力,使得AI可以端到端完成处理,同时保证通用性。此外,还推出了一个名为“后摩大道”的软件开发工具链支持PyTorch/TensorFlow/ONNX等主流开源框架,让用户更加方便地进行模型优化和编程工作。
随着产品不断完善,即将推出的第二代天璇架构预计还会进一步提升性能及灵活性,而第三代天玑计划则是为了万物智能世界而打造。但在这样的创新道路上,有些声音提醒我们要保持谨慎,因为这涉及到整个行业结构和应用场景的问题。不管怎样,只有时间能够证明这些先进技术是否能够真正改变我们的生活。