全球十大半导体公司中的国内首款大算力存算一体AI芯片上车了

  • 2025-05-30 13:03
  • 0

在美国硅谷的辉煌历史中,惠普、苹果、亚马逊和谷歌等科技巨头都有着起家之地。同样,在中国的沙县小吃街上,国内首款大算力存算一体AI芯片也悄然诞生,它与这块街区的情谊颇为深厚。在这里,一位创始人兼CEO,吴强回忆说,他和伙伴们曾在热气腾腾的馄饨面前讨论未来的机器人,他们梦想中的世界里,每个人都能拥有智能助手。

那天之后,他们决定将这个愿望转化为现实,并开始了两年的研发工作。这项工作最终成果是鸿途H30,这是一款基于存算一体架构的大算力AI芯片,其物理算力达到256TOPS,只需35W功耗,是传统方案的7倍以上性能提升。

后摩智能联合创始人兼研发副总裁陈亮解释道:“存算一体架构结合了计算和存储,将其融合为一个单元,使得整个系统更加接近人类大脑,从而提高了效率。”他们选择这种创新底层架构来实现AI计算效率的极致突破。

此外,鸿途H30采用12nm工艺制程,在Int8数据精度下实现高达256TOPS物理算力,同时功耗低于35W。它还具有高计算效率、低延时以及对工艺依赖性较低等特点。在实际测试中,该芯片表现出色,无论是在Batch Size为1还是8的情况下,都能提供8700帧/秒到10300帧/秒级别的性能。

雷峰网了解到,这款芯片不仅支持L2+级自动驾驶,还能支持更高级别L4级无人驾驶。这意味着后摩智能正在推动汽车行业向前迈进,为万物智能时代做准备。

然而,有疑问浮现:为什么先攻汽车市场?吴强笑话说,“其他赛道太卷,但其实真正原因是智能驾驶领域空间很大,而万物智能时代不可能没有无人驾驶。”张永伟则指出,随着技术不断发展,这个市场仍处于快速扩展阶段,为新技术和企业提供了巨大的机会。

后摩智能通过专门设计IPU——天枢架构,以多核、多硬件线程方式来扩展计算能力,不仅保证通用性,还能够在核内完成端到端处理。据陈亮介绍,该设计灵感来自中国庭院式住宅,大布局保障资源利用,同时借鉴现代住宅多层、高层设计优势以灵活扩展算力。此外,它可以在保持性能同时减少50%功耗。

该公司还推出了名为“力的驭”的硬件平台,该平台CPU可达200 Kdmips,AI可达256Tops,并且只需85W功耗。为了让客户获得更好的产品使用体验,他们自主开发了一套软件开发工具链——“后摩大道”,支持PyTorch, TensorFlow 和 ONNX 等开源框架,以及CUDA 前端语法及SIMD/SIMT编程模型,以确保通用性并优化运行效率与开发效率。

未来,对于这些先进技术来说,最重要的是易用性。易用性的一个体现就是针对AI模型进行优化。而对于用户而言,则需要考虑如何将这些复杂技术应用到日常生活中,以便使其成为不可或缺的一部分。此外,由于第二代天璇架构已经进入研发阶段,将进一步提升整体性能与灵活性,并支持更多场景应用,如成本敏感型设备、大模型等场景。而第三代天玑结构已开始规划,将打造万物互联智慧社会环境。

猜你喜欢