国内首款大算力存算一体AI芯片上车了它的制作流程精妙如织原理深邃而神秘

  • 2025-05-30 08:43
  • 0

美国硅谷的车库,曾孕育了惠普、苹果、亚马逊和谷歌等科技巨头,而中国的沙县小吃,却是国内首款大算力存算一体AI芯片诞生的秘密花园。在那间充满热气腾腾馄饨香气的小餐馆里,吴强与伙伴们激烈讨论着无人驾驶汽车和机器人的未来,他们梦想中的万物智能与AI芯片紧密相连。

随后,他们在沙县小吃的灵感下创立了后摩智能,并在两年的时间里研发了一款基于创新存算一体架构的大算力存算一体智驾芯片——鸿途H30。这个芯片拥有256TOPS的物理计算能力仅需35W功耗,是行业中极具竞争力的产品。它将于6月份开始向Alpha客户进行测试。

存算一体架构融合了计算和存储功能,就像人脑一样高效,它被认为是解决AI“存储墙”问题的一个重要方法。不过,这种架构根据不同的存储介质也有所不同。鸿途H30采用数字存算一体架构,基于SRAM技术,其能效比高达15Tops/W,比传统设计多出7倍以上。

这种技术突破尤其显著,因为在摩尔定律放缓的情况下,能效比提升至关重要。此外,该芯片还实现了12nm工艺制程,在Int8数据精度下达到256TOPS性能,同时功耗不超过35W,全SoC能效比为7.3Tops/W。这使得鸿途H30具有高计算效率、高低延时以及较低依赖工艺特点。

据称,这款大型AI芯片主要面向L2+到L4级别自动驾驶市场,并计划推出多个系列产品,以适应不同场景需求。陈亮指出,该芯片以六项技术创新突破而闻名:包括大规模计算、大精度处理、低功耗运行、符合车规标准、高生产可行性以及通用性。

然而,为何选择先攻汽车市场?吴强解释说,由于智能驾驶领域仍然有很大的发展空间,而且新技术和新企业都有机会进入。他还提到,天枢架构设计理念源自庭院式住宅,以保障资源利用效率,同时结合现代住宅多层/高层设计优势,以此来扩展灵活的硬件线路,从而实现性能提升50%同时降低50%功耗。

为了让用户更好地使用这些产品后摩智能开发了一套软件工具链——后摩大道,使得PyTorch、TensorFlow及ONNX等主流框架可以轻松兼容,同时支持SIMD和SIMT编程模型以平衡运行速度与开发速度。此外,该公司已经成功运行常用的经典CV网络,以及业界最受关注的BEV网络模型及广泛应用于辅助驾驶领域Pointpillar网络模型。

未来的规划包括第二代天璇架构,将采用Mesh互联结构,可根据应用场景配置单元数量,以提高整体性能;第三代天玑架构正在规划中,将为万物智能打造。而且,一款名为鸿途H50的大型AI处理器正在全力研发中,将于2024年推出,为量产车型提供支持。在这条道路上,无论如何,有些人持怀疑态度,但吴强及其团队坚信通过不断底层技术创新,可以实现极致效率并推动万物智能时代到来。

猜你喜欢