国内首款大算力存算一体AI芯片犹如神秘的宝石闪耀着前沿科技的光芒它究竟长什么样子细看之下便是集百家智

在美国硅谷的辉煌历史中,车库成为了创新的摇篮,而中国的沙县小吃同样孕育了国内首款大算力存算一体AI芯片。就在沙县的小吃店里,后摩智能的创始人吴强和他的团队,在热气腾腾的馄饨面前激烈讨论着未来AI芯片的可能性,他们梦想着能够实现万物智能。

那场讨论之后,便有了后摩智能,并且他们基于创新的存算一体架构,在两年的努力后,于本周正式发布了国内首款大算力存算一体智驾芯片鸿途H30,它拥有最高物理算力256TOPS,典型功耗35W。这款芯片将用于无人驾驶汽车上,并将于6月份开始对Alpha客户进行送测。

鸿途H30采用的是数字存算一体架构,以SRAM为基础,有极低访存功耗和超高计算密度。在Int8数据精度下,其AI核心IPU能效比达到了15Tops/W,这是传统架构芯片的7倍以上。它基于12nm工艺制程,在Int8数据精度下实现高达256TOPS的物理算力,同时能效比达到7.3Tops/W。

这款芯片不仅具有高计算效率、低计算延时、低工艺依赖等特点,而且还通过Resnet 50模型性能测试显示,在Batch Size等于1和8的情况下分别达到8700帧/秒和10300帧/秒。这种定义一个超过100T的大算力的原因在于,这种级别可以支持L2+级自动驾驶,也可以支持L4级。此外,还会根据不同场景推出几个系列产品,使其更加适应市场需求。

为什么选择先攻汽车市场?吴强表示,因为智能驾驶虽然是一个竞争激烈的领域,但空间巨大,是实现万物智能不可或缺的一环。而中国电动汽车百人会副理事长兼秘书长张永伟也认为,智能驾驶市场规模庞大,对新技术和新企业提供了巨大的机遇。

为了更好地服务这个市场,后摩智能设计了一种专用的IPU——天枢架构,它采用多核、多硬件线程方式扩展算力,从而实现计算效率与灵活性之间完美平衡。此外,该公司还推出了名为“后摩大道”的软件开发工具链,以确保用户获得最佳使用体验。此工具链支持PyTorch、TensorFlow 和 ONNX 等主流开源框架,为用户提供编程兼容CUDA 前端语法以及SIMD 和 SIMT 编程模型,使得运行效率与开发效率都得到优化。

未来的计划包括第二代天璇架构已经在研发中,将采用Mesh互联结构以满足更多应用场景,以及第三代天玑架构正在规划阶段,将为万物智能做准备。此外,一款名为鸿途H50 的新型号已经开始研发,将于2024年推出,并计划支持2025年的量产车型。

猜你喜欢