
中昊芯英创始人兼CEO杨龚轶凡近日在接受媒体采访时透露,第二代7nm TPU芯片已回片,进入测试阶段,计划于2026年二季度正式出货。配套软件栈同步开发,持续新增PyTorch 2.x新算子与MoE并行策略支持。
杨龚轶凡表示,未来将基本维持“一年一芯、一年两栈”的产品迭代周期,以持续提升技术竞争力与市场响应速度。同时,中昊芯英与天普股份为框架性合作,各取所长共拓AI赛道。
根据网络上的爆料显示,中昊芯英第二代 TPU 芯片主要面向自动驾驶模型训练和数据中心推理,单芯片算力预计达到400-800 TFLOPS,性能目标超越谷歌TPU v5p和英伟达H100等主流产品;在能效方面,相比GPU或可降低30%以上,单位算力成本进一步优化。后续可能将通过收购的天普股份的客户渠道为车企提供高性能计算支持,将 TPU 技术集成到智能座舱域控制器和ADAS 辅助驾驶系统。不过,上述信息尚未得到官方确认。
资料显示,中昊芯英成立于2019年,主要创始团队及核心研发团队为一批来自谷歌、甲骨文、Facebook、微软、三星、海思等巨头公司经验丰富的AI软硬件设计专家。公司创始人杨龚轶凡由曾参与Google TPU v2、v3、v4 核心构架开发。公司主要产品为支撑超大规模人工智能模型训练的高性能人工智能芯片与计算集群,打造完整的软硬件一体化方案,为全球客户提供具备生产变革能力的人工智能创新技术方案,加速人工智能的工程落地与产业化进程。
TPU采用脉动阵列(systolic array)结构,将矩阵乘法/累加操作做成硬连线流水线,数据在阵列内部流动过程中完成计算,几乎省去了传统GPU需反复读写共享缓存或显存的步骤。谷歌第六代Trillium与第七代Ironwood的实测数据显示,在同等7nm工艺下,TPU的每瓦AI算力达到GPU的1.4–2.0倍;若与2018年的初代TPU相比,能效提升了近30倍。
2023年,中昊芯英成功实现了全自研的专为AI训练而生的中国首枚高性能TPU训练芯片“刹那”(Chana)的量产交付,该芯片基于12nm制程,拥有完全自主可控的 IP 核、全自研指令集与计算平台,计算性能最高可达Nvidia A100 的1.5倍,在相似的大模型负载下能耗降低30%,单位算力成本约为同类国外芯片的42%,在性能、能耗与成本三方面展现明显优势。
中昊芯英基于“刹那”还构建了“泰则”人工智能服务器和实现 1024 片芯片高效片间互联、可支撑超千亿参数大模型的训练与推理的“泰则”(Taize)大规模 AI 计算集群系统,整体算力可突破200P,可支持万亿级参数模型的训练需求。凭借其超高AI计算性能和超低能耗的优势,在2023年底获得青海“丝绸云谷”低碳算力产业园超9亿元采购订单,并且在能源、教育、制造等多个领域取得进展,实现盈利。
2024年,中昊芯英基于“刹那”打造的千卡集群“泰则”在长三角、京津冀两地区上线,实测可稳定训练千亿参数模型。2025年,天津移动TPU智算中心正式点亮,标志着国产TPU完成“单卡→整机柜→智算中心”的三级跳,开始对外提供商业化算力服务。官方数据显示,在同等精度下,其推理成本比GPU低40–60%。
今年9月,中昊芯英向天普股份发起全面要约收购,要约价格为23.98元/股,拟收购上市公司25%的股份。最终,中昊芯英创始人杨龚轶凡将通过中昊芯英和海南芯繁成为上市公司新的实际控制人。
根据天普股份公告披露,中昊芯英2024年营业收入为5.98亿元,实现净利润8891万元;但2025年上半年收入仅为1.02亿元,净亏损为1.43亿元。