中电网移动|移动中电网|高清图滚动区

国产GPU开发门槛降低:摩尔线程开源 TileLang-MUSA 工具,代码量减少 90%

2月10日,摩尔线程对外宣布,已正式开源TileLang-MUSA项目,实现对TileLang编程语言的完整支持。该项目已成功在摩尔线程多代全功能GPU上完成功能验证与特性开发,旨在通过高层抽象与编译器优化,大幅降低开发门槛,为国产算力平台提供更高效的AI与高性能计算开发体验。

重新定义GPU算子编程的语言

TileLang是一款基于张量分块(Tiling)抽象的高性能AI算子编程语言,属于领域特定语言(DSL)。它采用声明式语法与类Python前端,使开发者能够以接近数学公式的形式描述计算意图,并由编译器自动完成循环优化、内存调度与代码生成,在保持底层性能的同时大幅降低GPU及异构计算平台的编程复杂度。

在实际应用中,TileLang通过三大核心作用显著提升GPU计算的开发效率:通过高级抽象降低开发门槛,开发者无需深入底层硬件知识即可生成高性能代码;具备跨平台能力,实现“一次编写、多架构运行”,有效解决多元算力生态的适配难题;编译器自动执行Layout推导、线程映射、Warp特化、流水线排布、内存优化等复杂任务,在保障性能的同时提升开发效率。

目前,TileLang已广泛应用于多个关键领域,例如:在AI与机器学习中,研究人员可用其快速定义新型算子(如注意力机制);在科学计算中,可便捷移植大型数值模拟程序至不同硬件平台;对硬件厂商而言,TileLang可作为构建芯片软件生态的基础工具链。

在产业实践中,DeepSeek-V3的研发已采用TileLang进行算子快速原型设计与性能验证,证明了其在大规模模型训练中的实战价值。摩尔线程开源的TileLang-MUSA项目,正是这一技术理念的产业落地——通过提供高效开发工具链降低创新门槛,推动国产算力应用生态的繁荣发展。

TileLang-MUSA连接前沿语法与国产算力的桥梁

摩尔线程此次开源的 TileLang-MUSA项目,旨在充分释放全功能GPU的性能潜力。它提供了一种介于底层汇编与高层DSL之间的“中间层”抽象,在保留硬件控制力的同时,显著降低了编程复杂度。具体特性如下:广泛的硬件架构覆盖:TileLang-MUSA已在摩尔线程多代全功能GPU上完成功能验证与打通,包括训推一体全功能智算卡 MTT S5000和MTT S4000,展现了良好的硬件兼容性。核心计算特性的深度映射:项目团队实现了TileLang高层语义到摩尔线程GPU底层MUSA架构的精准映射。

目前,基于MUSA架构的TileLang原生算子单元测试覆盖率已超过80%,为大规模应用提供了可靠保障。

从实测效果看,TileLang-MUSA“让开发者写得快且跑得快”的设计理念已经得到一定程度实现。以在摩尔线程MTT S5000上的测试结果为例:可实现开发效率倍增的同时性能媲美手写,相较手写MUSA C++代码,使用TileLang-MUSA的代码量减少了约90%,且代码逻辑更加清晰,极大降低了开发与维护成本。

展望:打造基于MUSA的深度学习统一平台

TileLang-MUSA的开源是摩尔线程构建国产算力生态的关键一步。以此为起点,摩尔线程将持续推进平台与生态建设,致力于打造一个覆盖从单算子到完整大模型的国产算力统一加速平台:持续进行性能优化,开发更多MUSA架构定制扩展,使生成代码性能稳定达到手写优化版本的90%以上;深度集成SGLang等主流AI框架,实现训练与推理场景的端到端无缝加速;从单算子优化延伸至Transformer、MoE等复杂模型架构的跨算子调度与全局优化;同时完善调试和性能分析工具链,为开发者提供全流程支持。

摩尔线程相关负责人展望,种种举措,最终都将汇聚于一个核心目标:构建一个开放、高效、充满生命力的国产算力生态。

TileLang-MUSA 开源地址:https://github.com/MooreThreads/tilelang_musa

猜你喜欢
中电网移动|移动中电网|频道导航区