中电网移动|移动中电网|高清图滚动区

拥抱混合云与AI大模型,速石科技“新一代融合智算研发平台”全面助力中国芯片发展

作者: 付斌

EDA上云是近几年大趋势。你我都知道,芯片行业很卷,产品迭代速度越来越快,一些大公司也许不发愁算力、运维、交付周期等问题,但对有些芯片设计公司来说,也许本就研发人力不足,这些只会让芯片产品上市速度大大降低,同时耗费大量时间和金钱。而仿真验证的上云可以有效提速,一定程度上缓解研发的紧张运力。

从当前行业来看,不论是云上EDA,还是本地EDA,都在面临更多挑战。比如,新的工业设计与制造需求正在变革,先进半导体设计与工业制造系统级设计加速融合。再比如,AI一夜爆火,不光要开展更多关于AI方面的工作,EDA本身也在利用AI提升自身效率。

在12月11~12日举办的上海集成电路2024年度产业发展论坛暨第三十届集成电路设计业展览会(ICCAD-Expo 2024)媒体采访环节,速石信息首席技术官张大成便分享了关于云仿真、AI以及系统级设计方面的趋势,并介绍了该公司新一代融合智算研发平台的价值所在。

 

云仿真的现状:混合云模式诞生

张大成分享了一组客户的真实数据,2021年~2022年时间段是IC设计公司上云最频繁的时间段,但自此之后,整体经济下行,客户的投入成本预算发生了变化。他坦言,不得不说,在整体经济环境并不是特别好的今天,大家对于云平台的接受程度并没有云计算刚兴起时那样炙热。

对于上述现状,张大成表示,虽然如今的IC设计企业数量并没有预期那么多,但这些企业对于EDA的高精度要求从来没有发生变化。对创新型IC设计企业来说,他们在研发方面需要耗费巨大的精力,更为倾向于使用整套解决方案,帮助其解决基础架构问题。

到现在,云EDA模式,几乎已经成了刚需。许多芯片设计企业认识到,尽管本地建设是必要的,但单机仿真能力已远远不能满足当前的需求,特别是在汽车电子、Chiplet、AI芯片、GPU芯片等领域,仿真计算链日益庞大。

很关键的是,云服务费用对企业来说,也是要核算投入的一环。比如说,当进行设计仿真等工作时,可能需要一千个核来完成两小时以上的仿真任务,在企业进行项目规划时,会被纳入项目的总投入中,并作为衡量其业绩的一个因素。若采用云模式,这通常属于Capex(资本支出)模式,意味着需要提前预算并预测项目所需投入的资金,以承担云服务的费用。

因此,现在越来越多的企业开始构建本地平台,也与云的预算模式和自身的经济收入产生了联系。这种需求促使了一个新的模式——“混合云模式”的诞生。

速石科技本身拥有“云平台环境构建”及“本地化平台构建”的双重能力,可以帮助IC设计企业解决投资研发平台建设的成本的问题。“我们考虑的是,是否可以在本地设计团队工作的过程中,动态地获取所需资源。幸运的是,我们的产品已经具备了这一功能,与国内各大公有云厂商以及私有云实现了打通。“张大成表示,这意味着客户可以随时随地在云上两分钟内开启两百台机器,这些机器可以是128核的大型机型,也可以是2核的小型机型,完全可以根据业务需求动态开启和计算,最终数据会安全地存储回我们本地的存储系统中。

此外,速石科技拥有自己的核心产品能力——Fsched调度器,它已在国内数百家客户企业中得到了验证和实践。“我们可以自豪地说,Fsched调度器已经完全能够替代国际知名品牌的RDM IOSM产品。这是我们坚持自主研发、自主可控四到五年的成果,也是我们在国内大规模客户验证下的骄傲。”

对于未来的云EDA模式,张大成认为,更多会去解决突发的业务场景或者紧急的业务场景,紧急拉起这样一个环境,最终结束后可以将这些东西回馈到其他产品中。

AI趋势下的EDA:大幅提升仿真效率

在利用AI智能调度资源方面,速石科技走在了行业前列。张大成介绍道,在其最新的产品序列中,开发了一个专为EDA工具设计的新功能,这个功能是一个AI大模型,它专门训练于EDA设计公司自身的产品。

这个AI模型能够解决两个问题。第一,在工程师使用数字工具、模拟工具以及视频工具过程中,通常需要分配计算资源来完成仿真任务,但工程师和设计师往往难以准确预估所需资源量。他们通常只知道自己需要完成哪种类型的仿真,并期望得到一个符合预期的报告,但对于所需的具体资源量却一无所知。

第二,不同类型的仿真任务(如电源的小磁颤振测试与SOC的回归验证)对计算资源(如CPU、GPU、内存、磁盘等)的需求截然不同。因此,企业需要更加自动化、智能化的系统来帮助他们结合EDA工具提升研发效率。

为了解决上述问题,速石科技开发了自主训练的AI模型,并与EDA工具紧密结合。这个模型能够学习历史仿真任务和作业特性、任务特性以及产品类型的数据,并编译成专属的模型。当模型应用到研发平台时,能够从设计源头开始,为工程师提供精准的仿真资源建议。这意味着,工程师在进行仿真时,无需再关心需要多少机器资源、多少CPU或多少核可用。

此外,从底层管理角度来看,速石科技还增加了异构资源的管理功能,如GPU卡等,结合服务器和速石科技的国产调度器,提供完整的解决方案。在这个解决方案中,AI与EDA工具和业务属性紧密结合,共同推动研发效率的提升。

值得一提的是,这一创新举措依赖于速石自研核心调度器Fsched,其强大的资源调度和任务监控功能不仅显著提高了任务运行效率,还确保了设计结果的快速准确获取,让资源配置更加灵活高效,进一步提升了设计仿真工作的整体效率。

 

在AI模型开发方面,平台提供了面向GPU集群的自动配置生命周期管理,以及针对机器学习负载的MLOps调度策略配置,为AI模型的训练与部署提供了强有力的支持。此外,平台还支持LLM的训练数据流管理,包括数据权限分级、可视化、版本管理、清洗、标注等功能,为企业AI模型的广泛应用奠定了坚实基础。

芯片设计的变化:走向系统级设计

随着半导体产业急速发展,芯片设计正在从模块化设计,走向芯片系统设计。此时,对于EDA行业便提出了更高的要求。

张大成指出,从芯片设计研发平台的角度观察芯片设计研发应用的工作留存与发展,他们发现EDA应用和CAE应用正逐渐融合。这种融合给研发用户带来的操作系统层面的变化是,不仅要熟悉EDA工具的操作流程,还要从结构、电磁等多个角度围绕芯片的整个架构进行验证和仿真。

以芯片中某些模块的设计为例,这些设计可能涉及芯片内部的子模块,同时还需要考虑SoC和Chiplet叠加的2.5D、3D堆叠封装技术。这种情况下,电路中的电磁特性、结构完整性、电源完整性以及功耗完整性等都会成为需要考虑的因素,并涉及一系列CEE。传统的EDA工程师,大多可能是数字设计师或模拟设计师,他们可能对这些结构和电磁的流程不太熟悉。

张大成对此表示,今年,Snowflake收购了Streamlit,Cadence也收购了BETA CAE,其实这反映了从单一工具向系统化解决方案的发展趋势。

速石科技正是在其融合平台上进行了重新整合,使得用户无论是进行芯片的结构仿真、电磁仿真、电源仿真,还是芯片的设计和前后端仿真,都可以一体化完成。“这是我们观察到的大趋势,也是我们能够帮助企业客户提供的全面解决方案的方向。”张大成如是说。

本届ICCAD上,速石科技发布的新一代融合智算研发平台可深度支持复杂的芯片应用场景和高标准的芯片设计要求,融合芯片模块设计、系统级SoC/Chiplet设计、电气特性仿真、多物理场/电磁/热仿真以及机械结构仿真等全仿真流程,为芯片设计企业、IDM、军工半导体企业、高级封装测试企业等多种类型的行业用户提供全方位、一站式的解决方案。

通过标准化的工具适配集成和自定义融合Flow定义技术,平台成功实现了多种EDA/CAE联合设计仿真需求场景的标准化适配,并统一用户接入体验,实现了基础资源、数据资源、软件资源的统一管理,极大地提升了设计效率与准确性。

值得一提的是,前阵子,速石科技还宣布与硬件仿真领域巨头Altair合作,共同打造面向企业级用户的一体化芯片综合研发平台。该平台依托速石科技为EDA应用优化的一站式研发平台和Altair Hero卓越的硬仿资源调度管理能力,实现了软件仿真技术与硬件仿真资源的无缝集成与高效利用。经测算,企业软仿效率轻松提升30%以上,硬仿效率可从原先手动调度的20%~30%大幅提升至60%以上,带来百万级别的成本节约。

国产自主可控背景下:坚持半导体这条路

对于国产可控这一大话题,张大成表示,今年见证了众多关于国产化自主可控的会议,特别是龙芯架构这一完全自主可控的CPU生态体系的建设。同时,国家也在积极推动高职院校的集成电路人才培养,这显示了国家对这一领域的坚定决心。基于此,有理由预测,未来三到五年内,除了985、211高校,还将有大量集成电路人才涌现。

今年是速石科技第三次参加ICCAD。速石科技自2017年成立以来,起初并未明确专注于半导体领域,但在运营一年后,发现产品与半导体领域高度契合,因此便一直沿着这条路发展,至今已有七八年时间。在这个过程中,深刻感受到了行业的波动与挑战。

“我们将持续提升服务IC设计、优化用户EDA研发体验、提高研发设计效率作为的根本宗旨。为此,我们在产品上不断发力,无论是调度器产品、资源管理、混合云架构,还是对未来国产化的趋势以及新型产品类型的适配,我们都将全力以赴。”张大成这样总结道。

猜你喜欢
中电网移动|移动中电网|频道导航区