1991年诞生于美国硅谷的普迪飞半导体技术有限公司(PDF Solutions,下称“普迪飞半导体”)过去30年来一直专注于做一件事——帮助半导体全产业链挖掘数据价值。到目前为止,该公司的全球半导体数据库中的数据量已经超过4000 TB,相当于可以“看五百多年的电影”。
数据大爆炸席卷全球工业,成为各行各业新的“生产资料”。数字化浪潮在工业领域的渗透也是全球产业大升级的必经之路。然而在数据密集型的半导体产业,在使用大数据分析应用上却是相对落后的。现在必须快速补上这一环。
“越来越多的半导体公司,包括国内大量‘年轻’的Fabless,开始意识到数据分析的重要性。这是半导体产业从基础建设1.0时代迈向质量提升的2.0时代的关键一步。”普迪飞半导体副总裁俞冠源日前在接受集微网专访时这样指出。
“爆炸式”增长的半导体大数据如何互联?
根据IDC的统计,2019全球数据量达到42ZB,预计2022年达到163ZB,复合增速为57%。但是在这些海量数据真正产生对产业有价值的洞察之前,大量的基础工作尚未完善。
比如,工业数据在采集过程中会遇到数据完整性、数据质量等方面的困难,这就需要进行工况分割、数据清洗、数据质量检测、数据样本平衡、数据分割等数据预处理,这些工作本身就会耗费大量的时间和人力成本。
这一点,在数据密集型的半导体行业尤为突出。俞冠源指出,半导体大数据最大的问题是数据种类很多,如果不能很好整合,就会使数据杂乱无章。“小到一片Wafer上都有很多种数据,从IC设计到制造再到封测,每一道工序都产生大量数据,而这些散落在各个环节的大数据也是此后追溯问题、提升良率的关键。”
与其他工业相比,半导体产业链极其长且高度细分,从芯片设计到晶圆制造,再到封装、测试、PCB模板,然后再做成产品进入到实际应用场景,每一步都是由一大批专门的公司去做。
“这种高度成熟的全球水平分工模式是造就半导体产业过去几十年高速发展的重要产业架构。但各个环节相对独立让各自的数据很难串联在一起。”俞冠源说,“事实是,半导体公司要做数据分析,几乎90%的时间花在前期的数据清洗和数据整合上。”这让试图引入数据分析手段的半导体公司在具体操作层面遇到了实际难题。
此外,到了数据分析层面,缺乏有效的数据分析经验和手段也是国内很多Fab和Fabless面临的困难。“与高通、AMD、英特尔等老牌企业相比,很多国内厂商相对而言都还比较年轻,成立时间不长,缺乏相关经验,拿到数据以后,对于哪些数据要整合,哪些分析能够帮助他们抓住问题,往往容易迷茫。”俞冠源指出。
而上述各种障碍的根源在于,整个行业数据相关的底层架构未搭好。俞冠源比喻,这就相当于造房子时,底层的地基、水管、电线都要线架设好,尤其是数据清理、数据整合的部分,需要一个可供全行业使用的开放平台去提前做好,可以为需要导入数据分析应用的公司提供有效的分析手段。
“一直以来我们在底层架构的部分做了很多工作,也就是努力把‘水管、电线’都铺设好,帮助企业可以‘拎包入住’,直接实现数据价值。”俞冠源介绍,普迪飞所提供的Exensio平台正是为此而生。
据了解,普迪飞的端到端分析平台Exensio平台,具备了大数据整合,清洗与分析功能,可以为整个产业链上的各种公司提供服务。如果将整个产业链以设计、晶圆制造和封装测试三大环节来划分,针对每一环节的特性,普迪飞均有对应的产品模块。
迄今为止,在IC设计部分,普迪飞的Fire Engine软件分析了10亿计的版图结构;在晶圆制造环节,全球超过24,000台芯片生产设备通过其提供的生产监控软件进行连接;封装测试部分,全球超过15个主要封测服务提供商的工厂数据与该平台对接,超过16,000台测试机和封装设备通过其监控整个运营情况的软件相联接。
更为重要的是,通过这样一个连通全产业链的数据平台,原本独立分工的各个产业链环节实现数据层面的互联。而这种互联不仅仅只是设备间的,同时也将各个环节的半导体工程师与所有的芯片生产、封装、测试设备连接起来,为设计和制造提供重要的参考,有助于降低各项成本,提高性能和良率。
普迪飞在过去30年里,与国际一流的流片厂及设计公司密切合作,帮助先进 Fab、Fabless、IDM/System等国际领先的半导体公司完成了众多先进工艺量产项目。
打通产业链上下游挖掘数据价值
俞冠源指出,目前普迪飞是唯一一家覆盖了从前端到后端半导体供应链数据的公司,通过几十年的自身积累和对外并购,已经打通了整个供应链。在他看来,对产业链的端到端全覆盖是普迪飞的核心价值。
他举了一个例子,苹果公司对其芯片供应商就要求其提供的每一颗芯片都是可追溯的——哪一个工厂生产的,工厂的每一个步骤是什么,包括制造过程中用到的化学气体,在哪台设备上测试、封装的,哪一个员工负责的,等等。因为只有追踪到才能够确认哪个步骤出了问题。
俞冠源解释,这种端到端全产业链的数据分析之所以越来越关键,是由于半导体在全球范围内对各个行业的重要程度逐年递增——半导体在产品中占比越来越高,对其可靠性的要求也越来越高。“比如汽车,以前最贵的部件是发动机,到如今,最贵已经是半导体元器件。并且元器件的可靠性越来越重要,即便是几块钱的元件,如果坏掉了,也可能会引发交通事故,甚至会对人的生命造成影响。”
换句话说,几块钱的元件,会影响几十万的整车价值。“因而半导体的可靠性越来越重要,如果良率、可靠性出了问题,需要明确追溯到问题是在哪个环节出来的,是封装还是制造环节,还是IC设计的缺陷。”
而到了半导体先进工艺节点,尤其在下探到7nm、5nm时,因为随着工艺复杂度的提升,很多缺陷都不在表面上,而是埋在里面。怎样在研发和量产时监控这些东西,变得十分困难。因而提升良率除了从技术上调整之外,数据抓取能力的重要性越来越突出。
俞冠源介绍,先进节点的良率提升已经不仅仅是晶圆厂考虑的事,Fabless也需要在产品设计的时候,就把监控结构埋在产品里面,通过特征数据的抓取及高效分析来快速准确地定位问题,提高产品良率。
在这一部分,普迪飞在与世界一流芯片设计公司以及晶圆厂近30年的合作中,积累了大量不断演进的良率提升技术。例如,可以帮助先进制程客户设计独特的监控结构,内置于芯片的空闲位置,并结合普迪飞专用测试设备,实现大量特征数据的超高速抓取和分析,从而使得设计和工艺的缺陷一目了然。
具体来看,普迪飞的半导体大数据平台Exensio Platform,包含了用于半导体缺陷侦测分类(Fault Detection and Classification, Exensio-Control)模块、产品测试优化模块(Exensio-Test)、半导体良率管理系统模块(Exensio-Yield)等,覆盖了从IC设计、晶圆制造,到封装和测试等的半导体全产业链。
拥抱AI、数据上云势在必行 预见性分析是趋势
俞冠源介绍,目前半导体公司在大数据分析上,最关注的是良率诊断分析,也就是出现问题后可以通过系统的方法快速追踪问题源头,从而进行诊断分析,改善良率。
但是随着全行业智能化程度的深入,这种被动式应对长远来看显然无法满足需求。在问题发生之前的预见性分析成为更多业界领先者关注的重点。
一两年前,台积电就曾表示,已经在工厂里开始使用人工智能,在人工智能的帮助下,能够在不增加机器的情况下多生产20%-30%的wafer。例如,在某些关键工序上,使用人工智能对机台的保养时间动态的做出调整,提高生产效率。另外,人工智能还可以将很多专家的经验和专业技能整合在一起,让一个专家的经验在不需要专家在场的情况下就能大面积的铺开使用,从而实现更好的经验传承。
“下一步要做的事情就是预见,通过AI、机器学习等手段,从数据里面提出价值,来预防可能发生的问题。”俞冠源说。
比如,以晶圆厂为例,普迪飞的Process Control软件其中有一部分功能就是监测机台设备,通过收集的过往数据来分析预测机器大约会在运作多少个小时之后可能会出现问题,导致生产的wafer报废。这样就可以提前让机器停下来检修。而以往,都是等到机器开始生产报废的wafer了,才会停下设备。但往往停下来的时候可能已经生产了一部分报废的wafer。
随着AI、机器学习、5G等技术的往前发展,数据量呈指数式增长,按需运算的需求越来越高。上云以获取更灵活的计算资源和存储优势,成为业界向工业4.0深入的必然选择。
俞冠源以一片wafer为例,先进工艺制程的引入,一片wafer产生的数据量可能是原来的10倍乃至100倍。与此同时,AI、机器学习的引入意味着巨大的计算量,数据存储空间、计算能力的要求与日俱增,全靠一家公司内部架构支撑显然不现实。
上云已经成为先进制造行业的核心之一,但是国内半导体行业对此仍有所保留。其中数据的安全性是晶圆厂和设计公司最大的顾虑。俞冠源认为这其中存在着一个误区,“大家都认为数据放在自己公司比放在云端安全。实际上,一个半导体公司不是纯IT公司,在安全方面的人力投入上远不如云服务商。这些云服务商都会提供多重安全架构,足以为客户数据筑起强大的屏障。”
据悉,普迪飞推出的DEX网络已经帮助全球主要封测厂实现了云端部署和边缘计算,包括通过边缘分析来实现快速预测和预测响应,减少数据丢失,提升数据质量。
据介绍,普迪飞除了与全球知名的云服务商,如AWS等密切合作外,还在软件中做了很多保障数据安全的措施,并聘请了很多安全公司进行模拟入侵测试。
值得一提的是,2006年即进入中国市场的普迪飞,在过去15年里,业务模式随着中国半导体行业的发展逐步升级。俞冠源介绍,国内半导体行业在工艺方面一直在更新换代,芯片设计公司是成长最快的群体。针对芯片设计公司的特点,普迪飞此前推出了基于云端部署的Exensio-Hosted半导体数据分析平台,是一款不需要任何IT维护的企业级云端数据分析系统,可以让客户随时随地存取数据,完成定制化的数据分析,快速查找问题根源。该平台可以兼容多种数据,支持高效数据提取与加载,提供高度交互的数据可视化模块,还有快速报警、深度追踪以及强大的数据挖掘能力。