半导体和系统的仿真变得越来越庞大、复杂且越来越必要,这反映了硬件本身发生的一切——尤其是在人工智能数据中心中。
从单片芯片转向多芯片组件,现在需要解决一些棘手的多物理难题,比如热成像以及功率传输,这些数据越来越难以准确建模。例如,高带宽内存中的多层信号路由需要额外的仿真。验证整个系统的功能,包括不同集成子系统之间的交互,比验证单个芯片更具挑战性。
这些工作大多发生在设计的前沿,SRAM 扩展放缓,逻辑扩展已无法带来足够的性能提升。晶体管数量更多,但也有各种技巧被用来加快数据在内存和处理元件之间的传输,以及通过预处理减少需要移动的数据量。
仿真必须适应所有这些情况,并且必须足够快速地完成以满足生产进度。但主要有三个问题:
高性能计算系统的内存容量和带宽未能跟上处理器性能的提升,这为许多仿真应用带来了数据瓶颈。
多核和基于加速器的高性能计算架构需要复杂的并行编程。这需要对算法进行重大调整,而优化起来可能具有挑战性。
虽然AI/ML旨在加速仿真,但它增加了另一层复杂性。由于实验数据有限且生成高质量数据集的成本高昂,训练准确的半导体行为AI模型可能很困难。
Cadence战略与新业务高级集团总监Rob Knoth指出:“这项模拟挑战源自Cadence首席执行官Anirudh Devgan今年五月的观察,他说:”为AI设计,为设计AI。”“关键是我们行业内所有人都在帮助构建人工智能基础设施,这很难。这些系统的复杂性以及部署和开发下一代所需的时间限制令人头脑发麻。当然,这会很难。这一直很难。为什么现在会容易?“设计中的人工智能”是唯一的亮点。我们正在构建这些由极其复杂的芯片组成的系统,这些都是我们过去从未尝试过的。我们正拼命努力打造这些极其复杂的计算系统。然后我们用这些系统设计下一代产品。这让我们几代人都能拿到工资。在很多方面,故事并没有改变,但却更加深刻和演变。有新的参与者,新的灾难和紧急情况,还有我们必须应对的新问题。”
而这一切都发生在人工智能基础设施快速建设和产品周期加速的背景下。“做这些边境模型,一切都变得越来越难,所需的计算量也非常庞大,“诺斯说。“如果你看训练所需的能量边境模型,这和现在单个数据中心的消耗量相当于美国一个大城市的情况。这对里面发生的事情意味着什么?最先进的AI处理器,使这些子系统能将目线尺寸扩大三倍以上?计算量很大。他们预测事情将走向这个方向。如果你看得更远,会发现有晶圆(SoW)系统,硅片尺度基底尺寸超过40倍,这正是复杂性所在。当我们开始思考系统架构、实施、集成和分析真正涉及的内容时,这令人望而生畏。当然,它们都是3D-IC的。”
还有设备层面的因素使仿真更难。“如果某些东西需要时间太长,因为细节过多,模拟起来就很难,”弗劳恩霍夫IIS/EAS设计方法论部门主管Roland Jancke指出。“对于模拟来说,问题总是,'什么是好的抽象层次?你能跳过多少信息,因为它们与当前问题无关?又能抽象多少以加快模拟?”这始终是模拟任务的关键。”
此外,难以模拟的原因是建模的难度。“你需要更多地建模,而且必须建立准确的模型才能做到这一点,”迈克尔·蒙西说,恶习西门子EDA半导体行业总裁。“在半导体领域,我们对处理器的虚拟化方式极大地促进了在流程早期进行更多仿真。我们必须创造那种虚拟化技术。否则,我们就会被困在模拟、开发RTL和运行软件的领域里。必须开发出新技术来模拟这些情况。所以,当我们看到更大、更复杂的系统时,关键在于拥有高保真度模型的能力,能够代表系统的每个部分。当你看整个产品时,有些东西比其他部分更先进,更容易数字化。这正是让模拟变得更加困难的原因。”
规模在这里起着关键作用。系统越大越复杂,比如汽车,包含所有集成功能,建模和仿真就越困难。“模型变得如此庞大,你需要能够将它们抽象化,以便将它们纳入足够的计算能力进行实际模拟,”芒西说。“帐篷的长杆是能够数字化的。你们是否用更大的数字孪生来实现你们想要的完整系统级仿真?”
速度也一样。一切都在加快,无论是产品周期还是设备或系统内部的信号。这需要更多电流,也会产生更多热量。“此外,电磁仿真还能给你局部加热等信息,然后你还可以做物理学热成像“,这是另一组物理方程,”Ansys(现为Synopsys一部分)产品管理总监Matt Commens说。“你可以把从电磁模拟中提取的源,带到一个热成像分析,并对芯片可能耗散的瓦数和热量做一些局部假设,你可以用这些来获取热成像模拟。只是随着东西越来越紧凑,一切都变得更难,随着进展加快,没有免费的午餐,所以工程师总是得自己应付。关键在于他们能承受多大的利润率。仿真的一个特点是,如果你有良好的仿真,可以设计到极限。如果模拟不好,必须加一些填充,你会失去空间,也会失去功能。因此,处于前沿的公司正在推动仿真业务的规模扩大。他们希望尽可能严谨地提取系统的更大部分。在我们这边,我们被要求利用这些高性能计算(HPC)技术,而最新一代GPU在很多方面改变了游戏规则。”
有时CPU在高性能计算领域依然很有价值。“这取决于你用什么技术来加速仿真,并行化仿真过程中不同层级结构,”Commens说。“利用这些不同的硬件,真是一场平衡艺术。”
前沿节点的挑战3nm及以下芯片的仿真挑战各有其独特的问题。Quadric首席市场官Steve Roddy表示:“我们关注的是处理晶体管层面埃级物理效应中新兴仿真问题的现实且紧迫的挑战。”“正确的电路级行为需要理解越来越多签字角(针对不同电压和频率工作点等)的所有器件物理效应,但同时也需要从那些经过验证的旧有门级模拟中提升到更高层次,因为这些模拟运行时间过长。理解芯片的整体行为状态——在不同场景下有多少块处于激活状态和切换——是设计合适的电网和时钟树的关键。在拥有100亿门设备的时代,构建模块需要通过高水平但周期准确的仿真,如基于周期的指令集模拟器(ISS)针对处理器进行单独的电源和开关活动表征。”
一个包含CPU、GPU、DSP和AI NPU的复杂芯片,可以将所有拥有功耗精确ISS的处理器连接起来,在更大的系统仿真中进行模拟。罗迪说:“这样的SystemC芯片级仿真可以告诉设计师在各种使用场景下每个模块的电源状态,从而实现电网的合理化规模,而无需总是为所有同时经历最坏情况活动的元件设计。”“显而易见的结论是,设计团队应尽量避免部署缺乏高级仿真能力的大型超级门逻辑模块。”
然而,抽象细节和创建模型并非普遍技能。“并非所有人今天都掌握如何做这些,”Fraunhofer的Jancke说。“开发者自己知道问题所在,知道需要解决什么,需要实现什么。但他们不一定是仿真方法论和建模方法的专家。我们认为需要在这方面更有知识,才能拥有高效的模型和高效的仿真。有时他们使用模拟器是因为它免费,可以从互联网开源获取,却不明白自己使用的仿真层次完全错误。这就是为什么公司需要更多知识,牵着开发者的手,传授他们仿真原理的知识。”
这些技能通常是在工作中学到的。“在德累斯顿,这项技术不开设,”扬克说。“遗憾的是,这不在电气工程课程中。也许机械工程中,他们会从背景中学到一些模拟器知识,了解它们的工作原理、不同的原理和仿真工具,但如今在课程和大学中很少见到这些内容。”
随着新挑战的出现,这一技能差距正在扩大,但这只是问题的一部分。大规模实施先进仿真策略存在基础设施和实际障碍。

图1:人工智能基础设施挑战。来源:Cadence
“我们知道处理器本身每代功率提升1.5倍,甚至可能达到3倍,”Cadence的Knoth说。“这意味着分析变得至关重要,优化更是关键。在仿真方面,挑战在于我们看到每个链路在芯片之间超过4TB每秒。所以现在你必须开始考虑每一颗芯片都涉及光子学,这意味着很多简单性和你通常会做的假设都被抛诸脑后了。模拟的规模变得更加复杂。芯片的功耗越来越高,每颗芯片投入的处理能力也都越来越多,这意味着功率密度变得非常高。水冷是默认的。所以我们不仅有热量和光,现在还有流体在这些系统中流动。我们不断增加模拟本身的规模和复杂度。然后我们进入最后一个维度——时间——这很有趣,因为时间是第四维度。在这里,不仅你的工作更难,你还得更快完成。”
技术策略每个组件、每个信号和每个系统都需要加快速度。为了最大化为高性能计算设计的SoC的性能,编译和仿真/运行阶段均采用并行性。
Synopsys首席产品经理Taruna Reddy指出:“通过利用机器中或网格中可用的多核,可以实现显著的性能提升。”“模拟器长期以来就融合了有效利用这种并行性的技术。同样,面向高性能计算(HPC)的SoC架构趋势是向多芯片或芯片组设计的转变。这些集成系统由多个芯片封装在一起,作为SoC使用,具有可扩展性、高带宽和能效等优势。该方法涉及独立制造的芯片,并通过先进的通信结构相互连接。然而,验证这些复杂系统的正确性和功能性存在重大挑战。传统的仿真方法,无论是内部还是外部,在性能和容量方面常常难以实现充分的扩展。”
分布式仿真技术是一种选择,因为它们使大型多芯片仿真能够通过多个参与的可执行文件,作为更小、易于管理的组件来执行。Reddy解释道:“在为AI数据中心行业量身定制的高性能计算SoC背景下,由于复杂的数据路径,导致时序异常的普遍性增加。”“这些时序异常通常在验证周期后期的门级仿真中验证,导致覆盖率较低。这种延迟的验证过程可能导致被攻破硅质量。通过在RTL阶段更早验证这些约束,可以使用模拟器实现更高的覆盖率,从而有效解析约束文件。”

图2:RTL中异常验证的需求。来源:Synopsys
虽然人工智能被用于解决仿真覆盖关闭等挑战,但Reddy指出,未来如何进一步利用AI提升原始性能并促进漏洞早期检测将非常有趣。
结论在这些日益严峻的挑战中,认识到塑造行业的更广泛视角非常重要。尽管技术障碍看似艰巨,但创新的动力依然存在,推动个人和组织走向新的方向边境.这种决心和乐观情绪反映在专家们对超级计算和人工智能基础设施未来的态度上。
“超级计算机就是希望,”诺斯说。“你用这台机器做的是之前几代机器无法实现的物理学,所以如果我们从这四个维度看问题,它可怕吗?也许吧。但这真的是无望的吗?不。这为我们打开了巨大的机遇,因为当我们谈论抽象层级时,这正是电子设计自动化能够实现世代生产力进步的根本因素之一。我们不再手动推多边形了。我们甚至不再手工放置标准电池。我们能够提升的抽象层级允许每位工程师设计更大、更复杂的系统,同时软件也能在其抽象化的范围内开始做更好的优化。所以现在我们的世界不再只在芯片、封装、PCB甚至数据中心的边界开始和结束,这意味着我们将能够优化破解问题,这正是希望所在。”
诺斯表示,他能理解人工智能带来的机会。“我能理解这声音的来源,工程方面。例如,我们的一位研发负责人最近在一个会议上发表了一篇论文,讨论了利用替代模型来加快热成像用于3D-IC的仿真。我心想,'我能看出接下来会发生什么。'此外,LLM在某些方面非常出色和出色,我会思考它们将如何帮助人们实现。这就像从机器码过渡到更高阶语言,更多人可以开始将想法付诸实践。这让它变得更大。但我觉得真正的革命,就像工程本身一样,不会来自这些高层次、更华丽的东西,而是来自一些更低层次的突破,比如一些重新出现的旧概念,比如神经网络。我预计由于实际有原则的模拟、计算数据的结合,以及将大量高质量的物理数据与新模型训练结合,我们会开始看到更好的物理学成果。”