如今,将复杂的芯片设计拆分为多芯片解决方案风靡一时。AMD 已经在其 CPU 和数据中心 GPU 中使用了多芯片设计,并且其当前一代RDNA 3 RX 7000 系列 GPU也采用了不太复杂的芯片。根据 2022 年 12 月 8 日提交并于本周发现的一项新专利,现在该公司似乎正在寻求为更广泛的应用生产更复杂的多芯片 GPU。

“处理系统的图形处理单元 (GPU) 被划分为多个芯片(称为 GPU 芯片),这些芯片可配置为在第一种模式下作为单个 GPU 共同运行并与应用程序交互,在第二种模式下作为多个 GPU,”专利申请的摘要描述写道。
这显然不同于当前的 RDNA 3 架构,在 RDNA 3 架构中,AMD 使用中央 GCD(图形计算芯片)芯片来实现 GPU 的所有主要功能,并使用多个 MCD(内存缓存芯片)芯片来实现内存接口和缓存。CDNA 数据中心 GPU 更像这里描述的,具有多个计算/处理芯片。
该专利描述了一种相当具体的 GPU 实现,该实现具有三个 GPU 芯片组和一个多媒体芯片。每个 GPU 芯片组由一个前端芯片和着色器引擎芯片组成(专利显示了三个 SE 芯片,但实际数量可能不同)。这种多芯片 GPU 可以以三种模式运行:
第一种模式,单 GPU:所有 GPU 芯片作为一个统一的 GPU 协同工作,共享资源并协同处理任务。在此模式下,一个前端芯片通常负责 GPU 内所有着色器引擎芯片的命令调度。这基本上就是传统 GPU 的工作方式。
第二种模式,多 GPU:GPU 芯片被分成不同的组,每个组都作为独立的 GPU 运行。每个组都有自己的前端芯片,负责为其相关的着色器引擎芯片调度任务。
第三种模式,混合配置:此模式提供灵活的配置,其中一些 GPU 芯片作为单个 GPU 运行,而另一些则作为独立 GPU 运行。
AMD 的数据中心 GPU 设计已经分拆了好几年,该专利最有可能首先针对多芯片数据中心 GPU,但也可能扩展到客户端 GPU。AMD 未来可能希望分拆其客户端 GPU 的原因有几个。
首先,随着高 NA EUV 光刻技术的出现及其减半的曝光场(或光罩尺寸),多芯片设计将变得更加普遍。鉴于 AMD 在多芯片设计方面已经拥有足够的经验,多芯片 GPU 可能是一个可行的选择。
其次,由于大型单片芯片的流片和生产成本过高,采用多芯片设计来打造客户端 GPU 是 AMD 降低成本的好方法。它已经在 GCD/MCD 芯片中部分实现了这一点,但这是目前客户端芯片的第一次迭代,我们预计 AMD 将在未来的设计中继续走这条路。芯片组还可以将着色器引擎和主要计算硬件放在前沿节点上,而前端引擎则采用更老、更便宜的工艺技术。
有了多个芯片组,将 GPU 性能从入门级解决方案扩展到高端产品就变得更加容易了。事实上,AMD 的摘要描述是这么说的:
“通过将 GPU 划分为多个 GPU 芯片组,处理系统可以根据操作模式灵活且经济高效地配置一定数量的活动 GPU 物理资源,”专利声称。“此外,可配置数量的 GPU 芯片组被组装成单个 GPU,这样就可以使用少量的流片来组装具有不同数量 GPU 芯片组的多个不同 GPU,并且可以用实施不同代技术的 GPU 芯片组构建多芯片 GPU。”
同样,AMD 已经声称在 RDNA 3 中使用了 GPU 芯片组,但这显然代表着将功能分解到不同芯片中的水平又迈进了一步。我们在 Ryzen CPU 上看到了类似的情况,第一代小芯片更像是一个概念验证,后续设计更好地分离了功能,以实现最大的性能和可扩展性。AMD 尚未完成 GPU 小芯片的开发,我们怀疑 GPU 领域的大多数参与者最终都会采取类似的方法。

“处理系统的图形处理单元 (GPU) 被划分为多个芯片(称为 GPU 芯片),这些芯片可配置为在第一种模式下作为单个 GPU 共同运行并与应用程序交互,在第二种模式下作为多个 GPU,”专利申请的摘要描述写道。
这显然不同于当前的 RDNA 3 架构,在 RDNA 3 架构中,AMD 使用中央 GCD(图形计算芯片)芯片来实现 GPU 的所有主要功能,并使用多个 MCD(内存缓存芯片)芯片来实现内存接口和缓存。CDNA 数据中心 GPU 更像这里描述的,具有多个计算/处理芯片。
该专利描述了一种相当具体的 GPU 实现,该实现具有三个 GPU 芯片组和一个多媒体芯片。每个 GPU 芯片组由一个前端芯片和着色器引擎芯片组成(专利显示了三个 SE 芯片,但实际数量可能不同)。这种多芯片 GPU 可以以三种模式运行:
第一种模式,单 GPU:所有 GPU 芯片作为一个统一的 GPU 协同工作,共享资源并协同处理任务。在此模式下,一个前端芯片通常负责 GPU 内所有着色器引擎芯片的命令调度。这基本上就是传统 GPU 的工作方式。
第二种模式,多 GPU:GPU 芯片被分成不同的组,每个组都作为独立的 GPU 运行。每个组都有自己的前端芯片,负责为其相关的着色器引擎芯片调度任务。
第三种模式,混合配置:此模式提供灵活的配置,其中一些 GPU 芯片作为单个 GPU 运行,而另一些则作为独立 GPU 运行。
AMD 的数据中心 GPU 设计已经分拆了好几年,该专利最有可能首先针对多芯片数据中心 GPU,但也可能扩展到客户端 GPU。AMD 未来可能希望分拆其客户端 GPU 的原因有几个。
首先,随着高 NA EUV 光刻技术的出现及其减半的曝光场(或光罩尺寸),多芯片设计将变得更加普遍。鉴于 AMD 在多芯片设计方面已经拥有足够的经验,多芯片 GPU 可能是一个可行的选择。
其次,由于大型单片芯片的流片和生产成本过高,采用多芯片设计来打造客户端 GPU 是 AMD 降低成本的好方法。它已经在 GCD/MCD 芯片中部分实现了这一点,但这是目前客户端芯片的第一次迭代,我们预计 AMD 将在未来的设计中继续走这条路。芯片组还可以将着色器引擎和主要计算硬件放在前沿节点上,而前端引擎则采用更老、更便宜的工艺技术。
有了多个芯片组,将 GPU 性能从入门级解决方案扩展到高端产品就变得更加容易了。事实上,AMD 的摘要描述是这么说的:
“通过将 GPU 划分为多个 GPU 芯片组,处理系统可以根据操作模式灵活且经济高效地配置一定数量的活动 GPU 物理资源,”专利声称。“此外,可配置数量的 GPU 芯片组被组装成单个 GPU,这样就可以使用少量的流片来组装具有不同数量 GPU 芯片组的多个不同 GPU,并且可以用实施不同代技术的 GPU 芯片组构建多芯片 GPU。”
同样,AMD 已经声称在 RDNA 3 中使用了 GPU 芯片组,但这显然代表着将功能分解到不同芯片中的水平又迈进了一步。我们在 Ryzen CPU 上看到了类似的情况,第一代小芯片更像是一个概念验证,后续设计更好地分离了功能,以实现最大的性能和可扩展性。AMD 尚未完成 GPU 小芯片的开发,我们怀疑 GPU 领域的大多数参与者最终都会采取类似的方法。