在刚刚结束的2021年架构日,英特尔宣布推出全新的独立显卡架构Xe HPG基于该架构的首款GPU将采用TSMC N6技术,并于2022年第一季度推出这是自1998年i740发布20多年后,英特尔再次进入独立GPU市场
伴随着英特尔的加入,独立GPU市场将再次成为三国厮杀的局面,技术竞争和市场竞争将从图形图像全面升级为AI和高性能计算。
从专用到通用
GPU市场很好根据Jon Peddie Research的报告,2021年第一季度全球GPU出货量达到1.19亿,同比增长38.78%,环比下降3%
尽管英特尔在整个GPU出货量中占据68%的市场份额,但NVIDIA在独立GPU中占据81%的份额,占据绝对领先地位,而AMD以19%的份额排名第二根据JPR分析师的预测,独立GPU的出货量将继续增长,到2025年将占整个GPU市场的26%
各种电子系统,无论是云端,边缘还是终端,都需要高性能的图像处理能力,因此GPU的发展进入了加速阶段独立GPU因用途广泛而成为大芯片中的佼佼者,其架构和技术达到了芯片行业的巅峰
英伟达2020年面向消费市场发布的旗舰GeForce RTX 30系列GPU采用三星8nm工艺,其中RTX3080和RTX3090包含280亿个晶体管相应的,AMD的RX 6000系列采用了TSMC的7nm工艺,晶体管数量已经达到了268亿
顶尖的技术和大量的晶体管对应着日益复杂的芯片架构以最新的NVIDIA Ampere架构为例,其计算部分包括流处理器,纹理映射单元,张量核心,光线跟踪单元和光栅化处理单元
其中,光线追踪单元在游戏中应用的光线追踪技术越来越多,而张量单元则用于将GPU带入AI领域,可用于实时深度学习,大矩阵运算和深度学习超采样这两个单元的引入也将彻底提升GPU的性能和功能,从图形处理器升级为计算处理器
为了追求极致的性能,独立GPU之间的竞争已经演变为架构之间的竞争英伟达在2020年推出安培架构,而AMD响应RDNA 2架构,使其RX 6000在性能上与RTX 30相当
有人把GPU架构的升级趋势概括为更多,更专业,更智能晶体管和算术单元的数量增加很多,包括流处理器单元,纹理单元和光栅单元的数量增加更专业化意味着除了常规计算单元,GPU还将增加新的计算单元更智能意味着GPU的AI计算能力提升
英特尔这次准备参战经过多年打磨,Xe架构不仅拥有最受欢迎的元素,还采用了TSMC的6纳米工艺,完全有能力与NVIDIA,AMD竞争
但也有业内人士指出,英特尔仍然是一家基因属于CPU的公司,对GPU的投入需要与CPU的增长相匹配,因此应对CPU与GPU的发展冲突将是一个很大的挑战。
争夺数据中心和更广阔的世界
2012年,多伦多大学的Alex Krizhevsky创建了一个深度神经网络,可以从100万个样本中自动学习和识别图像在两个NVIDIA GTX580 GPU上只训练了几天,Alex Net就在当年的Image Net大赛中胜出,击败了所有经过几十年磨砺的人类专家算法认识到深度学习的力量,斯坦福大学的吴恩达与英伟达研究办公室合作,开发了一种使用大规模GPU计算系统训练网络的方法此后,深度神经网络技术发展迅速,也奠定了GPU在AI领域的地位
GPU为并行计算提供了多种基本结构,并且拥有大量的内核,可以执行海量数据的并行计算,同时还具有较高的内存访问速度和高浮点计算能力这些都使得GPU完美地满足了AI计算的需求
目前,GPU是AI训练阶段合适的芯片在AI时代,GPU在云训练芯片中占有很大份额,达到64%.虽然后期由于FPGA和ASIC技术的突破,GPU的市场份额有所下降,但仍是云培训市场份额最大的芯片,2019年至2021年复合年增长率为40%
这一切的出发点都是GPU的应用用于通用计算的GPU称为GPU,它可以与CPU协同工作,接管一些繁重的计算负载,加速应用
GPU的概念始于学术界,真正让它蓬勃发展的是NVIDIA2006年,NVIDIA引入特斯拉架构,将GPU中的矢量计算单元拆分为若干标量计算渲染单元,使其更适合通用计算2007年,NVIDIA推出了CUDA,这是一个专门为GPU设计的并行计算平台和编程模型CUDA可以大大降低用GPU进行通用计算的难度,从而大大降低GPU应用的门槛
当CUDA与深度学习相关时,
结合,更是释放了 GPU 的巨大潜力,也让 AI 从实验室走入了业界同时,GPU 也稳固了自己在数据中心的地位
凭借 GPU 在数据中心的表现,英伟达的业绩也一路走高在 2022 年 Q1 财季,其数据中心业务营收为 20.5 亿美元,创下公司历史上的新纪录,与上年同期相比增长 79%,与上一季度相比增长 8%,占总营收的比重已达 36%
在此领域发力较晚的 AMD 现在也开始奋起直追根据 AMD 首席执行官 Lisa Su 的说法,该公司第二季度数据中心 GPU 的销售收入同比增长了一倍多Lisa Su 将该细分市场的出色表现归功于该公司 Instinct 加速器部署的增加,其中还包括其基于 CDNA 2 架构的最新数据中心显卡的首次出货
现在,终于轮到 Intel 出手了最新的面向数据中心的 GPU Ponte Vecchio 重磅出炉,拥有 1000 亿颗晶体管的 SoC 也创下了 Intel 之最
Ponte Vecchio 基于 Xe—HPC 微架构,由多个复杂的设计组成,这些设计以单元形式呈现,然后通过嵌入式多芯片互连桥接单元进行组装,实现单元之间的低功耗,高速连接这些设计均被集成于 Foveros 封装中,为提高功率和互连密度形成有源芯片的 3D 堆叠
在 ASIC 和 FPGA 都在与 GPU 进行竞争的时刻,Intel 选择了 GPU,说明 GPU 可能还是通用 AI 的最好选择行业专家刘明这样评论道
这颗巨大的芯片也可以被看做是对英伟达推出数据中心 CPU 的反击,双方至此都形成了 CPU+GPU 的布局。
同时,英特尔还在发展其 oneAPI 计划,使其成为 Nvidia CUDA 的强大竞争对手,因为它的范围不仅限于 GPU,而且涵盖 CPU 和所有处理器。
尽管独立 GPU 不能完全取代 CPU,但是其已经成为数据中心中非常关键的一环当三大芯片厂商都汇聚于此时,GPU 还会有更多精彩的故事
声明:以上内容为本网站转自其它媒体,相关信息仅为传递更多企业信息之目的,不代表本网观点,亦不代表本网站赞同其观点或证实其内容的真实性。投资有风险,需谨慎。