·性能与功能兼备的Xe LP核显 持续关注PC行业的朋友,对于英特尔Xe架构可以说是一种又熟悉、又陌生的感觉。因为在Tiger Lake发布之前,英特尔已经多次在各种场合谈及Xe架构的基础技术特性。 首先需要明确的是,英特尔将Xe GPU划分为三个档次: 1.Xe LP(低功耗):用于核显、入门级独显,标准TDP 5-20W,最高可扩展到50W。 2.Xe HP(高性能):用于主流和发烧消费市场、数据中心和AI领域,标准功耗75-250W。 3.Xe HPC(高性能计算):用于超级计算机等,目前还没有披露太多详细参数。 可以看到,由图形架构大神Raja Koduri掌舵打造的Xe架构具有很高的可扩展性,通吃入门到发烧,普通PC到超级计算机平台的通用图形架构。
随Tiger Lake而来的,也就是Intel Iris Xe核显,正是Xe LP级别的显卡。其最高执行单元达到96个,核心频率达到1.35GHz,能够在1080P 60fps下运行《英雄联盟》、《CS:GO》等游戏;且能够在1080P 30fps下运行《战地5》、《绝地求生》等高画质游戏。整体性能相比上一代Ice Lake搭载的Iris Plus核显提升2倍,执行单元数量从64个提升到96个,核心频率从1.1GHz提升到1.35GHz,L3达到3.8MB,性能相比AMD Ryzen 7 4800U搭载的集显提升1.5倍。
英特尔Xe核显优化了EU单元,使用8位浅层矢量来达到浮点单元的资源利用,这是Iris Xe核显性能大幅提升的底层原因。 从Tiger Lake的SoC构成来看,Xe图形架构中的显示引擎和媒体引擎,是英特尔11代酷睿在创意设计、视频编解码、4K/8K视频显示方面最为重要的武器。如显示引擎,除了提供支持4个4K和1个8K显示器输出之外,还原生支持HDR10、杜比视界、360Hz刷新率以及Adaptive Sync技术。
媒体引擎则使Tiger Lake处理器支持AV1硬件解码、12bit端到端高速视频管线。赋予了Tiger Lake处理器更加强大的媒体功能。
此外值得一提的是,除了在架构上下功夫之外,英特尔还格外注重驱动和软件层面的优化,彻底重构了DX11驱动,使负载变得更低。同时还支持游戏锐化、配置优化、即时游戏调校,因此使得Intel Iris Xe核显达到了与MX350独显相媲美的图形性能。
总体来看,Xe LP核显从基本规格上相较Gen 11核显提升明显。除上述特性之外,它还具备高效线程控制特性,支持VRS可变着色率,每时钟周期最多处理24个像素、48个纹理。FP16、FP32浮点性能提升幅度达到84%,并且首次引入INT8整数处理能力,性能达到8.29TOPS。 ·SuperFin晶体管技术助力性能释放 Tiger Lake之所以能够有效的整合Willow Cove微架构和Xe LP核显,以及众多IO单元,最为重要的底层技术就在于全新的10nm SuperFin晶体管技术。
简单而言,SuperFin技术从底层晶体管设计上实现了进一步优化,不仅重新设计了晶体管,而且重新设计了金属堆栈。 首先,英特尔通过添加全新的高性能晶体管,以及改善的栅极工艺来提升驱动电流,使电荷具有更高的移动性,并降低了源漏电阻,实现了更低的电容。 英特尔在高频敏感IP中使用这一全新的晶体管技术,如处理器内核,高速总线和内存子系统,同时还在非高频率关键IP中,如Type-C和PCIe中,使用现有高阀值电压晶体管,从而使其变得更加高效。这些技术使得晶体管的运行速度得到提升,同时降低泄漏,进而降低这些晶体管的运行电压。 其次,在改善金属堆栈方面,英特尔的工程师大幅改善了中低层电阻,并大量使用导通孔。同时,在晶体管顶层还增加了2层额外的高性能层,以使其达到更高的峰值频率。此外,通过提升MIM电容器能力,Tiger Lake处理器可以胜任更高负载的任务,提供快速而稳定的供电响应。 因此,Tiger Lake处理器能够释放出比前代产品更强的CPU和GPU性能,根本原因就在于全新的SuperFin晶体管技术带来了卓越的底层优化。 ·三大AI技术加持使Tiger Lake更全能 对于英特尔而言,人工智能技术与电脑的结合是未来推动PC产业发展的重要方向之一。而从处理器底层去支持AI技术,则是最为有效的做法。因此,英特尔为Tiger Lake带来了包括Intel DL Boost:VNNI,Intel DL Boost:DP4a,Intel Gaussian&Neural Accelerator三大AI加速器。
很多人对于AI在PC上应用的意义并没有概念。其实简单来说,AI技术能够帮助PC更加智能的调控性能、延长续航,也能够在实际应用中帮助用户简单、快速的完成相关任务。
首先来看本次最为引人关注的Intel DL Boost:DP4a Intel DL Boost:DP4a是Xe核显的标志性指令之一。它使用32位元累积来计算,一个4位浅层矢量点积,从而加快了8位元整数推断。这种强大的4元素矢量点积扩展,经过优化之后加速了用于人工智能的推断,并且在深度学习中也有所应用。
Intel DL Boost:VNNI并非首次出现在酷睿平台之上。英特尔在Tiger Lake上继续沿用了这一技术。VNNI为处理器提供了卓越的人工智能性能或矢量神经网络指令,可以加速基于卷积神经网络的算法。它把此前的三个独立指令,也就是一个矢量相乘和两个矢量相加,整合成一个矢量点积指令,从而提供比竞品高1.7倍的性能。
Intel Gaussian&Neural Accelerator,即GNA2.0,是英特尔打造的低功耗人工智能加速器。它专门针对工作流负载进行了优化,比如在听写、翻译或是动态降噪方面,能够帮助用户提升体验。如视频会议过程中的背景消噪,就是其典型应用场景。
此外,GNA2.0最大的特性在于它是一个独立的IP区块,因此能够在CPU或GPU忙于执行其它工作负载时而正常工作,并且能够以更省电、更低功耗的状态,实现每毫瓦每秒10亿次运算。而其峰值运算能力可达到每秒380亿次! 通过把正确的人工智能工作流工作负载交付给GNA处理,就可以进一步缓解CPU的计算负荷,这是GNA技术最大的价值所在。 |