NVIDIA和骏兆电子公司于8月中下旬开始推动“1216超标量狂潮”活动,12条“超标量”流水的GeForce 6800 PCI-E和16条“超标量”流水线的GeForce 6800GT PCI-E显卡正在引导一起高端应用的“质价比”的新消费观念。当技术价值的走向,与“频率至上”彻底决裂之后,核心架构的“效率至上”和为用户带来新应用和利益的“应用品质至上”成为当今产品最终极价值判定标准。基于此两种价值标准,NVIDIA在GeForce6开始采用全新具有极大创造力的“超标量”核心架构,该架构可以在较低工作频率下获得其它架构更高的性能,非NVIDIA“超标量”核心架构设计的图形卡,必须要硬性提高自身的频率才能达到NVIDIA较低频率下获得的性能表现,如果按照全新的管线(流水线)产品市场定位规则,在相同流水线数量的情况下,以“性能分数/MHZ”的标准来标识NVIDIA的GeForce 6系列显卡的话,显而易见,GeForce 6的“超标量”核心架构带来的效率是最高的,也就是说:其每MHZ的频率下所获得的性能分数远远抛离非NVIDIA核心的图形卡。这就是为什么说“超标量”的效率是产品的核心价值之一,不过,今天,谈“超标量”GPU架构可能对大多数人而言,不太直观便于理解,毕竟这是NVIDIA架构师的事业,对于普通用户而言,那涉及太艰深的探索。我们就来了解,“1216超标量狂潮”除了带来了高效率核心GPU,也同时为用户带来了实实在在可以体验到的最富价值的全新应用,这些应用全是NVIDIA公司发布GeForce 6系列产品才能提供支持特效品质应用,当然,也包括GeForce6800 PCI-E和GeForce 6800GT PCI-E显卡在内。
当年的Riva128让我们认识了NVIDIA,而后的TNT系列更是告诉业界3dfx不是3D游戏的唯一,其后的Geforce系列将3dfx赶下神坛并最终奠定霸主地位。毫无疑问,NVIDIA的发展之路可谓一帆风顺。然而如日中天的NVIDIA还远没有到“一览众山小”的境界,ATI的紧追不舍使其如坐针毡。不过NVIDIA还是始终保持技术上的领先,如今SM3.0、HDR和SLI已经成为其统治业界的三大利器。
突破画质极限——Shader Model 3.0
速度上的过分追求已经使玩家对3D游戏失去了兴趣,因此画质越来越得到业界的重视。继Pixel Shader与Vertex Shader出现之后,整个游戏市场发生了翻天覆地的变化,如今DirectX 9.0C已经成为一种潮流。从目前的3D游戏发展趋势来看,Pixel Shader与Vertex Shader正体现出越来越大的作用,以《寂静岭III》以及《波斯王子时子砂》为代表的部分游戏甚至指定要求显卡具备Pixel Shader单元才能运行。然而不得不承认,无论是GeForce FX5950U还是Radeon 9800XT,其Shader单元的性能还在初级阶段,一定程度上限制了应用与最终效果。
着色器(Shader)是渲染像素和顶点的小程序,分为像素着色器和顶点着色器两种类型。这些程序能够向基本的几何图形添加效果,例如,向蓝色纹理平面添加水纹使其具有反射效果,也可向多边形纹理添加玻璃效果使其具有透明的视觉特性。现在游戏画面的品质要比三四年前好许多,着色器的作用功不可没。
GeForce 6在核心设计时就将Shader部分作为重点,其整个体系架构可以分为三大块,分别是Vertex Shader(顶点着色器)、Pixel Shader(像素着色器)和ROP(像素结果输出处理器)。GeForce 6800GT拥有6组Vertex Shader、16组Pixel Shader和16组ROP。通过ShaderMake 2.0测试软件对比,GeForce 6800 Ultra在这一部分的性能提升令人惊讶,这也注定Pixel Shader与Vertex Shader将会在未来的各种3D游戏中进一步普及。
![NVIDIA显卡: “1216超标量狂潮”引爆SM3.0、HDR、SLI核动力](//www.thethirdmedia.com/null.gif)
![NVIDIA显卡: “1216超标量狂潮”引爆SM3.0、HDR、SLI核动力](//www.thethirdmedia.com/null.gif)
Shader Model 3.0架构的GF 6800在分裂细胞中有着出色表现
不仅仅是Shader Model体系架构的提升,NVIDIA还升级了Pixel Shader的版本,从2.0跃迁到3.0。客观来说,在目前的游戏引擎中,Pixel Shader 3.0与Pixel Shader 2.0起到提升性能和画质的目的。事实上Pixel Shader3.0对于游戏编程人员的意义更大,它支持无限代码长度的程序处理,提供新的分支指令,能够轻松调用子程序,让编程更为轻松,效率提升显著,这对程序员来讲是一大喜事。
在某些情况下,终止一个程序和开始另一个程序的开销,降低了游戏的速度并使得这种效果的应用变得不切实际。由于不再强迫将每个像素着色器程序压缩到96条指令中,因此程序员现在可以从硬件限制中解脱出来,可以在像素级别执行更复杂的效果。当着色器程序不再有长度限制时,复杂效果可以编写成能够榨取游戏平台的所有性能。即使较长的程序的处理时间比较短程序的更长,但是CineFX 3.0引擎具有的技术和速度确保较长的程序依然可以运行如飞。同时,Shader Model 3.0支持动态程序流控制,额外的循环/分支选项和新的子程序调用/返回功能给与程序员更多的选择,以开发出更有效率的着色器程序。Shader Model 3.0完全支持子程序、循环和分支、包含循环计数寄存器和条件码以及一个新的back/face寄存器,给与了程序员完整的控制能力。没有了长度的限制,再加上增强的程序流控制,Shader Model 3.0给予程序员空前的自由度,可以为游戏世界释放出全新画质与速度的创造力。