R420的革命性效果:
●强大的多边形生成能力:
R420配备了6个顶点渲染单元,这一点和NV40不谋而合,比上一代的R9800XT的4条,有了5成的提高,再加之核心频率的提高、以及渲染路径的优化,最后使多边形生成能力比R9800XT提高了50%以上!R420的多边形生成能力为7.8亿个/秒,而NV40最高只有6亿个/秒。
提到这里,我们不得不说和多边形建模息息相关的顶点渲染引擎(Vertex Shader,以下简称VS)。因为三角形就是由3个顶点来定义的,VS是MicroSoft在DX接口函数中为显卡定义的一种渲染模式。游戏程序员要按照这种函数所规定的范畴,来进行游戏的设计。在游戏进行时,显卡也是按照这种函数的帧路径,来进行渲染和填充。所以显卡的顶点单元和工作频率是显卡的硬件条件,而DriectX则是一种软件的条件。两者共同决定了显卡在游戏中的性能,并且两者还互相依赖。
X800虽然不支持VS3.0版本,但也在原有的VS2.0版本上做了优化,从而支持到VS2.0A。
Vertex Shader 版本 |
2.0 |
2.0a |
3.0 |
指令槽数量(# of instruction slots) |
256 |
256 |
>=512 |
最高执行指令数(Max # of instructions executed) |
65535 |
65535 |
65535 |
指令推断(Instruction Predication) |
- |
√ |
√ |
变量寄存器(Temp Registers) |
12 |
13 |
32 |
常量寄存器(# constant registers) |
>=256 |
>=256 |
>=256 |
静态流控制(Static Flow Control) |
√ |
√ |
√ |
动态流控制(Dynamic Flow Control) |
- |
√ |
√ |
动态流控制深度(Dynamic Flow Control Depth) |
- |
24 |
24 |
顶点贴图(Vertex Texturing) |
- |
- |
√ |
贴图取样器数量(# of texture samplers) |
- |
- |
4 |
几何引证(Geometry Instancing Support) |
- |
- |
√ |
在DX9.0C的Vertex Shader3.0中,除了拥有VS2.0版本中的所有特性外,还引入了无限长度顶点处理、Vertex Texure读取和动态程序流程分支控制功能。其中无限长度顶点处理,无疑是具有革命性的,这样的设计,可以大大方便程序员的开发,同时还能够使程序员们有更多的想象空间,来设计他们的程序。在运行方面,系统也可以不必把大量的资源,用于转换读取各个独立的程序,从而大大的提高了其运行效率。而动态程序流程分支控制功能也被VS2.0A引入了进来。
虽然X800在接口函数上输给了NV40,但是它有着在硬件方面的优势。频率在实际的处理当中,仍然会起到关键的作用。而且在分配流程方面,X800的效率也是非常之高的。