成都站	首页 > 今日报价 > 成都今日报价 > 成都今日行情 > 厂商动态--成都 > 正文	世界杯

拒绝假DX11 GPU进入流处理集群时代

2010-07-29 00:06 出处：PConline原创 作者：XP 责任编辑：liujie

2010年3月27日NVIDIA正式发布首款DX11显卡--基于GF100架构的GTX400系列产品：GTX480、GTX470。这款产品凝结了NVIDIA工程师的心血。以及融入了多项全新技术，因此从首测上可以了解到其拥有大幅性能提升。究竟其架构相比起ATi同级显卡来说又有怎么样的差别？

　　此前NVIDIA已经为你带来GTX480的性能测试《NV首款DX11卡王诞生 GTX480全国首测》。仅仅拥有480个流处理器的GTX480为什么会比1600个流处理器的HD5870快？为什么在DX11架构的游戏中，GTX400较之HD5870有更好的游戏效能？

　　带着这些种种疑问，NVIDIA将为你解答这一系列的问题。先来了解一下GF100的架构构成：

　　GPU流式多处理技术：

　　GF100专为提供顶级游戏性能而设计。GF100基于Fermi的第三代流式多处理器（SM）架构，其CUDA核心数量高达上一代架构的两倍。几何学流水线得到了大幅改进，几何学着色、流式输出以及剔除的性能均实现了大幅提升。每个ROP（渲染输出）分区的ROP单元的数量翻了一番，填充率也得到了极大的提高，从而能够轻松驱动多台显示器。通过增强型ROP压缩，8倍速多重采样抗锯齿（MSAA）的性能得到了大幅提高。即使是对于不能压缩的场景部分，附加的ROP单元也能够更好地平衡整体GPU吞吐量。

　　GF100可根据八个多重采样以及24个覆盖采样来实现全新的32倍速覆盖采样抗锯齿（CSAA）模式。NVIDIA还对CSAA进行了扩展，使其能够在所有样本上支持“透明至覆盖”（Alpha-to-Coverage），从而让叶子与透明纹理的渲染变得更加流畅。无论是多边形边缘还是透明纹理（Alpha Texture），GF100都能够以最小的性能损失为其生成最高质量的抗锯齿效果。硬件加速的DirectX 11四偏置点（Four-offset）Gather4大大提升了阴影贴图性能。GF100整个图形流水线旨在为Tessellation（曲面细分）与几何学吞吐量提供极高的性能。凭借一款利用多个“PolyMorph引擎”所实现的全新分布式几何学处理架构，GF100在图形处理流水线的前端取代了传统的几何学处理架构。每一个PolyMorph引擎均包含一个Tessellation（曲面细分）单元、一个属性设置单元以及其它几何学处理单元。每一个流式多处理器（SM）均拥有自己专用的PolyMorph引擎（在后面章节中，NVIDIA将提供有关GF100架构中Polymorph引擎的更多详细信息）。新生成的基元被四个并行工作的Raster引擎（相比之下，上一代GPU中只有一个Raster引擎）转化为像素。片上一级以及二级高速缓存能够实现SM与Tessellation（曲面细分）单元之间或不同SM之间基元属性的高带宽传输。在GF100上，Tessellation（曲面细分）及其所有支持步骤均能够并行地运行，从而能够在几何学吞吐量上实现巨大突破。