快讯

拒绝假DX11 GPU进入流处理集群时代

2010-07-29 00:06  出处:PConline原创  作者:XP   责任编辑:liujie 

2010年3月27日NVIDIA正式发布首款DX11显卡--基于GF100架构的GTX400系列产品:GTX480GTX470。这款产品凝结了NVIDIA工程师的心血。以及融入了多项全新技术,因此从首测上可以了解到其拥有大幅性能提升。究竟其架构相比起ATi同级显卡来说又有怎么样的差别?

  此前NVIDIA已经为你带来GTX480的性能测试《NV首款DX11卡王诞生 GTX480全国首测》。仅仅拥有480个流处理器的GTX480为什么会比1600个流处理器的HD5870快?为什么在DX11架构的游戏中,GTX400较之HD5870有更好的游戏效能?

  带着这些种种疑问,NVIDIA将为你解答这一系列的问题。先来了解一下GF100的架构构成:

  GPU流式多处理技术:

  GF100专为提供顶级游戏性能而设计。GF100基于Fermi的第三代流式多处理器(SM)架构,其CUDA核心数量高达上一代架构的两倍。几何学流水线得到了大幅改进,几何学着色、流式输出以及剔除的性能均实现了大幅提升。每个ROP(渲染输出)分区的ROP单元的数量翻了一番,填充率也得到了极大的提高,从而能够轻松驱动多台显示器。通过增强型ROP压缩,8倍速多重采样抗锯齿(MSAA)的性能得到了大幅提高。即使是对于不能压缩的场景部分,附加的ROP单元也能够更好地平衡整体GPU吞吐量。

  GF100可根据八个多重采样以及24个覆盖采样来实现全新的32倍速覆盖采样抗锯齿(CSAA)模式。NVIDIA还对CSAA进行了扩展,使其能够在所有样本上支持“透明至覆盖”(Alpha-to-Coverage),从而让叶子与透明纹理的渲染变得更加流畅。无论是多边形边缘还是透明纹理(Alpha Texture),GF100都能够以最小的性能损失为其生成最高质量的抗锯齿效果。硬件加速的DirectX 11四偏置点(Four-offset)Gather4大大提升了阴影贴图性能。GF100整个图形流水线旨在为Tessellation(曲面细分)与几何学吞吐量提供极高的性能。凭借一款利用多个“PolyMorph引擎”所实现的全新分布式几何学处理架构,GF100在图形处理流水线的前端取代了传统的几何学处理架构。每一个PolyMorph引擎均包含一个Tessellation(曲面细分)单元、一个属性设置单元以及其它几何学处理单元。每一个流式多处理器(SM)均拥有自己专用的PolyMorph引擎(在后面章节中,NVIDIA将提供有关GF100架构中Polymorph引擎的更多详细信息)。新生成的基元被四个并行工作的Raster引擎(相比之下,上一代GPU中只有一个Raster引擎)转化为像素。片上一级以及二级高速缓存能够实现SM与Tessellation(曲面细分)单元之间或不同SM之间基元属性的高带宽传输。在GF100上,Tessellation(曲面细分)及其所有支持步骤均能够并行地运行,从而能够在几何学吞吐量上实现巨大突破。

键盘也能翻页,试试“← →”键
IT热词搜索 来源:360新闻