快讯

真DX11架构 Tessellation技术深度解析

2010-07-29 00:06  出处:PConline原创  作者:XP   责任编辑:liujie 

第5页:[第二章]从架构谈起,A/N设计对比

    虽然微软在DX11当中已经明确了Tessellation的执行流程,但是对于核心架构设计方面,还是需要ATI与NVIDIA方面的自行设计。ATI与NVIDIA在历代产品当中的核心架构设计上都存在不同的设计方向,此次DX11产品同样如此。

◆ ATI——架构简单,推出迅速

    早在2009年9月份就已经亮相的Radeon HD 5870当中,就包含了ATI的首款DX11显示核心——Cypress(RV870,官方正式代号为Cypress)。Cypress核心可以看到两组SIMD阵列呈对称型排列,其中每组阵列当中均有800个流处理单元设计。在单一SIMD引擎当中,ATI采用的排列方式依然是RV770的设计方式。也就是说,每个SIMD阵列当中包含10组SIMD阵列,而每个SIMD阵列当中又包含16个流处理器,每个流处理器包含5个流处理单元,因此总计1600个流处理单元。两者通过相同的高速数据总线与L2 Cache相连,同时也连通到Global Data Share上进行数据共享。

1

 

    从上面的架构图可以看出,Cypress更像是两个RV770核心的合体,而对于DX11技术的升级,主要集中在Graphics Engine当中。这样的设计方式,无疑更加简单,对于ATI的研发周期来说也会大幅缩短,这也是为何ATI的DX11产品会如此之早就能发布的一个重要原因。

◆ NVIDIA——架构复杂,研发较慢

    接下来再来看看NVIDIA方面。NVIDIA为了让Tessellation能够实现更好的效果,在GPU架构方面进行了大幅度的改进。从下面的架构图可以看出,GF100核心主要划分为Host Interface(主接口,负责PCI-E通讯传输,包括读取CPU指令等)、GigaThread Engine(主线程调度引擎)、4组Graphics Processing Clusters(后文简称GPC,图形处理集群,GPU的核心部分)、6组Memory Controller(显存控制器,每组显存控制器位宽为64bit,总位宽384bit)、L2 Cache(二级缓存,容量为768KB)、6组ROP单元(每组包含8个ROP,共48个)。

2

 

在GF100核心架构当中,我们并不会看到ATI的Cypress核心当中独立设计的Graphics Engine,那么GF100的Tessellation单元又在哪里?实际上,每组GPC当中的SM当中,NVIDIA都加入了一组PolyMorph Engine(多形体引擎)。而PolyMorph Engine则正是Tessellation的核心部分,并且,NVIDIA为了保证光栅单元的效能,在每个GPC中均设有一个光栅引擎(也就是四组PolyMorph引擎共用)。那么,实际上NVIDIA的GF100相当于拥有了一共多达16个PolyMorph Engine,虽然无法直接与ATI的Graphics Engine划等号,但是性能方面绝对要更具优势。带来的负面问题就是NVIDIA首款DX11显卡的延期。

 


 

    对于Tessellation方面来说,ATI以及NVIDIA可以说拥有了两种截然相反的态度:前者更追求产品的研发速度,而后者更追求产品的性能表现。那么不同的态度带来了怎样的产品?在我们之前的两篇重量级评测当中已经为大家详细介绍过了,本文当中将会着重二者的Tessellation方面的设计进行详细介绍。

键盘也能翻页,试试“← →”键
IT热词搜索 来源:360新闻