打印

[体系架构] 【入门教学】R6XX:失落的背后

本主题由 VivaLinux 于 2008-10-9 01:16 设置高亮

【入门教学】R6XX:失落的背后

R6XX vs G8X

已经属于可以盖棺定论的时间

ATi的R300和R580都是非常优秀的架构,现在因为轻敌自大(每次都是产品还在火星,牛皮已经响彻地球了),一再陷入被动,真是非常讽刺



R600其实就是C1的US单元+R580的极线程调度架构,加上一些ATi惯有的强项,如各种HSR,Z和color优化等带宽优化技术,然后再放大。不过后来碰到G80的MIMD,标量化,ATI宣传上挂不住了,才提出VLIW。实际上这种东西根本没必要提上台面来讲的,开发人员指导就行。

比较尴尬的事,R600作为GPU,一个生命周期如此短暂的硬件,居然把全部的宝都押到软件上,活脱脱一个NV30再世。更有意思的是,NV30就是VLIW的,而Radeon HD 2900正好是GeForce Fx 5800的一半,2900×2=5800嘛,实在是讽刺得很

G80的前身NV50在02年就开始架构论证,着色器频率异步,Gigathread+Shaerdmemory,标量化执行单元,每个词组说出来都不超过30个字节,谁都会说。但要做出来,而且是在现有工艺下做出来,就没有说那么简单了。所以NV50(G80)是NV卧薪尝胆5年的作品,整个架构取得胜利算是表现正常


R600/G80的数据各大网站都有,不再赘述,下面只是简单讨论下双方设计上的一些不足


G80方面:

1.根本就没有Tessellator这个功能,如果程序为N-patch等固定功能优化,G80就只能用GS跑,速度慢10倍都有可能

2.GS的output功能较废,限制很大,根据Humus的测试,GS吞吐负载增加到一定程度,G80的GS性能会呈指数幂下降

3.MIMD+Shardememoey的体系造成晶体管占用过多,扩展规模困难,NV放弃G90走G92*2的路线很大程度就是因为这个




R600:

1.设计思想还是古老的提升ILP(Instruction Level Parallelism,指令间并行度),包括整个VLIW编译器,以及极线程分配器,都是为提升ILP服务的,而G80基本放弃了提升ILP的概念,G80的底层设计思想基于更高级别的提升TLP(Thread Level Parallelism,线程级并行度),不是一个档次上的

2.US架构过于死板,64个5D ALU一共分成4个SIMD Array,然后通过8个Arbiter交替给每个SIMD递交/仲裁线程,相比G80的TPC-->Streaming Multicropessor-->SP,期间通过Reg file和Shared memory组成crossbar的网格流处理阵列概念来看,也根本不是一个档次上的

3.纹理单元性能偏弱。R600的4个纹理单元按G80的标准算,只相当于16个TMU,而G80的纹理单元在做纹理拾取动作的时候,相当于32个TMU,在做纹理过滤动作的时候,相当于64个TMU

4.低层执行单元是SIMD vs MIMD,这个也不多说了,已经讲烂,需要了解的朋友请以我的ID为关键字搜索GZ的帖子

5.为了一些无谓的东西付出重大代价,为了迎合DX10.1取样点可编程的要求,R6XX的ROP在做MSAA的时候,down-sampling(通过平均运算子采样得到的颜色来对单个象素进行着色)过程居然是软件实现的,要浪费Shader资源,加上现在得不到优化,延迟又高的ringbus总线,AA性能低于G8X很正常

6.最关键的,R600晚对手半年,却要弄一个跟对手完全不同,又急需优化的架构(R600的代码,G80根本就是通吃的,这点从目前几个XB360移植游戏就看出来了,即使不跑为NV优化的DX10模式,DX9模式下G80依然比R600快)

7.驱动严重拖后腿,BUG无数,R600发布的时候居然连3DMARK06都要加参数才能运行,HD2400发布的时候,我已经拿到卡,找遍了市面上的驱动却没有一款能识别它!驱动未好,卡先发布,ATI真是开了先例。后来进了ATI的FTP下了beta驱动才搞定,真是哭笑不得

[ 本帖最后由 来不及思考 于 2008-3-25 10:28 编辑 ]

TOP

对TESSALATION技术一直很是期待。但为何没有游戏公司推出用TESSALATION技术的PC游戏呢?难道除了A卡SHADER速度的瓶颈外TESSALATION技术还有其它的致命缺陷?

TOP

首先要弄清楚,TESSALATION只是GS的子集,TESSALATION能做的GS全部都可以做到

当然TESSALATION相当于硬件固化的单元,速度快一些

但是现在开发商90%都被NV控制....要他们去做一个NV不支持的技术,我想很难办到

TOP

G80不是MIMD架构

TOP

引用:
原帖由 Gfreeman 于 2007-12-16 22:50 发表
G80不是MIMD架构
首先,人们评价一款药好不好,一般是看疗效,所以我认为G80是什么架构都不要紧,您认为呢?

其次,G80力量的源泉是Gigathread,而不是什么标量化着色器


另:16D的SIMD Array,然后8-way MIMD,官方资料写得很清楚啊 我期待HPR推翻NV 官方文档的那一天,等了很久了,帮我催他一下

[ 本帖最后由 来不及思考 于 2007-12-16 23:44 编辑 ]

TOP

引用:
原帖由 来不及思考 于 2007-12-16 21:36 发表
首先要弄清楚,TESSALATION只是GS的子集,TESSALATION能做的GS全部都可以做到

当然TESSALATION相当于硬件固化的单元,速度快一些

但是现在开发商90%都被NV控制....要他们去做一个NV不支持的技术,我想很难办到 ...
用单靠GS速度慢得多吧?以现在硬件得性能,单靠GS而没有TESSALATION帮忙,CG级得PC游戏画面真的要10年后了(NV高层语)。MS呢?它不受NV控制吧?它为什么只在Xbox出了一个而不在PC出啊?

TOP

引用:
原帖由 来不及思考 于 2007-12-16 23:41 发表


首先,人们评价一款药好不好,一般是看疗效,所以我认为G80是什么架构都不要紧,您认为呢?

其次,G80力量的源泉是Gigathread,而不是什么标量化着色器


另:16D的SIMD Array,然后8-way MIMD,官方资料写得很清楚啊 我期待HPR推翻NV ...
作为一个病人,你可以只看疗效;但作为一个医生,你必须清楚每味药的脾性,你说是不是??!!所以在你的处方里必须把话说清楚,否则医疗责任谁来承担???!!!

TOP

引用:
原帖由 Gfreeman 于 2007-12-17 17:12 发表



作为一个病人,你可以只看疗效;但作为一个医生,你必须清楚每味药的脾性,你说是不是??!!所以在你的处方里必须把话说清楚,否则医疗责任谁来承担???!!! ...
老兄你扯远了吧

TOP

引用:
原帖由 Gfreeman 于 2007-12-16 22:50 发表
G80不是MIMD架构
SP array是SIMD、TPC彼此之間是MIMD....這點我是覺得沒有什麼問題,因為Texture和cache都是各個TPC自備的,除了UMA之外這些TPC本身視為單一node應該沒有問題。

TOP

amd能否借助制程上的优势(甚至两打一,四打二)赶超呢?

TOP

amd 需要加油啊

TOP

这种文看起来长知识

TOP