发信人: zhong_franky(锋*在水中央)
整理人: zyg(2001-12-14 10:59:10), 站内信件
|
★原文转载自Hardware版roadrunner的《最新的工作站应用领域的Athlon VS P4》★ 和以前不同的是, 不少软件都已经针对P4优化的新版本
资料来源Ace's Hardware
下文并非直接翻译, 是我的一些摘录而已, 另外在Lightwave的评测环节, 甚至有PowerPC G4的数据.
Maya 4: 渲染以下图片:
单位: 每小时渲染帧数(数值越高越好)
Dual Athlon MP 1800+ 52.9帧/小时
Dual Thunderbird 1400Mhz 46.1帧/小时
Dual Athlon MP 1200Mhz 44.4帧/小时
Dell Precision 530 (2x1.7 GHz Xeon) 44.4帧/小时
即使为P4优化过的软件. P4 1.7GXeon也只相当于Athlon MP 1.2G
3DMAX: 注意P4系统有两个成绩, 其中一个是旧版本的未为P4作优化的成绩, 另一个打了专门为P4优化的4.2.6 PATCH的成绩
场景一:3DSMAX Waterfall (Seconds: Lower is Better)
Dual Athlon MP 1800+ 125
Dual Athlon Thunderbird 1400 143
Dual Athlon MP 1200 160
Dual Xeon 1.7 GHz (Patch 4.2.6) 161
Dual Xeon 1.7 GHz 182
Athlon Thunderbird 1400 176
Single Athlon MP 1200 186
Pentium 4 1500 (Patch 4.2.6) 231
Pentium 4 1500 261
Dual Pentium III 800 275
为P4优化过的4.2.6版本, P4的成绩提高了13%, 可是还不足够和Athlon竞争
场景二:
3DSMAX Ape Animation (Seconds: Lower is Better)
Dual Athlon MP 1800+ 210
Dual Xeon 1.7 GHz (Patch 4.2.6) 221
Dual Athlon Thunderbird 1400 233
Dual Athlon 1200 258
Dual Xeon 1.7 GHz 282
Single Athlon 1400 361
Single Athlon 1200 405
Dual Pentium III 800 345
Pentium 4 1500 (Patch 4.2.6) 417
Pentium 4 1500 532
新版本为P4带来了27.5%的性能提升, 依然不是比它便宜得多的AthlonMP的对手, 但是已经相当另人眼前一亮. P4 1.5G开始逼近Athlon 1.2G的成绩
场景三: 渲染以下场景:
3DSMAX: Virtual Reality Architecture (Seconds)
Dual Athlon MP 1800+ 958
Dual Athlon 1200 MP 1179
Dual Athlon Thunderbird 1400 1054
Dual Xeon 1.7 GHz (Patch 4.2.6) 1540
Dual Xeon 1.7 GHz 1543
Single Athlon 1400 1740
Single Athlon 1200 1938
Dual Pentium III 800 1935
Pentium 4 1500 (Patch 4.2.6) 2906
Pentium 4 1500 2905
新版本几乎没有任何性能提高, 对于单CPU的P4 1.5G, 甚至更慢了, 这个场景显然是Athlon的天下
如果看过Tomshardware的网站, 就应该知道Lightwave 7.0b是P4的天下, 在Tomshardware的评测数据中, 即使P4 1.4G也能压倒AthlonXP 1900+(很恐怖吧)
下面看看P4在Lightwave的威力
渲染的是Lightwave 6.0/7.0中自带的Ray Trace Benchmark场景
Lightwave 6.5, 这是未为P4优化的版本, 可以预料Athlon将大胜P4.
Dual Athlon MP 1800+ 103秒
Dual Athlon 1400 115秒
Dual Athlon MP 1200 130秒
Dual Xeon 1.7 GHz 147秒
P4 1.7G不敌Athlon 1.2G, 这就是未为P4优化的结果.
轮到为P4优化过的7.0b版本的数据, 单位同样是秒
Dual Athlon MP 1800+ 102
Dual Athlon 1400 114
Dual Athlon MP 1200 130
Dual Xeon 2.0 GHz* 91
Dual Xeon 1.7 GHz 108
Dual Pentium III 1 GHz* 150
Dual PowerPC G4 800* 153
Athlon的性能原地不动, P4的性能大幅度提升36%, P4 2G的性能已经无可匹敌, 但是价格当然也是无可匹敌, 带*号的表示该数据并非由Ace's Hardware测试, 而是摘录自Lightwave的官方性能数据库. 可以看到许多网友迷信的PowerPC G4在3D领域并不能发挥它的能力.
根据Ace's Hardware网站的作者宣称, 虽然只测试了Raytrace的结果, 但是他们还测试过其他场景, P4的提高幅度甚至可以更高(39%-40%), 至于在Tomshardware评测中引用的SKULL_HEAD_NEWEST场景, 则是对P4最有利的一个场景, 在该场景中, P4 Xeon 1.7G比Athlon MP 1800+快将近30%!
Roadrunner注: 我在国外的一些论坛看到过关于P4在Lightwave 7.0b中表现为何如此恐怖的讨论, 其中一种观点就是: Lightwave使用了128位高精度浮点运算来渲染场景, 大家都知道, 目前X86平台没有任何CPU支持128位浮点运算, 最高只支持到80位. 要实现128位高精度浮点运算, CPU就要象我们人脑列竖式计算多位数运算一样, 把128位分解为2个64位数, 然后单独每个位进行运算, 并且用软件处理进位情况.
我在以前的帖子也提到过, P4利用它的SSE-2指令集, 可以让CPU同一周期内同时进行两个64位浮点精度的运算, 这个能力就相当适应Lightwave的软件需求, 使得P4可以充分发挥SSE-2的威力.
一般的其他3D软件, 使用的都是80位浮点精度, 80位浮点精度是Athlon的强项, P4在这方面毫无还手之力, 因为SSE-2只能对64位浮点精度加速, 所以, 我们可以这么说: 64位P4优胜, 80位Athlon优胜, 128位P4优胜, 采用哪种精度就是软件公司的决定, 很显然大部分的公司认为64位精度是不够的(不然Lightwave也不需要用到128位精度了), 80位精度对于Maya和3DSMAX这样正规的软件来说都认为是足够的, 而Lightwave采用128位当然会对质量有所提升,可是必然对性能的牺牲是巨大的, 一条128位加法需要转换为3条64位加法指令, 一条128位乘法指令需要转换为4条64位乘法和6条64位加法指令, 比起只用一条指令就可以完成的80位运算, 当然慢得太多了.
我个人觉得, Lightwave的这种做法使它难以在动画领域和其他3D软件竞争(性能落后), 在静态画面渲染上会有一定质量优势(在同样的算法的条件下), 当然, 画面质量除了看运算精度, 最决定性的因素还得看算法, Lightwave在算法上有没有质量优势, 那还是留给3D行家去判断, 假如你决定使用Lightwave, 那么P4就几乎是必然的选择.
后面的软件都没有注明是否为P4优化过, 我们可以假定它们都没有.
Cinema 4D 2000
得分越高越好
Dual Athlon MP 1800+ 35.84
Dual Athlon Tbird 1400 32.18
Dual Athlon MP 1200 28.26
Dual 1.7 GHz Xeon 28.6
Dual 1.4 GHz Xeon 23.16
Single Athlon MP 1200 16.61
Single 1.7 GHz Xeon 16.31
Single 1.4 GHz Xeon 13.43
不清楚这软件为P4优化过没有, 总之Athlon大胜.
True Space 4.2
Truespace Raytrace (Seconds: Lower is Better)
Dual Athlon MP 1800+ 75
Dual Athlon Tbird 1400 82
Dual Athlon 1200 MP 93
Dell Precision 530 (2x1.7 GHz Xeon) 121
Athlon MP 1800+ 127
Single Athlon 1400 136
Single Athlon MP 1200 157
Dual Pentium III 800 220
Pentium 4 1500 228
4.2版本相当旧, 没有利用SSE和3DNOW优化, 5.1版本为SSE和3DNOW优化过, 还没为SSE-2优化, 所以True Space还是Athlon的天下.
2D视频编辑软件
Adobe Premiere (Seconds: Lower is Better)
Dual Athlon MP 1800+ 50
Dual Athlon MP 1200 60
Dual Athlon Tbird 1400 61
Athlon MP 1200 82
Athlon 1400 84
Dual Xeon 1.7 GHz 110
Dual Pentium III 800 114
Pentium 4 1500 153
注意这里除了浮点运算起作用外, 指令分支预测也起巨大的作用, 有更优秀的指令分支预测能力的AthlonMP 1200Mhz, 比它上一代的Athlon 1400Mhz更快, 而指令预测则是P4的另一个致命软件, 20级流水线使P4在大量分支指令面前非常狼狈.
国际象棋: AI运算
国际象棋程序是纯整数程序, 程序大小460K, 可是使用到的内存高达150M, 考验CPU的CACHE处理能力当然还有指令分支预测能力(下棋当然要面对大量的条件判断指令)
Diep ChessBench (Nodes/Second 步数/秒)
Dual Athlon MP 1800+ 145927
Dual Athlon Tbird 1400 136687
Dual Athlon MP 1200 120709
Dual Xeon P4 1.7 GHz 106879
Athlon 1400 70184
Athlon MP 1200 62458
Single Xeon 1.7 GHz 54246
再次看到P4在条件判断方面的天生缺陷, Athlon MP 1.2G比P4 Xeon 1.7G快12%
原文还包括许多其他软件的测试,我只摘录下我感兴趣的部分, 不过可以告诉大家, Lightwave是P4唯一胜出的项目, 所以其他软件Athlon全胜
该评测证明: Athlon是最好的工作站平台的X86 CPU. 尤其是双Athlon威力无穷. |
|