论坛: 电脑门诊 标题: 雾里看花话pentium 4(转载) 复制本贴地址    
作者: qiuyuchen [qiuyuchen]       登录

    众所周知,在计算机行业中存在着一个“摩尔定律”,即在相同空间下的晶体管数量(晶体管数量越多,其芯片速度就越快、性能越强)每18到24个月会加倍。这条理论可以说十分准确,它推动着IT行业的更新换代,无情地淘汰着那些跟不上时代脚步被其竞争对手抛在身后的生产厂商(如:CPU有IDT、Cyrix,显卡有S3等老牌生产厂商)。命运似乎总爱和人们开玩笑,就在一年前还被认为不可战胜的Intel,现在也面临“摩尔定律”的巨大考验,CPU的霸主地位被其竞争对手AMD憾动。

    一、pentium 4的由来
    谈到Pentium 4的由来,我们要从Intel的老对手AMD说起。在早期X86架构的CPU中,许多用户关心的只是是否使用286、386或486的CPU,而绝少人去理会是否是Intel或AMD、Cyrix的产品。为杜绝这种现象,Intel于是注册了Pentium商标,并在以后的所有产品中均以此命名,希望以此来封杀其竞争对手,独霸CPU市场。Intel料想不到的是,AMD并没因此而没落。在成功地自行开发研制K5 CPU(K5系列CPU的频率一共有六种:75/90/100/120/133/166MHz,内部总线频率和Pentium差不多)之后一年,熟知“摩尔定律”的AMD又相继推出了K6(与同时代的Pentium Pro相比,K6的整数运算非常出色只是其浮点运算的能力稍逊一筹)与K7。特别是K7,除了比采用X86架构的P6内核具有更高的前端总线速度(EV6总线200MHz)外、它还具有更加优越的浮点运算性能,并且在与P6内核相同的制造工艺下,比Pentium Ⅲ更加容易实现更高的运行速度,一举摆脱了CPU领域小弟弟的地位。目前AMD已经轻松自如地同时在高、中、低三个X86战场推出了针对Intel的新一代0.18微米Athlon系列CPU,对Intel的霸主地位发起了全方位的挑战。面对着AMD咄咄逼人的攻势,按照“摩尔定律”法则,Intel继1996年成功地推出基于P6内核的X86 CPU后,本应在1998年推出的新一代CPU“Itanium”(P7)却因为种种技术方面的原因而不断推迟发表。于是,手足无措的Intel只能匆忙地不停提高仍是基于P6内核只是制造工艺及封装技术更为先进的Pentium Ⅲ的速度,来保住市场的份额。其疯狂推出的1.13GHz的PⅢ因为稳定性的原因而被迫回收,便是一个证明。
    正所谓瘦死的骆驼比马大,形势危急的Intel为扭转这种不利局面,在AMD的K7 Athlon风光了一年多后,正式推出自1995年以来首次经过全新设计的32位X86 CPU――Pentium 4,其研发代号为Willamette(见图1)。

    二、pentium 4的基本架构
    与采用32位(IA-32)P6内核的Pentium Ⅲ相比,Pentium 4具有如下特点:更高的取指令带宽;倍速的ALU算术逻辑单元,降低了响应时间;增加整数操作方面的性能;带有256KB一级缓存和1MB甚至更多的二级缓存;20级流水线为实现更高的时钟频率和性能提升带来了机会;SSE2指令级(Streaming SIMD Extension 2);高级动态执行,更深的指令流水线和缓存让乱序、搜索执行、更高级的分支预测功能等成为可能;跟踪执行缓存(Execution Trace Cache),用于存储预先解码的微指令;128位浮点装载、存储、执行单元。
    从Pentium 4的基本架构来看,它与P6内核的区别主要是提供了如下的功能:运行于两倍CPU频率的ALU、更深的流水线操作、追踪式高速缓冲(trace cache)、优化了的分支预测,还有一个带宽非常高的系统前端总线(见图2、3)。
    1. 追踪式高速缓冲
    追踪式高速缓冲(trace cache)是一种创新的一级指令缓冲(L1 Ca-che),用以存储按照动态执行顺序来排序的微操作序列,这种指令高速缓冲体系要比目前P6内核上的普通L1 Cache更为优越(P6内核的L1 Cache是按照静态程序序列来储存x86代码,而排序组织则是按照这些代码在存储器中的位置来直接进行定位的),这种彻底的变革减少了分支预测错误。除此以外,追踪式高速缓冲也可以让循环能够在硬件中直接执行。我们已经注意到Intel不再提一级指令缓存的说法。我们或许可以这么理解,要么指令来自全速运作的二级缓存,要么指令就在追踪式高速缓冲中直接执行。
    2. 更深的流水线
    流水线是现代CPU不可或缺的重要技术,但由它所引发的问题也显而易见。只要分支预测出错,整条流水线就不可避免地要停顿下来。流水线工位越多,相应做的无用工就越多,恢复时花费的时间也越长。而另一方面,当工位增多的时候,每工位所做任务就越单一。反之,较少流水线工位的CPU每工位要完成的任务就比较复杂。较低频率运行的时候,还不会怎样,但当时钟频率提升到一定的高度,则CPU无法达到要求。所以业界都不断寻找提升流水线效率的方法,找到流水线长度和效率之间的平衡点。
    Pentium 4的流水线拥有20个工位,是目前CPU中最长的。这要求Intel的工程师在分支预测表上花很多功夫来降低分支预测失败的机率。同时,前面已经提到的Trace Cache也能够帮助流水线在需要回到分支点的时候能够快速启动起来。这款CPU在较低频率的时候,可能并不能显示很大的优势。但如果继续向后发展到1.5GHz甚至更高频率则会发挥其巨大的优势(见图4)。
    3. Pentium 4的算术逻辑单元
    Pentium 4另一个重新设计的地方,就是它的算术逻辑单元(ALU)。ALU是CPU中的一个重要功能模块,ALU模块执行的操作主要包括了加、减以及把一个寄存器的值与某个位的内容进行“与”、“或”、“非”等这样的位逻辑运算。在大多数的CPU中,ALU被设定为每个周期执行一次运算。这主要是由附属于ALU的输入输出寄存器以及在ALU输入处插入旁路乘法器来决定的(见图5)。
    Pentium 4这种全新的设计体系中,虽然只有两条流水线,比Pentium Ⅲ拥有的三条超标量流水线要少,但很有特点的是,其执行和算术逻辑单元采用了一种被称之为Double Pumped的双重并发技术。每时钟周期之下ALU其实执行了两次,效率也相应提升一倍。理论上说,两个ALU在一个周期内,就可以执行4条指令。所以可以预见Pentium 4的整数处理能力会比Pentium Ⅲ有很大幅度的提高。过去AMD甚至Cyrix都一直嘲笑Intel的CPU在整数运算方面性能太差的问题彻底解决了。看来,这次Intel真的是下了苦功夫。
    快速的执行单元当然会有更高的数据带宽需求。正因为如此,Intel继续强化他们在缓存方面的优势。Pentium 4所带有的256KB一级缓存中,这种低延迟数据缓存占有一半,即128KB的容量。它读取数据的时候只有两个周期的延迟,比Pentium Ⅲ快了很多。
    4. Pentium 4的系统总线和内存带宽的问题
    我们知道,在采用GTL+总线架构的P6系列CPU中,其前端总线为100MHz时,CPU最大可以获得800Mbps带宽的数据,如果是133MHz,则带宽上升为1.06Gbps。当初AMD在研发Athlon的时候,为了获得更高的性能就采用了著名的EV6总线,但事实上这条大名鼎鼎的总线并没能发挥其出色性能,主要是因为现在的内存带宽限制了Athlon前端总线的优势。这一次,Pentium 4的前端总线更快,通过QDR(Quad Data Rate)技术,使系统总线在一个时钟周期内可以四次访问数据,于是即使总线实际只有100MHz的频率但拥有了400MHz的性能。QDR技术本身是很有特色和优势的,问题是它的推出是否会面临和Athlon 一样的问题?我觉得很可能Pentium 4也将面临没有合适的周边硬件支持,400MHz的前端总线则意味着需要有双通道的Rambus内存才能满足其旺盛的数据需求量。

    三、Pentium 4的市场前景
    在P6内核的Pentium Ⅲ苦苦支撑Intel危局的今时,Pentium 4的横空出世无疑为形势危急的Intel阵营稳定住了阵角。尽管它并不是一个众人期待的全新64位CPU,但是从其技术层面上看,Pentium 4的核心架构比起Coppermine Pentium Ⅲ有了长足的改进。它已不再只是在P6的基础上改进制造工艺或改进封装形式等部分改动,而这次则是对Intel P6内核的重新设计(号称P67)。它的出现将是AMD K7的重大威胁,在CPU的中高端市场中必将引发生死之争。但是,Pentium 4也有个致命的疑问。那就是现在连单通道的Rambus内存都不能普及的今天,过分依赖RDRAM很可能会造成Intel CPU在性能上十分优秀,但其价格却高居不下的尴尬局面。为使Pentium 4早日进入市场,因此Intel又公布了支持SDRAM的Pentium 4,可是这样一来,又严重制约了Pentium 4的优秀性能,远离了当初开发Pentium 4的初衷。哎!倒霉的Intel为什么总是深陷在RDRAM内存的泥潭里。  


地主 发表时间: 03/26 12:58

回复: mcse2000 [mcse2000]   副版主   登录
呵呵,我还是喜欢Rdram+p4的超级组合!

B1层 发表时间: 03/26 15:34

回复: guest_yang [guest_yang]   论坛用户   登录
唉,人的东东太长了,可不可以短点

B2层 发表时间: 03/27 02:39

回复: bedlamite [bedlamite]   版主   登录
高性能的东西太多,我的腰包总是跟不上。当初我的PIII733就花了1380元,现在还不如540元的新Celeron1G,“够用”原则也许是穷人的“阿Q精神”,看到单位新买的P4 1.6G不过用于打打文件,真的想给他来个偷梁换柱!哎,鲜花插在牛粪上!

B3层 发表时间: 03/27 12:59

论坛: 电脑门诊

20CN网络安全小组版权所有
Copyright © 2000-2010 20CN Security Group. All Rights Reserved.
论坛程序编写:NetDemon

粤ICP备05087286号