第1页: 酷睿2移动版本,Intel后发制人 第2页: Core 2 Duo T7400和Turion 64 x2 TL-60 第3页: 测试软硬件平台、测试设定 第4页: 测试成绩:功耗和整机性能 第5页: 测试成绩:CPU、内存系统理论性能 第6页: 测试成绩:3D游戏和多种应用软件 & 总结展望
Intel的最新处理器架构-酷睿2(Core
2)不但先后在服务器/工作站、桌面领域攻城掠池,现在这个按部就班的统一处理器架构计划终于来到了移动平台。移动版本的酷睿2架构处理器和桌面版本使用统一系列的Core
2 Duo Txxxx样式命名,虽然在处理器架构方面Core 2可以看成是移动版本处理器Core一代的延续,在技术上的进步不如企业、桌面领域Core 2相对于Netburst跨越式增长的幅度大,但Core
2仍较Core在保持相当的功耗前提下有着20%的性能提升,Intel也自豪的向外界宣称:Core 2
Duo是世界上最好的移动处理器!
目前Intel发布了5款Core 2 Duo的移动版本处理器,它们分别是Core 2 Duo
T7600/T7400/T7200/T5600/T5500。
处理器型号
架构
频率
FSB 频率
L2 Cache
容量
核心数量
核心代号
VT
支持
EIST
支持
EM64T
支持
TDP
性能 / 空闲
T7600
Core 2
2.33 GHz
667 MHz
4MB
2
Merom
y
y
y
34W/20W
T7400
Core 2
2.16 GHz
667 MHz
4MB
2
Merom
y
y
y
34W/20W
T7200
Core 2
2.00 GHz
667 MHz
4MB
2
Merom
y
y
y
34W/20W
T5600
Core 2
1.83 GHz
667 MHz
2MB
2
Merom
y
y
y
34W/20W
T5500
Core 2
1.66 GHz
667 MHz
2MB
2
Merom
n
y
y
34W/20W
T2700
Core
2.33 GHz
667 MHz
2MB
2
Yonah
y
y
y
31W/13W
T2600
Core
2.16 GHz
667 MHz
2MB
2
Yonah
y
y
y
31W/13W
T2500
Core
2.00 GHz
667 MHz
2MB
2
Yonah
y
y
y
31W/13W
T2400
Core
1.83 GHz
667 MHz
2MB
2
Yonah
y
y
y
31W/13W
T2300
Core
1.66 GHz
667 MHz
2MB
2
Yonah
y
y
y
31W/13W
Core 2 Duo移动版本和Core Duo系列处理器清单
Core 2 Duo移动版本改进了Core
Duo不支持64位计算的缺点,并仅以稍稍超过2个季度的发布间隔就大幅度的提升了和上代产品比较的绝对性能。这些使得竞争对手AMD不久前发布的双核炫龙Turion
64 x2处理器短暂的规格优势瞬间消失,和Turion 64 x2相比,后发制人的酷睿2显然更具革命性,延续着Intel移动计算平台良好口碑,市场预期也更乐观。
理解Intel酷睿2处理器架构优势
移动版本的Core 2 Duo产品同样拥有酷睿2的革命性技术,其中用于改善处理器运行性能的包括:
英特尔宽位动态执行(Intel Wide Dynamic Execution) -- 动态执行包含多项技术(数据流分析、预测执行、乱序执行与超标量),这些技术最先出现在Intel
Pentium Pro、Pentium II和Pentium III处理器的P6微架构中。在NetBurst微体系架构中,英特尔推出了高级动态执行引擎,一个非常深、用以保持处理器执行单元不断执行指令的乱序预测执行引擎。该微体系结构还采用了增强的分支预测算法来减少分支出错的次数。
现在对于酷睿2微体系结构,宽区动态执行大幅增强了这一能力。它可以每个时钟周期获取、分配、执行和返回达4条完整的指令(三个简单x86指令解码器和一个复杂x86指令解码器);酷睿微体系结构的流水线级数也大大短于NetBurst微体系
架构,只有14级。
Intel在Pentium
M处理器中开始引入了微融合(micro-fusion)技术:微融合可以在解码期间将常用的指令对(如条件分支conditional
jump后的比较)融合为单个内部指令(微操作),这样2条程序指令就可以作为1个微操作执行,以减少处理器必须执行的整体工作量,增加了给定时间内可以运行的全部指令数量,或者减少了运行一定指令数量的时间。酷睿2微体系结构还包含增强的运算逻辑单元(ALU),以进一步支持微融合。它能够在单个周期内执行组合的指令对,从而使性能得到提升。x86程序指令(微操作)在送往处理器管道解码之前,会被细分为多个组成部分,即微操作。微操作融合将“融合”源自相同宏操作中的微操作,以减少需要执行的微操作数量。微操作数量的减少可使时序安排工作更加高效,从而实现更低的功率和更高的性能,这个技术被称作最新的宏融合(Macro-Fusion)。
英特尔高级智能高速缓存(Intel Advanced Smart Cache)-- 高级智能高速缓存是多核优化的高速缓存,可以通过增加双核处理器每个执行内核从性能更高、效率更高的高速缓存子系统中获取数据的可能性来提高性能。为了做到这一点,英特尔在两个内核之间共享了二级高速缓存。为了解该设计的优势,需要考虑到当前多数多核产品均不能在执行内核之间共享二级高速缓存。这意味着当两个执行内核需要相同的数据时,每个内核均得将其存储在自身的二级高速缓存中。通过英特尔共享的二级高速缓存,数据仅需存储在每个内核均可访问的同一个地方。这使高速缓存资源得到了更充分的利用。通过在每个内核之间共享二级高速缓存,高级智能高速缓存还可以让每个内核动态地利用高达100%的可用二级高速缓存。当一个内核只需要较少的高速缓存时,其它内核便可以增加其占用二级高速缓存的百分比,以减少高速缓存错误并提高性能。
英特尔智能内存访问(Intel Smart Memory Access)-- 英特尔智能内存访问可以提高系统的性能,因为它能够优化内存子系统对可用数据带宽的使用,并隐藏内存访问的延迟。该目标是为了确保能够尽快地使用数据,并使该数据尽可能地用于需要的地方,以将延迟最小化,从而提高效率和速度。
智能内存访问包含一项重要的被称作内存消歧的新能力,该能力提高了乱序处理的效率,因为它可以为执行内核提供内建的智能,以帮助其在执行完所有预先存储的指令前,预测性地载入指令即将需要执行的数据。为了解其工作原理,我们需要了解绝大多数乱序微处理器的情况。通常情况下,当乱序微处理器重新对指令进行排序时,它不能在存储前对载入数据进行重新编排,因为它不了解是否会破坏某些数据的位置关联性。但是在许多情况下,载入数据与之前的存储无关,完全可以提前载入,进而提高效率。问题在于如何确定哪些可以装载,哪些不可以装载。内存消歧使用特殊的智能算法来评估数据是否可以在存储之前进行装载。如果它智能地推测出可以装载,那么就可以将装载指令编排在存储指令之前,以实现可能性最高的指令级并行计算。如果预测性装载最终产生效力,处理器就可以少用一些时间进行等待,将更多的时间用来处理,从而加快执行速度并实现处理器资源的更高效利用。如果装载没有产生效果,内存消歧包含检测冲突的内建智能、可以重新装载正确的数据并重新执行指令。
除内存消歧外,智能内存访问还包含增强的预取器。预取器负责“预取”内存内容,并将其放入高速缓存中,以备读取。增加从高速缓存而非内存的装载量将缩短内存延迟并提高性能。为了让数据位于每个执行内核所需要的地方,酷睿2微体系结构为每个一级高速缓存和二级高速缓存均配置了两个预取器。这些预取器同时检测多个数据流和大跨度的存取类型。这样它们便可以在一级高速缓存中“及时”准备待执行的数据。二级高速缓存的预取器可以分析内核的访问情况,以确保二级高速缓存拥有未来可能需要的数据。
英特尔高级数字媒体增强(Intel Advanced Digital Media Boost)-- 高级数字媒体增强是一项可以显著提高执行SIMD流指令扩展(SSE)指令性能的特性。128位SIMD整数算法和128位SIMD双精度浮点操作减少了执行特定程序任务所需的全部指令数,将能够促使整体性能的增高。SSE指令可以让编程人员开发出混合集合数、单精度数、浮点数和整数的算法,以改进英特尔架构
,在许多前代处理器上,128位SSE、SSE2和SSE3指令在执行时均采用每2个时钟周期执行一条完整指令的不变速率,例如,一个周期执行下面的64位,下一周期执行上面的64位。高级数字媒体增强特性可以在一个时钟周期完成这些128位指令的执行,从而有效地将这些指令的执行速度提高一倍。通过增加每个周期处理的指令数量,酷睿微体系
结构的整体效率得到了进一步增强。在运行包括图形、视频和音频的诸多重要多媒体操作、以及处理其它使用SSE、SSE2和SSE3指令的数据集时,高级数字媒体增强的作用
尤为明显。
酷睿2处理器移动版本的功耗优势
首先这种新的处理器拥有其它Core2产品一样具有的英特尔智能功率能力(Intel Intelligent Power Capability)--
智能功率能力是一组旨在降低功耗和设计要求的能力,它可以管理所有处理器执行内核运行时的功耗。
它含有一项高级功率门控能力,该能力可以在仅需要的单独处理器逻辑子系统上运行极其高效的逻辑控制。此外,许多总线和阵列被分开,一些操作模式中的所需数据在不需要时可被变换为低功耗状态。过去,实现功率门控非常困难,因为在关闭电源和备份时会需要大量的功率,而且回升至全功率时,还需要保持系统的响应性。智能功率能力
解决了这些问题,使功耗在不影响响应性能的前提下得到显著降低。
酷睿2处理器移动版本同时也支持前代Core处理器具备的主要功率控制技术,这包括增强型深度休眠(Enhanced Deeper
Sleep),增强型深度C4休眠(Enhanced Deep C4 Sleep),EIST(Enhanced Intel SpeedStep
technology)等,这些技术能够实现诸如把Cache信息转存至内存、降低CPU核心电压并关闭Cache以及降低CPU倍频 以降低CPU运行频 率等功能,最大限度的把CPU闲置状态下的功耗降低以及节省电力。其中EIST配合Core
2移动版本特殊的外频 设定能够实现比桌面版本Core 2低得多的空闲功耗。
Core 2
Duo处理器的最低倍频为6,EIST技术即在处理器处于空闲状态时把倍频降低至处理器核心支持的最低倍频,无论是在企业、桌面版本还是移动版本都是如此,因此1333MHz
FSB的Xeon 5100系列和1066MHz的 Core 2 Duo桌面处理器因为外频较高,在EIST作用下的最低空闲频率也分别达到2GHz和1.6GHz,相应的电压供给基本和满载时保持不变,而Core
2 Duo移动版本的667MHz FSB则使得EIST作用下的空闲频率只有166*6的1GHz,此时的工作电压将从满载时的1.03V-1.30V降低至0.75V-0.95V,运行功耗远低于Core
2桌面版本。根据Intel的官方资料,目前发布的5款Core 2 Duo移动版本处理器TDP均为34W,略微超过上代移动处理器Core Duo
T2700/T2500/T2400/T2300的31W。
酷睿2处理器移动版本平台
在系统平台方面,目前的五款Core 2 Duo移动版本均以Socket
M(479pin)形式封装,现有的Napa移动计算平台在更新BIOS CPU微代码后可以完美支持,双核迅驰(Centrino
Duo)平台早先就在CPU供电模块中符合Core 2 Duo需要的VRM11规格,在TDP相差不大的前提下,现有的移动电脑系统设计和散热设计都能够支持把Core
Duo处理器直接升级到Core 2 Duo处理器。
正如我们所知道的,现有的Centrino Duo平台包括应用成熟的三个主要部分,Core/Core
2移动处理器、Mobile版本945 Express系列芯片组和Intel Pro系列的无线网络方案。
现有Napa平台笔记本产品的散热结构直接可以应用在升级至Core 2 Duo处理器之后