上面说到了Tualatin Pentium III是P6体系的末代皇帝(尽管Pentium M在架构上也更靠近P6,但是毕竟是属于移动处理器,并不属于桌面处理器,所以我们在此略过),自然而然2000年发布的Pentium 4所给我们带来的是一个全新的架构了--Netburst。实际上,从命名方式我们也看能看点端倪来,至少我们不再看到像以前一样命名的Pentium IV,而是直接用阿拉伯数字的表示为新4代的奔腾处理器---Pentium 4

作为一款完全全新架构的处理器,Pentium 4固然很难从以前P6架构的Pentium,Pentium II,Pentium III中捞到什么现成的东西,Intel其实早在1998年就开始筹划Pentium 4的研发工作了。但由于这是一个创世代的伟大架构,于是在2000年11月20日才正式发布,事实证明这个Netburst的架构居然整整用到了现在,算起来已经是6年了,不知道明年是否会还有Pentium 4的踪影,这估计也是Intel寿命最长的架构之一了。
咱们先不讨论Netburst改进或者修改的地方,咱们先来看看当时的市场情况:当时消费者在评价整台计算机时,不是比谁的鼠标大,谁的音响响,或者是谁的硬盘转数更快,而只是以CPU为一个标准。奔腾的芯果然让拥有者感到自豪,那么接下来别人询问的就是:您的奔腾4,是几G的啊?毫无疑问,时钟频率,Giga-Hertz 数字游戏的量化似乎更让消费者明白的快些,Pentium 4的架构中,最显而眼见的就是CPU频率可以拉得非常高,倍儿有面子这可是老百姓都知道的。
好了,回到正题,Pentium 4的Netburst带来的改进仍然是十分大的:
1:较快的系统总线(Faster System Bus)
QDR技术这一设定一直延续到6年之后仍然使用,并且将在未来要利用一段时间,可见当时Netburst这一设计非常有前儋性。
Quad Pump总线系统的实际效果相当于总线工作频率是当前CPU外频的4倍(事实上是QDR技术在系统总线上同时传输4个不同的64位数据流达到了4倍速率),这种4倍速的比例能大幅增大前端总线的频宽而带来实际效能的提升,数据吞吐量明显增大,并且使得更高速的内存在组建DUAL channel时可以利用而FSB的传输率不成为瓶颈。一开始Pentium 4的外频只有100MHZ,而FSB却已经有了400MHZ,到了Netburst末期已经达到了可怕的1066MHZ.而Pentium III中外频和FSB的比例为1:1,如果想要提高FSB只能从外频下手,这对CPU和内存,以及主板北桥都是一个相当困难的问题,所以QDR的出现令当时出现的FSB瓶颈直到现在都不成大问题。
2:高级传输缓存(Advanced Transfer Cache)
与Pentium III的缓存机制有所不同,Intel把一级缓存的数据缓存(I-Cache)和指令缓存(D-Cache)分开,把(I-Cache)剥离出来,单独形成Trace Cache(追踪缓存)。它的容量只有21KB,位于指令解码器和内核第一级计算流水线之间,作用是存储指令解码器产生的微操作,以备流水线出现分支预测出错时直接调用,无须要求解码单元再次捕捉相同指令并加以解码。这种结构的使用很大程度上降低了分支预测出错对CPU的威胁,称得上是一个成功的设计

3:高级动态执行(Advanced Dynamic Execution) (包含执行追踪缓存Execution Trace Cache、高级分支预测 Enhanced Branch Prediction)
在分支预测的改进方面。首先是增加了TLB(变换索引缓冲区)的入口数量,因为CPU要读取内存时要从TLB中调用虚拟地址到物理地址的映射,而且调用的命中率几乎在99%以上,Prescott具有128个TLB缓冲,是Northwood的2倍。随后又增加了ITC(指令追踪缓存),Prescott比Northwood多30%的ITC面积,可以追踪多达4096条虚拟地址,又是Northwood的2倍。在FBTB(前端分支目标缓冲)方面,精确到了4路48bit,而Northwood则是4路32bit。而且Prescott的FBTB还可以包含预测信息,每一个信息都可以用2bit的位宽维持16个双峰计算结果。这2bit可以表示为:0=不被采纳,1=大概不被采纳,2=或许被采纳,3=被采纳。这是一种相当先进的预测信息。在总体地址线上Prescott使用了48bit虚拟地址,因为在内存管理中,虚拟地址可以表示比物理地址更为宽广的范围,这个位宽已与当时最先进的AMD K8核心相同。所有这些都是在核心上的重大改进,它们共同协作帮助Pentium 4增加分支预测的准确性