我们常用的电脑看到CPU一般都有I3、I5、I7,那么什么是酷睿I7处理器,i7处理器怎么样?酷睿i7是一款45纳米四核处理器,配有8MB三级高速缓存和三通道DDR3内存。处理器采用LGA 1366引脚设计,支持第二代超线程技术,即处理器可以运行八个线程。根据网上流传的测试,同频酷睿i7的性能远高于酷睿2四核。基于全新Nehalem架构的新一代台式机处理器将沿用“酷睿”的名称,命名为“英特尔酷睿i7”系列,至尊版的名称为“英特尔酷睿i7至尊”系列。

i7处理器和之前的处理器相比怎么样?1、更新过程。理论上,制造工艺的改进可以降低功耗,使产品的默认时钟频率更高,直接提升性能。同时,如果在更新制造工艺的同时,对微观架构稍作调整,产品的性能也会得到提升。2、更新微架构。从奔腾4时代的NetBurst转战Core架构的英特尔,一举击败K8架构,帮助英特尔夺回了性能的宝座。虽然Core i7的品牌名称仍然是Core,但是产品的架构已经从Core更新为Nehalem,仍然采用高k材料设计的45nm工艺制造,性能值得期待。

LGA 775散热器的管脚由Intel“9”系列主板芯片组换来,CPU管脚移植到主板上。采用触点封装的LGA 775处理器可以有效避免运输过程中的损坏。核心架构发布后,一直延续这种封装方式,所有Core 2处理器也采用LGA 775,完全兼容上一代的奔腾D接口。不过在Nehalem架构中,虽然也延续了触点封装,但是产品的管脚改为了LGA 1366和LGA 1160(不久前传闻改为LGA 1156),LGA 1366的处理器面积由原来的37.5mm*37.5mm增加到42.5 mm * 45 mm,代号为Bloomfield的四核酷睿i7处理器的所有产品都将封装在LGA 1366中而面向主流市场的桌面四核处理器Lynnfield和Cleaksfield将采用LGA 1160(或LGA 1156),未来集成GPU功能的代号为Havendale的桌面双核产品将在稍后发布。 它也封装在LGA 1160中,但接口定义可能与Lynnfield有些不同,因此相关主板可能不兼容。采用LGA 1366和LGA 1160(LGA 1156)的接口后,主板的孔距直接增大到80mm和75mm,所以LGA 775平台的散热器不兼容最新的平台。虽然这种设计给主板和散热器厂商带来了一些麻烦,但是通过接口的差异化设计,英特尔直接将顶级玩家和主流用户区分开来,一定程度上有助于针对性的后续服务。

为什么只有133外频?QPI巴士取代FSB。由于新的微架构设计,Core i7的规格有了很大的变化。首批上市的机型中最高端的至尊965主频为3.2GHz,与上一代QX9770相同,但采用了133MHz*24低外频高倍频的设计,与QX9770 400MHz*8的方式完全不同。我们知道,英特尔奔腾4、酷睿2处理器非常依赖处理器的外部频率。为什么这款旗舰产品的外接频率只有133MHz?因为Nehalem架构采用了全新的QPI总线。随着处理器内核数量的增加,继续共用一条FSB总线显然是不够的。为了改变FSB的瓶颈,英特尔Nehalem架构采用了一种类似于Hyper-Transport总线的新型数据传输总线快速路径互联,使其可以直接与内存交换数据。QPI总线的连接方式更加灵活,它可以将处理器的每个内核分成独立的小块,每个内核也可以通过QPI总线连接。根据市场定位,QPI公交车的数量将有所调整。目前桌面CPU只有一条QPI总线,但服务器级别的Nehalem处理器将配备两条甚至四条QPI连接,因此QPI总线的引入大大增强了英特尔在服务器领域的竞争力。与竞争对手相比,英特尔台式机处理器的QPI总线频率最高可达6.4GT/s,甚至非旗舰的酷睿i7 920和940也有4.8 gt/s的频率.每个方向的QPI位宽可以是5、10、20bit,因此每个方向的QPI连接宽度可以提供12-16GB/s的带宽,这样一个QPI连接的带宽可以达到24-32 GB/s,第一批Nehalem处理器使用的连接位宽为20bit,提供的数据传输能力约为25.6GB/s,理论上超过了竞争对手采用的HyperTransport 3.0。QPI总线的引入,也让英特尔能够更加保守地设置处理器外接频率,给玩家留下了巨大的超频空间,因为一旦采用高倍频设置,即使是很小的外接频率提升,也会让CPU时钟频率飞跃!

CPU直接控制峰值内存带宽32GB/s说到QPI总线,就不得不说一下Nehalem处理器的内存控制器。集成内存控制器(Integrated memory controller,简称IMC),由于Core i7直接通过QPI与内存交换数据,所以需要在CPU内部集成一个部门来控制内存。第一批酷睿i7内存控制器支持3通道DDR3内存规格,完全抛弃了DDR2。它的三通道内存默认运行在DDR3-1066中,也可以轻松运行在DDR3-1333中,达到32 GB/s的峰值带宽,通过内存控制器的设计,Nehalem处理器达到了Core 2处理器内存带宽的4倍,这样每个内核最多可以支持10个未解决的数据缓存命中故障,总共16个命中故障,远高于Core 2的单核8个,总共14个。内存控制器和QPI总线的结合大大降低了数据延迟,直接表现在我们运行大型软件或者大型3D游戏时,数据加载时间大大减少,这对于无法忍受长时间数据加载的玩家来说,确实是一个好消息。此外,值得一提的是,虽然酷睿i7处理器是集成的3通道DDR3内存控制器,但这并不意味着我们必须匹配3或6个内存才能形成3通道系统来发挥其威力。采用2个内存的测试表明,酷睿i7采用2个内存就可以启动双通道模式,虽然在内存带宽上与3通道相比有一定差距。值得一提的是,目前的32位操作系统并不支持4GB内存,而在2GB内存已经成为主流的情况下,英特尔推出3通道规格确实是符合现实的。由3块1GB内存组成的3通道内存系统正好可以提高整个平台的内存效率。

8MB三级高速缓存引入酷睿i7高速缓存架构。与之前的奔腾4、酷睿2产品相比,非Nehalem处理器的缓存架构也有了很大的变化。随着45纳米工艺的推出,酷睿2处理器的最大L2缓存达到了12MB,与FSB差不多。继续无休止地改进L2缓存可能不会带来明显的性能提升,所以我们在Core i7上看到了一个全新的缓存架构。从Core i7的缓存架构示意图可以看出,它选择共享L3缓存来临时存储数据。采用台式机四核处理器的产品使用8MB三级高速缓存。除了共享8MB三级高速缓存,每个内核还拥有独立的256KB L2高速缓存,每个内核还配备了64KB L1高速缓存,这与内核架构非常相似。这里必须提到缓存延迟问题。45纳米酷睿2处理器的L2缓存延迟周期为15,而英特尔工程师表示Nehalem架构的L3缓存可以达到30-40个周期,但一般每个内核独立拥有的L2缓存周期只有12,因此L3带来的高延迟问题在一定程度上被L2所补偿。另一方面,四核共享L3缓存,数据命中失败后,可以直接再次从内存中寻找数据,而不是在缓存中重新检测。英特尔在Nehalem智能缓存上调用L3缓存,一定是出于这些原因。

加入SSE4.2指令集,办公性能大幅提升45纳米,加入SSE4.1指令集,处理器多媒体处理能力提升高达70%。在Nehalem架构的Core i7处理器中,引入了SSE4.2指令集,增加了STTNI (string text new instruction)和ATA(application-oriented accelerator)两条优化指令。STTNI主要针对XML优化文档和数据处理,使其应用性能达到上一代产品的3.8倍。ATA主要是增加了CRC32计算校验码,另一方面允许POPCNT计算一个16/32/64位整数中有多少位是1。目前Intel C编译器10.x和微软Visual Studio 2008 VC都已经实现了对SSE4.2的支持,采用SSE4.2指令集的Nehalem Core i7处理器在办公应用中的性能将得到大幅提升。

重新启用超线程恐怖8线程设计Nehalem架构还重新启用了曾经应用于NetBurst的超线程技术,但它已被重命名为同步多线程(SMT)。我们知道NetBurst架构上的超线程技术仅限于FSB和内存传输数据带宽,实际性能提升可能并不明显,所以后来的Core 2处理器直接抛弃了超线程技术。然而,Nehalem架构在引入QPI和集成内存控制器后,直接带来了惊人的带宽。毫无疑问,重启同步多线程技术不用担心传输带宽带来的瓶颈。Nehalem架构中使用的同步多线程技术基于双向设计,即每个内核可以同时执行两个线程。在多任务的情况下可以有效提升性能,采用这种模拟逻辑运算核的成本肯定比直接增加一个物理运算核要低。英特尔表示,SMT技术可以在不明显增加能耗的情况下提升20-30%的性能。