Nehalem微处理器微架构如何工作

英特尔首席执行官保罗·欧德宁在新闻发布会上介绍Nehalem微处理器。查看更多计算机硬件图片
贾斯汀·沙利文/Getty Images

取数字二并将其加倍,得到四。再加倍,得到八。继续这种将前一个乘积加倍的趋势,在10轮内你将达到1,024。到20轮时你将达到1,048,576。这被称为指数增长。它是电子产品发展中最重要的概念之一背后的原理。

 

广告

1965年,英特尔联合创始人戈登·摩尔提出了一个观察,此后该观察指导了半导体行业的发展方向。摩尔指出,芯片上晶体管的密度每年翻一番。这意味着每12个月,芯片制造商都在寻找缩小晶体管尺寸的方法,以便将两倍数量的晶体管装入芯片基板上。

 

摩尔指出,芯片上晶体管的密度与芯片制造成本是紧密相连的。但媒体——以及几乎所有其他人——都抓住了微芯片行业正在以指数速度发展的想法。摩尔的观察和预测演变成了我们称之为摩尔定律的概念。

 

多年来,人们对摩尔定律进行了修改,以适应芯片开发的参数。曾几何时,芯片上晶体管数量翻倍所需的时间间隔增加到18个月。如今,这个时间更像是两年。考虑到当今顶级的微处理器在单个芯片上包含超过十亿个晶体管,这仍然是一个令人印象深刻的成就。

 

­看待摩尔定律的另一种方式是,微芯片的处理能力每两年翻一番。这几乎等同于说晶体管数量翻倍——微处理器从晶体管中获取处理能力。但提升处理器能力的另一种方法是寻找新的芯片设计方式,使其更高效。

 

­这让我们回到了英特尔。英特尔的理念是遵循“嘀嗒”策略。“嘀”指的是创造新的方法来制造更小的晶体管。“嗒”指的是最大化微处理器的能力和速度。截至本文撰写之时,最近上市的英特尔“嘀”芯片是Penryn芯片,其晶体管尺寸达到45纳米。纳米是米的十亿分之一——从恰当的角度来看,一根普通人头发的直径约为100,000纳米。

 

那么,“嗒”是什么呢?那就是英特尔的新款Core i7微处理器。它拥有与Penryn相同尺寸的晶体管,但采用了英特尔新的Nehalem微架构来提升功率和速度。通过遵循这种“嘀嗒”哲学,英特尔希望在未来几年内继续实现摩尔定律的预期。

 

Nehalem微处理器如何使用与Penryn相同尺寸的晶体管却能获得更好的结果?让我们仔细看看这款微处理器。

广告

Nehalem 架构

英特尔联合创始人戈登·摩尔,因摩尔定律而闻名。
贾斯汀·沙利文/Getty Images

你可以将Nehalem微处理器看作一个拥有两个主要部分的芯片:一个核心,以及周围被称为非核心的组件。微处理器的核心包含以下元素:

  • 处理器,负责实际的数字运算。这可以包括从简单的加减数学运算到更复杂的函数。
  • 一个专门用于乱序调度和退役逻辑的部分。换句话说,这部分允许微处理器以最快的任何顺序处理指令,使其更高效。
  • 缓存内存占据了微处理器核心大约三分之一的空间。缓存允许微处理器将信息临时存储在芯片本身上,减少了从计算机其他部分获取信息的需要。核心中有两个缓存内存部分。
  • 核心上的分支预测部分允许微处理器根据之前的输入预测功能。通过预测功能,微处理器可以更高效地工作。如果预测结果错误,芯片可以停止工作并 更改功能。
  • 核心的其余部分负责指令排序、信息解码和数据组织。

非核心部分在L3缓存中包含额外的8兆字节内存。L3缓存不在核心中的原因是Nehalem微处理器具有可扩展性和模块化。这意味着英特尔可以制造具有多个核心的芯片。所有核心共享相同的L3内存缓存。这意味着多个核心可以同时处理相同的信息。

广告

为什么要创建可扩展的微处理器?这是一个解决棘手问题的优雅方案——在不必重新发明处理器本身的情况下构建更强的处理能力。在某种程度上,这就像将多节电池串联起来。英特尔计划推出双核、四核和八核配置的Nehalem微处理器。双核处理器适用于智能手机等小型设备。你更有可能在台式机或笔记本电脑中找到四核处理器。英特尔为服务器等处理繁重工作负载的机器设计了八核处理器。

英特尔表示将提供在非核心中集成图形处理单元(GPU)的Nehalem微处理器。该GPU的功能将与专用显卡大体相同。

接下来,我们将看看Nehalem传输信息的方式。

广告

Nehalem 与 QuickPath

英特尔使用Nehalem微架构构建了Core i7芯片系列。
图片来源:英特尔

据英特尔称,Nehalem微架构使用该公司称之为QuickPath的系统。QuickPath涵盖了处理器、内存和其他组件之间的连接。

在较旧的英特尔微处理器中,命令通过输入/输出I/O控制器进入中央内存控制器。内存控制器联系处理器,处理器可能会请求数据。内存控制器从内存存储中检索这些数据并将其发送给处理器。处理器根据这些数据进行计算,并通过内存控制器将结果发送回I/O控制器。随着微处理器在单个芯片上拥有多个处理器变得更加复杂,这种模型变得效率低下。

广告

使用旧微架构时,英特尔芯片的内存带宽高达每秒21千兆字节。QuickPath连接性提高了内存带宽,允许每秒传输更多信息。

采用新技术的处理器分散了处理器和内存之间的通信。这意味着,不再是集中式内存控制器,而是每个处理器都有自己的内存控制器、专用内存和缓存。处理器直接与I/O控制器通信。命令从I/O控制器发送到处理器。由于每个处理器都有专用的内存控制器、内存和缓存,信息流更加自由。每个处理器可以以每秒32千兆字节的速度与其专用内存通信。

基于Nehalem的处理器之间还具有点对点互连。这意味着如果一个处理器需要访问另一个处理器缓存中的数据,它可以直接向相应的处理器发送请求并获得响应。每个互连内部都有独立的数据通路。数据可以同时双向流动,从而加快数据传输。多个处理器和I/O控制器之间的传输速度可达每秒25.6千兆字节。

(c) 2009 十万个为什么.com

QuickPath允许处理器在请求其他处理器信息时走捷径。想象一个拥有A、B、C和D处理器的四核微处理器。每个处理器之间都有连接。在旧架构中,如果处理器A需要D的信息,它会发送一个请求。D随后会向处理器B和C发送请求,以确保D拥有该数据的最新实例。B和C会将结果发送给D,然后D才能将信息发送回A。每一轮消息称为一个跳跃(hop)——这个例子有四个跳跃。

QuickPath跳过其中一个步骤。处理器A会将其初始请求——称为“窥探”(snoop)——发送给B、C和D,其中D被指定为响应方。处理器B和C会将数据发送给D。D随后将结果发送给A。这种方法跳过了一轮消息,因此只有三个跳跃。这看起来只是一个小小的改进,但在数十亿次计算中却能产生巨大的影响。

此外,如果其他处理器之一拥有A请求的信息,它可以直接将数据发送给A。这将跳跃次数减少到2次。QuickPath还将信息打包成更紧凑的有效载荷。

广告

Nehalem 分支与循环

移除了散热片(heatspreader)的Core i7芯片。
图片来源:英特尔

­在微处理器中,一切都运行在时钟周期上。时钟周期是一种衡量微处理器执行指令所需时间的方式。可以将其视为微处理器每秒可以执行的指令数量。时钟速度越快,微处理器每秒能够处理的指令就越多。

像Core i7这样的微处理器尝试提高效率的一种方法是根据旧指令预测未来的指令。这被称为分支预测。当分支预测成功时,微处理器能更高效地完成指令。但如果预测结果不准确,微处理器就必须进行补偿。这可能意味着浪费时钟周期,从而导致性能下降。

广告

Nehalem拥有两个分支目标缓冲区(BTB)。这些缓冲区为处理器加载指令,以预测处理器接下来需要什么。假设预测正确,处理器就不需要从计算机内存中调用信息。Nehalem的两个缓冲区允许它加载更多指令,从而在其中一组指令不正确时减少延迟时间。

另一个效率改进涉及软件循环。循环是软件在执行时重复的一串指令。它可能以规律的间隔出现,也可能间歇性出现。对于循环而言,分支预测变得不必要——特定循环的一个实例应该与所有其他实例以相同的方式执行。英特尔设计Nehalem芯片以识别循环并与处理其他指令不同地处理它们。

没有循环流检测的微处理器倾向于拥有一个硬件流水线,该流水线从分支预测器开始,然后转移到设计用于检索(或获取)指令、解码指令和执行指令的硬件。循环流检测可以识别重复的指令,从而绕过部分过程。

英特尔在其Penryn微处理器中使用了循环流检测。Penryn的循环流检测硬件位于旧微处理器的取指和解码组件之间。当Penryn芯片的检测器发现一个循环时,微处理器可以关闭分支预测和取指组件。这使得流水线更短。但Nehalem更进一步。Nehalem的循环流检测器位于流水线的末端。当它看到一个循环时,微处理器可以关闭除了循环流检测器之外的所有部分,循环流检测器会将适当的指令发送到缓冲区。

分支预测和循环流检测的改进都是英特尔“嗒”策略的一部分。Nehalem芯片中的晶体管尺寸与Penryn相同,但Nehalem的设计使硬件利用效率更高。

接下来,我们将看看Nehalem微处理器如何处理数据流。

广告

Nehalem 与多线程

采用Nehalem微架构的Core i7芯片背面。
图片来源:英特尔

随着软件应用程序变得越来越复杂,向处理器发送指令也变得复杂。简化该过程的一种方法是采用线程。线程从软件层面开始。程序员构建的应用程序中的指令可以被处理器分解成多个流或线程。处理器可以处理单独的指令线程,协同完成任务。在微处理器的世界中,这被称为并行性,因为多个处理器可以同时处理并行的数据线程。­

Nehalem的架构允许每个处理器同时处理两个线程。这意味着一个八核的Nehalem微处理器可以同时处理16个线程。这使得Nehalem微处理器能够更有效地处理复杂的指令。根据英特尔的说法,多线程能力比为微处理器添加更多处理核心更高效。Nehalem微处理器应该能够满足视频编辑程序或高端视频游戏等复杂软件的需求。

广告

多线程的另一个好处是处理器可以同时处理多个应用程序。这使得您可以在运行复杂程序的同时,在后台运行病毒扫描程序等其他应用程序。对于较旧的处理器,这些活动可能会导致计算机运行缓慢甚至崩溃。 

英特尔在Nehalem架构中融入了一项额外的技术,公司称之为睿频加速(turbo boost)。如果处理器在功耗、处理能力和温度水平方面低于其限制,它就可以提高其时钟频率。这使得活动处理器工作得更快。对于具有单线程的旧应用程序,芯片甚至可以进一步提高时钟速度

睿频加速功能是动态的——它会随着工作负载的增加而使Nehalem微处理器更努力地工作,前提是芯片在其操作参数范围内。当工作负载减少时,微处理器可以以其正常的时钟频率工作。由于微芯片具有监控系统,您无需担心芯片过热或超出其能力范围工作。当您对处理器没有高要求时,芯片会节省功耗。

如果Nehalem是英特尔最新的“嗒”,那么下一个“嘀”是什么?之后又会是什么?请在下一节中找到答案。

广告

英特尔的“嘀嗒”策略

英特尔执行副总裁肖恩·马洛尼在新闻发布会上使用触摸屏界面演示了Nehalem微架构的强大功能。
图片来源:英特尔

­

开发一款微处理器需要数年时间。尽管英特尔在2008年发布了Nehalem,但当时该项目已经进行了五年多。这意味着,即使人们正在等待已宣布的微芯片进入各种电子设备和计算机,像英特尔这样的制造商仍在致力于微处理器进化的下一步。如果他们想跟上摩尔定律,他们就必须这样做。

广告

英特尔的下一步是另一个“嘀”的开发。这意味着将晶体管尺寸缩小到32纳米宽。生产一个具有如此尺寸晶体管的微处理器是一项了不起的成就。但更艰巨的是,要找到一种高效、可靠且经济地批量生产数百万个具有如此微小晶体管的芯片的方法。

下一代英特尔芯片的代号是Westmere。Westmere将使用与Nehalem相同的微架构,但将采用32纳米晶体管。这意味着Westmere将比Nehalem更强大。但这并不意味着Westmere的架构最适合如此小尺寸晶体管的微处理器。这方面将由下一代“嗒”微处理器来实现。

而“嗒”已经有了一个名字:Sandy Bridge。Sandy Bridge微芯片将拥有针对32纳米晶体管优化的架构。我们可能还需要几年才能看到Sandy Bridge推向商业市场,但一旦上市,它很可能像今天的Nehalem一样具有革命性。

那之后英特尔会走向何方?这很难说。虽然晶体管已经缩小到十年前几乎无法想象的尺寸,但我们正接近触及一些可能阻碍快速发展的物理学基本定律。那是因为当你使用更小的材料时,你开始进入量子力学的领域。对于只熟悉经典物理学的人来说,量子力学的世界可能看起来很奇怪。粒子和能量的行为方式从经典角度来看似乎是反直觉的。

其中一种行为在微处理器方面尤其成问题:电子隧穿。通常,晶体管可以引导电子而没有太多泄漏风险。但随着势垒变得更薄,电子隧穿的可能性就越大。当一个电子遇到一个非常薄的势垒——宽度约为一纳米的量级——它即使电子的能量水平看起来太低而无法正常发生,也能从势垒的一侧穿透到另一侧。科学家将这种现象称为隧穿,尽管电子并未在势垒中形成物理孔洞。

这对微处理器来说是一个大问题。微处理器通过晶体管开关引导电子来工作。具有纳米级晶体管的微处理器已经必须处理一定程度的电子泄漏。泄漏会使微处理器效率降低。如果英特尔不大幅改变晶体管的设计方式,摩尔定律最终可能会变得毫无意义。

尽管如此,工程师们倾向于思考如何解决那些看似完全无法克服的问题。即使晶体管在一两代之后无法再缩小,这也不会是电子技术的终结。这可能只意味着我们的进步速度会比我们习惯的慢一些。

要了解更多关于微处理器和相关主题的信息,请查看下一页的链接。

广告

更多信息

相关十万个为什么文章

更多精彩链接

  • Broad, William J. “不可思议的微缩晶体管接近其最终极限:物理定律。”《纽约时报》。1997年2月4日。(2008年12月17日)http://query.nytimes.com/gst/fullpage.html?res=9D05E3DB113DF937A35751C0A961958260
  • Shimpi, Anand Lal. “Nehalem - 您需要了解的英特尔新架构的一切。”AnandTech。2008年11月3日。(2008年12月18日)http://www.anandtech.com/cpuchipsets/intel/showdoc.aspx?i=3382
  • 英特尔。“英特尔展示业界首款32纳米芯片和下一代Nehalem微处理器架构。”新闻稿。2007年9月18日。(2008年12月18日)http://files.shareholder.com/downloads/INTC/0x0x195268/08b27e4c-2406-4f37-b46d- 04ed46afdee9/INTC_News_2007_9_18_General.pdf
  • 英特尔。“先是“嘀”,然后是“嗒”:下一代英特尔微架构(Nehalem)。”白皮书。(2008年12月18日)http://www.intel.com/technology/architecture-silicon/next-gen/whitepaper.pdf
  • 英特尔。“架构与硅技术。”(2008年12月17日)http://www.intel.com/technology/architecture-silicon/index.htm
  • Flatow, Ira. “晶体管化!”PBS。1999。(2008年12月18日)http://www.pbs.org/transistor/index.html
  • 英特尔。“英特尔情况说明书。”(2008年12月18日)http://www.intel.com/pressroom/archive/releases/20080317fact.htm
  • 英特尔。“英特尔微架构(Nehalem)。”(2008年12月18日)http://www.intel.com/technology/architecture-silicon/next-gen/index.htm
  • 英特尔。“英特尔QuickPath技术。”(2008年12月18日)http://www.intel.com/technology/quickpath/index.htm

­

广告

加载中...