① 简述计算机cpu都有哪些新技术
未来的cpu预计会朝着多核、多通道、 集成内存、 集成显卡 、节能、 减小面积、 提高集成度、散热性更好、更满足消费者的需求等方向发展。
CPU是计算机系统的心脏,计算机特别是微机的快速发展过程,实质上是CPU从低级别向高级、从简单向复杂发展的过程。其设计、制造和处理技术的不断更新换代以及处理能力的不断增强。CPU 发展到今天已使微机在整体性能、处理速度、3D图形图像处理、多媒体信息处理及通信等诸多方面达到甚至超过了小型机。
新的通信、游戏及"寓教于乐"等应用程序要求具有视频、3D图形、动画、音频及虚
拟现实等多媒体功能,这些又对CPU提出了新的要求。Intel公司针对这些要求,继386处理
器结构之后提出了CPU的进一步最大升级,这就是将MMX(MutliMedia eXtention多媒体扩
展)技术融入Pentium CPU中。采用MMX技术的处理器在解决了多媒体及通信处理等问题的
同时,还能对其他的任务或应用程序应付自如。
MMX的主要技术特点有以下几点:
(1) 单指令、多数据(Single Instruction Mutli-Data,SIMD)技术是MMX的基础,它
使得多条信息可由一条单一指令来处理,它与IA(InstructionArchitecture)超标量体系
结构相结合,极大地增强了PC机平台的性能。MMX技术执行指令时是将8字节数据作为一个
包装的64位值进入CPU的,全部过程由一条指令立即处理。
(2) MMX指令不具有特许性,其通用性很强,不仅能满足建立在当前及未来算法上的P
C机应用程序的大部分需求,而且可用于编码译码器、算法及驱动程序等。
(3) IA MMX指令系统增加了4种新的数据类型,即紧缩字节(8bit×8bit)、紧缩字(4
bit×16bit)、紧缩双字(2bit×32bit)和四字(1bit×64bit)。其目的是紧缩定点整数,
将多个整数字组成一个单一的64位数据,从而使系统在同一时刻能够处理更多的数据。
(4) 增加了8个64位MMX寄存器,即浮点寄存器的别名映象。
(5) 新增加了57条指令。用这些指令完成音频、视频、图形图像数据处理,使多媒体
、通信处理能力得到大幅度提高。其数学及逻辑指令可支持不同的紧缩整数数据类型,对
于每一种得到支持的数据类型,这些指令都有一个不同的操作码。新的MMX技术指令采用
57个操作码完成,它涉及的功能领域有:基本的算术操作;比较操作;进行新数据类型间的
转换(紧缩数据及从小数据类型向大数据类型解压);逻辑操作;用于MMX寄存器之间的数据
转移(MOV)指令,或内存的64位、32位存取。
可以说09年的整个技术工艺的发展完全是在竞争下展开的。让我们回首一下本年度的技术发展,看一看09年都有哪些处理器技术最具影响力。
睿频技术
从08年11月酷睿i7 900系列处理器的上市开始,睿频技术就已经开始了他的推广,不过由于限定在了高端范围内,并没有使这项技术全面推广。从酷睿i7 900系列的市场占有率来看,Intel似乎对此也并不在意,毕竟酷睿i7 900系列产品的定位较高,因此试探性的测试了解的人数较少是可以理解的。
在今年的9月,Intel正式全球发布了面向主流市场的LGA1156接口酷睿i7/i5系列处理器,虽然在接口方面进行了从新设计,但是新发布的LGA1156接口酷睿i7/i5处理器提供了较为完整的酷睿i7 900系列处理器技术(超线程技术除外),其中就包括了睿频技术。从此,该项技术也正是开始了普及之路。
介绍一下什么是睿频技术,和睿频技术所带来的好处。
●动态超频,核心数量按需分配睿频技术简介
目前上市的所有Nehalem架构处理器都提供了睿频技术(英文为Turbo Boost Mode),该项技术的运用可以帮助处理器在空闲时期将整体功耗降低,从而达到节能的目的,但是节能并不是睿频技术的最大亮点,其最大的亮点就在于可以视平台运行状态而定,选择性的提高一个或多个核心的运行频率,从而做到提高工作效率且降低功耗的目的。
睿频技术可以提高一个或多个核心的频率
我们以大型3D游戏为例,某些游戏可能对主频更为敏感,多核心并不能带来明显的效能提升,对处理器进行超频反而效果更好,如果这个时候开启Turbo模式,并且将TDP设定在用户所采用的散热器允许范围内,那么CPU在这个时侯可以对某颗或某两颗核心进行动态超频来提升性能。
睿频技术让处理器超频智能化,自动化
实现Turbo技术需要在核心内部设计一个功率控制器,大约需要消耗100万个晶体管。但这个代价是值得的,因为在某些游戏中开启Turbo模式可以直接带来10%左右的性能提升,相当于将显卡提升一个档次。值得一提的是,Extreme版本的Core i7处理器最高可以将TDP在BIOS中设定到190W来执行Turbo模式,在个别应用中进一步提升CPU时钟频率,带来效能上的提升。目前,主流的酷睿i7 750处理器在开启该技术后,可在单线程任务是将一颗核心的主频提高至3.2GHz。想必这样高的主频运行单线程任务可以说易如反掌。
超线程技术
超线程,早在2002年Intel便已经推出了这一技术,并且广泛的在奔腾4处理器中大规模应用。采用了超线程技术的奔腾4处理器可以比原产品效能提升10%-15%左右,可见Intel对超线程技术的运用是信心满满的。
但是事实却出乎Intel的意料。首先是来自操作系统端的问题,当时微软已经发布了Windows 2000系统,然而该系统并没有加入对超线程技术的支持,虽然后来出现的Windows XP系统加入了对该技术的支持,但也最终因为应用软件端对超线程技术的优化较少而作罢。另一个问题是来自于Intel自身的奔腾4处理器。基于NetBurst架构的奔腾4处理器由于过分的追求高主频加长了流水线设计,这导致了处理器的主频虽然达到了3GHz以上,却并没有提供3GHz主频相等的性能。由于过高的流水线已经造成数据运算错误率提高,在加上超线程技术的双核模拟容易让CPU在运算时命中失败,且对带宽的惊人需求。超线程技术不但没为处理器带来更高的执行效率,反而在某些情况下降低了奔腾4处理器的性能。所以说超线程技术虽然是一个非常先进且使用的概念,但在那个时代并不适合。
早在奔腾4时代Intel就加入了HT超线程技术
进入酷睿2时代后,由于内存带宽没有获得突飞猛进,而且酷睿2处理器的短流水设计并不适合超线程技术,因此新一代的酷睿架构处理器也就取消了超线程这一概念。
随着技术的进步,Intel已经进入了45nm工艺和Nehalem架构时代,在最新的Nehalem Core i7处理中,由于对DDR3内存控制器的整合,同时引入了三通道内存技术,内存带宽得到了质的飞跃,QPI总线的引入也令处理器的带宽大幅提升。这为超线程技术的回归提供了契机,于是乎Intel在酷睿i7系列以及未来的双核酷睿i5处理器中加入了超线程技术。
Nehalem架构时代超线程技术再次回归
此外,新一代操作系统的推出也给多线程处理器提供了施展拳脚的机会,而3D游戏以及众多的应用软件也针对多线程进行了优化,可以说超线程技术在此时回归时绝对的最佳时机。
可能看到这里依然会有众多的读者朋友会感到奇怪,这超线程技术目前只在高端酷睿i7处理器当中有所运用,并不是普通消费者能够使用到的,为何把它也列为09年最具影响力的技术之一呢?相信了解硬件的读者一定知道,处理器行业中的另一个领军企业AMD一直以来并没有为自身的处理器加入超线程技术。而AMD的高管人士甚至曾经一度认为超线程技术是影响处理器性能发挥的元兇之一。但是在看到Intel为服务器的至强以及桌面高端处理器引入超线程技术得到了超高的执行效能后,AMD内部高层承认,没有早早引入此类技术是一项技术选择上的失误。为了能够尽快弥补这一技术缺陷,AMD已经决定在不久的将来为旗下的服务器用以及桌面级处理器引入超线程技术。可见超线程技术在酷睿i7及未来的酷睿i5中回归,影响的不仅仅是用户,更影响到了对手。在不久的几年里,也许从低端到高端的所有处理器就可以全部应用到超线程技术。
VT虚拟化技术
我们接下来要介绍的这项技术与前边的超线程技术一样,也不是09年才被创新出来的。这项技术诞生于奔腾4处理器时代,两大芯片巨头当时均已这项技术为宣传目标,但都因为受制于技术性能以及软件方面的问题没有推广开(服务器不在我们的讨论范围内)。随着09年2月,新一代操作系统Windows 7测试版的发布,这项技术才被重新挖掘出来,并且被消费者广为了解。这项技术就是虚拟化技术。
其实我们所提到的Windows 7系统下的虚拟化系统,也仅在高级至旗舰版本才提供了,并不是所有的版本都提供了这一技术。但其带来的好处依然被广大的消费者讨论,即使消费者完全用不到这一技术,但在购买处理器的时候依然考虑到了自己所购买的产品能否提供虚拟化技术。
使用虚拟化系统运行的IE6.0浏览器
虚拟化技术到底有什么过人之处竟然让众多消费者都参入其中呢?其实要说虚拟化的用途,对企业级用户来讲实质性较强,对于普通用户来讲,虚拟化的用途目前还并没有被广泛开发。在企业级用户那里,通过虚拟化系统,企业可以集中并且共享资源,实现降低成本、优化利用率的目的。以高性能服务器为例,在系统闲置的过程中,服务器的性能会造成严重的浪费。如果通过虚拟机将服务器分为若干个部分,进行各自所需的工作,这样就可以最大化的利用服务器的全部性能,从而节省企业开支。而在一些情况下,企业甚至可以通过虚拟机出售服务器的剩余性能,从而达到利润最大化。虚拟化所提供的另外一个好处就是安全。用户可以通过虚拟网络进行数据传输,这样可以最大限度的保证网络的加密能力,提高网络环境的安全度。以上两点是对企业级用户来讲最为基本的用途。那么对普通消费者而言又会有哪些好处呢?
我们以操作系统为例。目前微软所提供的Windows操作系统的全球使用人数最多,而黑客也针对Windows系统进行的攻击行为也是最多的。如何能够保证操作系统的安全性就显得尤为重要。在虚拟化系统推出之后,用户在不确定自己手中的数据安全性的前提下,如软件,网页等,可以通过虚拟系统来检测数据的安全性。如果发生了如病毒等问题,仅需简单的关闭虚拟系统就可以保证系统的安全性。此外,现有系统在不支持某款软件的情况下,用户也可以通过虚拟机来实现对该软件的支持。
简单的用一句话来解释虚拟化就是,可以提供最高的安全保障,并最大限度的利用系统所提供的性能的技术。
45nm工艺技术
在2007年年末,Intel正式发布了第一款采用45nm工艺制程的处理器,酷睿四核QX9650。由于运用了当时最先进的工艺技术,这款四核处理器虽然身价过万,但依然吸引了不少人的目光,因为他的出现标志着45nm工艺时代的降临。
QX9650的问世标志着CPU进入了45nm工艺时代
45nm有何本领?竟然让一颗身价过万的CPU也成为了瞩目的焦点。这一切就要从Intel与AMD两家芯片巨头的45nm工艺入手了。
●Intel —— 突破式的45nm
2007年,Intel正式发布了四核心Core 2 Extreme QX9650处理器,由此引领行业抢先来到了45nm的新世界。Intel的45nm采用了突破式的新材料,为晶体管发展四十年来之最大进步。
在过往四十余年的时间中,业内均普遍采用二氧化硅做为制造晶体管栅介质的材料。而在65纳米制程工艺下,Intel公司已经将晶体管二氧化硅栅介质的厚度压缩至1.2纳米,基本上达到了这种传统材料的极限。此时不但使得晶体管在效能增益以及制程提升等方面遭遇瓶颈,过薄的晶体管二氧化硅栅介质亦使得其阻隔上层栅极电流泄漏的能力逐渐降低,漏电率大幅攀升。
SOI是Silicon On Isolator的缩写,即绝缘体上的硅技术。和传统的纯硅晶圆不同,SOI工艺使用的晶圆底部是一层绝缘层。这层绝缘体切断了上方MOS管漏电流的回路,使得基于SOI技术的芯片能够轻松抵抗漏电流。
真正解决AMD在 45纳米技术难题的是多重增强晶体管应变技术,AMD和IBM称,与非应变技术相比,这一新技术能将P沟道晶体管的驱动电流提高80%,将N沟道晶体管的驱动电流提高24%。可见,制程的提升极大地提升了处理器的潜在性能,并同时赋予了产品更强的功耗控制能力。
“整合”技术
从09年起,CPU领域最大的的变化就是连个字“整合”,整合GPU,整合PCIe控制器,整合内存控制器,直至完全整合了北桥。而整合所带来的不仅仅是性能上的提升,同时也带来了平台功耗的进一步降低,可以说整合已经成为了未来CPU的发展趋势。
完全整合了北桥功能的酷睿i5 750处理器
整合之路的开始起于AMD的K8架构时代,从K8架构时代开始,AMD将本来属于北桥部分的内存控制器整合进了处理器当中。其好处就是CPU不在受制于FSB的限制,提高了CPU与内存之间的数据带宽,性能得到了翻倍的提升。
随着工艺制程的提升,整合内存控制器的CPU性能被突显出来,Intel也在全新的Nehalem架构中整合进了内存控制器,放弃了传统的前端总线概念。与老的前端总线处理器相比,酷睿i7处理器的QPI总线所提供的带宽最高可以达到32GB/s,这要比1600MHz前端总线所提供的12.8GB/s提高了两倍有余,可见整合内存控制器后对CPU性能提高的影响。
在整合进了内存控制器大获成功之后,Intel和AMD又将目光放在了PCIe控制器上,双方都针对这一整合技术开展了研发。不过,在进度方面Intel方面走在了前边,率先将PCIe控制器整合进了处理器当中,并且推出了LGA1156接口的酷睿i7/酷睿i5系列处理器。从LGA1156接口产品开始,北桥功能就已经完全被整合进入了CPU当中,传统的三芯片概念已经被双芯片完全取代。这样做的好处一方面是提高CPU与内存,CPU与显卡之间的数据带宽,同时也将平台的整体功耗降至最低。可以说整合的概念是最符合未来芯片领域发展趋势的。这也是为何Intel与AMD都在争相推出整合处理器的缘故。
AMD的Fusion计划就是整合技术的一部分
在不就的未来,用户不仅可以使用到整合了北桥功能的处理器,更可以使用到整合了GPU的处理器,当前Intel与AMD都在着手进行着这一整合技术,用户最早在2010年1月就可以使用到整合GPU的处理器。
整合可以说成为了09年下半年处理器的发展趋势,并且在将来也将继续影响着处理器的发展。整合可以算作是09年最有影响力的处理器技术之一
处理器高度集成化、性能更强、处理器更加智能:
英特尔酷睿i处理器
在传统的处理器构架中,处理器基板上仅仅只有一个单独的处理器芯片。而2010年发布的英特尔酷睿i系列处理器,首次在处理器的基板上集成了显示核心。这项技术表面上看起来并没有特别之处,但是对于笔记本产品来说,意味着高度集成化的处理器,可以把笔记本产品设计的更加轻薄。同时一些搭配独立显卡的机型,可以智能的进行双显卡的切换,解决了笔记本性能和电池续航之间的矛盾。
在英特尔酷睿i系列处理器中,除了英特尔 i3系列处理器以外。众多的英特尔酷睿i系列处理器,都支持睿频加速技术,这项技术可以自动检测系统处理负载,而自动判断是否需要自动提升频率,来加快系统的响应速度。当然睿频加速并不是无限制的加速,也是有一定的频率限制。
笔记本首次加入3D显示技术:
笔记本3D技术
随着2010年火遍全球的电影《阿凡达》的上映,彻底引爆了人们对于3D技术的热情。虽然3D技术已经不是什么新鲜事了,而在笔记本上面大面积的使用还是头一回。而笔记本上的3D技术其实也是分派别的,比如说英伟达使用的3D技术,就是红蓝3D和快门式3D技术,而配备ATI显卡的笔记本则使用偏振式3D技术。对于笔记本来说,3D技术可以让用户拥有更加震撼的视觉享受。
笔记本多点触控技笔记本多点触控板
虽然多点触控技术在苹果电脑上早有应用,但是其他品牌的笔记本并没有采用这一技术。而2010年是大规模采用这项技术的一年,多点触控技术让我们可以抛弃传统的鼠标来进行操作。比如说双指向外拉申,就可以放大图片和放大网页。这项技术的出现,大大提高了笔记本触摸板的使用效率,也提高了人们的操作笔记本的效率。
2010年的应用的技术我们基本上算是盘点完了,接下来我们要来盘点一下2011年,可能要装备我们笔记本的那些新技术。
sandy bridge核心构架术:
说起融合可谓是IT技术的一大趋势,比如说sandy bridge核心的新一代处理器。就是把处理器和显卡成功的融合到一款。而AMD也同样有相同的技术,比如说AMD公司的APU处理器,就是把处理器和显卡成功的融合到单个芯片中。
2011年Sandy Bridge整合GPU图形核心技术
虽然目前的处理器加入了睿频加速和集成显卡设计,但是这次SNB自带的GPU图形核心确实经过了大幅度的重新设计,拥有专门的视频转码硬件模块,性能大约是目前HDGraphics的两倍,目前已经的测试也证明Intel所言非虚。借助第二代Turbo Boost睿频加速技术,SNB的CPU、GPU两部分可以相互独立地动态加速。如果你正在玩的游戏更需要GPU资源,那么CPU部分可能会运行在原始频率甚至降低,GPU则在功率允许范围内尽量提速。
超线程和Turbo Boost动态加速技术
SNB移动版全部开启了超线程和Turbo Boost动态加速技术,而且官方内存频率最高提至1600MHz。特别值得一提的是,SNB移动版所集成的图形核心都会有12个执行单元,两倍于桌面版,而且频率方面也不低,默认均为650MHz,动态加速最高1300MHz或者1150MHz。已知的测试可以证明,Intel集显的性能已经相当惊人,照此推算移动版甚至还会更狠,移动独立显卡的生存空间将受到严重挤压。
通过英特尔官方对睿频加速技术的解释。当启动一个运行程序后,处理器会自动加速到合适的频率,而原来的运行速度会提升10%~20% 以保证程序流畅运行;应对复杂应用时,处理器可自动提高运行主频以提速,轻松进行对性能要求更高的多任务处理;当进行工作任务切换时,如果只有内存和硬盘在进行主要的工作,处理器会立刻处于节电状态。这样既保证了能源的有效利用,又使程序速度大幅提升。通过智能化地加快处理器速度,从而根据应用需求最大限度地提升性能,为高负载任务提升运行主频高达20%以获得最佳性能即最大限度地有效提升性能以符合高工作负载的应用需求:通过给人工智能、物理模拟和渲染需求分配多条线程处理,可以给用户带来更流畅、更逼真的游戏体验。同时,英特尔智能高速缓存技术提供性能更高、更高效的高速缓存子系统,从而进一步优化了多线程应用上的性能。
随着处理器制程和设计越来越先进,笔记本性能也会随着强大。而处理器和显卡的高度融合,笔记本的续航时间会大大延长,而笔记本可能做的越来越轻薄,性能也会越来越强大。
随着宏碁Iconia笔记本的发布,一下打破了我们对于传统笔记本的定义。而传统物理键盘的消失使得笔记本在用户体验方面更近一层。而物理键盘的消失,我们大可不必担心。虚拟键盘的加入使得笔记本,在文字输入方面不会存在任何问题,只不过没有物理键盘那样的手感了,这也是笔记本变革的“阵痛”。
上面的试用视频中我们可以看到。双屏触摸笔记本无论是在浏览照片、看视频还是浏览网页,都显得如此的简单和便捷。这对于传统键盘来说,无疑可以掀起一轮笔记本革新的风暴。这种用户体验的革新,好比Iphone对于手机业的革新一样,明年各大厂商都应该会发布自家的双屏笔记本。
在2010年电影阿凡达的上映,让很多体验到了3D技术的震撼。而笔记本装备有3D显示屏后,笔记本在用户体验会更上一城楼。比如说,一些第一人称射击游戏在3D技术的存托下,让用户临场感觉更加好。而市场上的传统的3D技术是佩戴3D眼睛来实现的。 而大多数用户在长时间观看3D电影和进行3D游戏的时候,会产生晕眩和视力下降的情况。
任天堂即将发售的裸眼3D游戏掌机3DS,把裸眼3D技术推向了3D技术时代浪尖。让大多数人开始渐渐关注起裸眼3D技术。对于裸眼3D技术,大多是人还是很陌生。如今的裸眼3D技术可以分为两派,一个是光屏障式3D技术也被称为视差屏障或视差障栅技术,其原理和偏振式3D较为类似,是由夏普欧洲实验室的工程师十余年的研究成功。光屏障式3D产品与既有的LCD液晶工艺兼容。而这种技术的优点是成本低廉,但是可视角度比较差,而且在显示亮度方面也偏暗。
光屏障碍裸眼3D技术
而如今柱状透镜式裸眼3D正好可以解决光屏障碍裸眼3D的缺陷。其最大的优势便是其亮度不会受到影响。柱状透镜3D技术的原理是在液晶显示屏的前面加上一层柱状透镜,使液晶屏的像平面位于透镜的焦平面上,这样在每个柱透镜下面的图像的像素被分成几个子像素,这样透镜就能以不同的方向投影每个子像素。于是双眼从不同的角度观看显示屏,就看到不同的子像素。不过像素间的间隙也会被放大,因此不能简单地叠加子像素。
http://tech.huanqiu.com/digit/pc/news/2011-01/1394758_6.html
第1页:2011年处理器/主板重大事件点评
-
2011年已经接近年底,在这一年中有诸多新技术新产品给我们留下了深刻的印象,明年也将会有更加值得期待的技术出现,今天我们就来做一个收尾总结。今年一年变化还是不小的,比如集成图形性能还算不错的Sandy Bridge处理器、全新概念的APU、最高端的Sandy Bridge-E架构Core i7、AMD正在进行的大裁员和战略调整等等,这些都给我们带来了不小的影响。
对于厂商来说,今年可以用有喜有忧来形容,一方面DIY产品价格越来越便宜,单价利润并没有增加,另外一方面,DIY消费者总量还在快速成长。当然,今年也碰到了诸如泰国发大水导致硬盘狂涨带来的销量影响,不过整体来说今年表现还是不错的。那么明年会是怎么样?目前还真不好说,希望明年行业发展会更好。对于消费者来说,价格便宜自然可以花更少钱玩到新奇的产品,当然便宜的东西也不一定就是好的,用户还是需要理性选择合适的产品。闲话少说,接下来就让我们来一一回顾今年到来的新产品和新技术以及发生的新鲜事,我用时间倒叙的方式给大家做展示。
不得不提的AMD “Project WIN”(胜利工程)
对于AMD来说,2011年并不是一个高速成长的一年,虽然今年有APU和推土机产品陆续登场,但是依然弥补不了和竞争对手的差距,无奈之下,只能进行这次幅度接近12%的大裁员,其中市场营销部门被砍掉了大约60%,市场营销副总裁Patrick "Pat" Moorhead、品牌副总裁JohnVolkmann、公关总监Dave Kroll等都黯然离去,技术人员也未能独善其身,比如多名关键的Fusion工程师都丢掉了饭碗,大概是APU的表现仍然没有达到让AMD满意的程度,甚至整个产品评测支持团队都不存在了。不过与此同时,AMD已经在准备“Project WIN”(胜利工程)以调整未来公司的重心业务和发展方向。
不管该策略最终如何,都并非Rory Read一个人的主意,而是整个董事会的决定,主要目标就是提高效率、降低成本、增加收入、加快产品开发与上市时间。业界普遍认为,Rory Read将会把AMD更多地带往消费级产品市场,低功耗的“山猫”架构将会扮演重要角色。AMD有可能在最近宣布加入ARM阵营,宣布获得ARM许可。
不管怎么样,AMD都需要进一步明确自己的发展方向,找到真正能给自己带来高速增长的契机,也许未来云计算、低功耗以及发展迅猛的中国市场才是AMD需要重点把守的战场。\微软将在明年推出支持ARM架构处理器的Windows 8,ARM也在加紧近日PC以及服务器领域的步伐。10月底,ARM公司正式宣布,其首个采用64位指令集的处理器架构“ARMv8”正式出炉,在这个64位处理器横行的年代,ARM处理器终于跟上时代的脚步了
② cpu的核心技术是什么
CPU核心技术主要以动态执行技术为主,主要有两大技术
分枝预测(branch prediction);
推测执行(speculatlon execution)。
动态执行是目前CPU主要采用的先进技术之一。
采用分枝预测和动态执行的主要目的是为了提高CPU的运算速度。
推测执行是依托于分枝预测基础上的,在分枝预测程序是否分枝后所进行的处理也就是推测执行。
由于程序中的条件分枝是根据程序指令在流水线处理后结果再执行的,所以当CPU等待指令结果时,流水线的前级电路也处于空闲状态等待分枝指令,这样必然出现时钟周期的浪费。
如果CPU能在前条指令结果出来之前就能预测到分枝是否转移、那么就可以提前执行相应的指令,这样就避免了流水线的空闲等待、相应也就提高了CPU的运算速度。但另一方面一旦前指令结果出来后证明分技预测错误,那么就必须将已经装人流水线执行的指令和结果全部清除,然后再装人正确指令重新处理,这样就比不进行分枝预测等待结果后再执行新指令还慢了( 所以IDT公的WIN C6就没有采用分枝预测技术)。
现在的Pentium和pentium II系列CPU的分枝预测正确率分别达到了80%和90%,这样虽然可能会有2O%和10%分枝预测错误但平均以后的结果仍然可以提高CPU的运算速度。
③ CPU的处理技术有哪些
CPU,被称为中央处理器,那么一定就是处理各种数据操作的,那么,CPU处理那么庞大的数据,采用了哪些技术呢?我带你了解CPU的处理技术。
多线程
同时多线程Simultaneous Multithreading,简称SMT。SMT可通过复制处理器上的结构状态,让同一个处理器上的多个线程同步执行并共享处理器的执行资源,可最大限度地实现宽发射、乱序的超标量处理,提高处理器运算部件的利用率,缓和由于数据相关或Cache未命中带来的访问内存延时。当腊握没有多个线程可用时,SMT处理器几乎和传统的宽发射超标量处理器一样。SMT最具吸引力的是只需小规模改变处理器核心的设计,几乎不用增加额外的成本就可以显着地提升效能。多线程技术则可以为高速的运算核心准备更多的待处理数据,减少运算核心的闲置时间。这对于桌面低端系统来说无疑十分具有吸引力。Intel从3.06GHz Pentium 4开始,部分处理器将支持SMT技术。
多核心
多核心,也指单芯片多处理器(Chip Multiprocessors,简称CMP)。CMP是由美国斯坦福大学提出的,其思想是将大规模并行处理器中的SMP(对称多处理器)集成到同一芯片内,各个处理器并行执行不同的进程。这种依靠多个CPU同时并行地运行程序是实现超高速计算的一个重要方向,称为并行处理。与CMP比较,SMT处理器结构的灵活性比较突出。但是,当半导体工艺进入0.18微米以后,线延时已经超过了门延迟,要求微处理器的设计通过划分许多规模更小、局部性更好的基本单元结构来进行。相比之下,由于CMP结构已经被划分成多个处理器核来设计,每个核都比较简单,有利于优轮升庆化设计,因此更有发展前途。IBM 的Power 4芯片和Sun的MAJC5200芯片都采用了CMP结构。多核处理器可以在处理器内部共享缓存,提高缓存利用率,同时简化多处理器系统设计的复杂度。但这并不是说明,核心越多,性能越高,比如说16核的CPU就没有8核的CPU运算速度快,因为核心太多,而不能合理进行分配,所以导致运算速度减慢。在买电脑时请酌情选择。2005年下半年,Intel和AMD的新型处理器也将融入CMP结构。新安腾处理器开发代码为Montecito,采用双核心设计,拥有最少18MB片内缓存,采取90nm工艺制造。它的每个单独的核心都拥有独立的L1,L2和L3 cache,包含大约10亿支晶体管。
SMP
SMP(Symmetric Multi-Processing),对称多处理结构的简称,是指在一个计算机上汇集了一组处理器(多CPU),各CPU之间共享内存子系统以及总线结构。在这种技术的支持下,一个服务器系统可以同时运行多个处理器,并共享内存和其他的主机资源。像双至强,也就是所说的二路,这是在对称处理器系统中最常见的.一种(至强MP可以支持到四路,AMD Opteron可以支持1-8路)。也有少数是16路的。但是一般来讲,SMP结构的机器可扩展性较差,笑脊很难做到100个以上多处理器,常规的一般是8个到16个,不过这对于多数的用户来说已经够用了。在高性能服务器和工作站级主板架构中最为常见,像UNIX服务器可支持最多256个CPU的系统。
构建一套SMP系统的必要条件是:支持SMP的硬件包括主板和CPU;支持SMP的系统平台,再就是支持SMP的应用软件。为了能够使得SMP系统发挥高效的性能,操作系统必须支持SMP系统,如WINNT、LINUX、以及UNIX等等32位操作系统。即能够进行多任务和多线程处理。多任务是指操作系统能够在同一时间让不同的CPU完成不同的任务;多线程是指操作系统能够使得不同的CPU并行的完成同一个任务。
要组建SMP系统,对所选的CPU有很高的要求,首先、CPU内部必须内置APIC(Advanced Programmable Interrupt Controllers)单元。Intel 多处理规范的核心就是高级可编程中断控制器(Advanced Programmable Interrupt Controllers–APICs)的使用;再次,相同的产品型号,同样类型的CPU核心,完全相同的运行频率;最后,尽可能保持相同的产品序列编号,因为两个生产批次的CPU作为双处理器运行的时候,有可能会发生一颗CPU负担过高,而另一颗负担很少的情况,无法发挥最大性能,更糟糕的是可能导致死机。
NUMA技术
NUMA即非一致访问分布共享存储技术,它是由若干通过高速专用网络连接起来的独立节点构成的系统,各个节点可以是单个的CPU或是SMP系统。在NUMA中,Cache 的一致性有多种解决方案,一般采用硬件技术实现对cache的一致性维护,通常需要操作系统针对NUMA访存不一致的特性(本地内存和远端内存访存延迟和带宽的不同)进行特殊优化以提高效率,或采用特殊软件编程方法提高效率。NUMA系统的例子。这里有3个SMP模块用高速专用网络联起来,组成一个节点,每个节点可以有12个CPU。像Sequent的系统最多可以达到64个CPU甚至256个CPU。显然,这是在SMP的基础上,再用NUMA的技术加以扩展,是这两种技术的结合。
乱序执行
乱序执行(out-of-orderexecution),是指CPU允许将多条指令不按程序规定的顺序分开发送给各相应电路单元处理的技术。这样将根据个电路单元的状态和各指令能否提前执行的具体情况分析后,将能提前执行的指令立即发送给相应电路单元执行,在这期间不按规定顺序执行指令,然后由重新排列单元将各执行单元结果按指令顺序重新排列。采用乱序执行技术的目的是为了使CPU内部电路满负荷运转并相应提高了CPU的运行程序的速度。
分枝技术
(branch)指令进行运算时需要等待结果,一般无条件分枝只需要按指令顺序执行,而条件分枝必须根据处理后的结果,再决定是否按原先顺序进行。
控制器
许多应用程序拥有更为复杂的读取模式(几乎是随机地,特别是当cache hit不可预测的时候),并且没有有效地利用带宽。典型的这类应用程序就是业务处理软件,即使拥有如乱序执行(out of order execution)这样的CPU特性,也会受内存延迟的限制。这样CPU必须得等到运算所需数据被除数装载完成才能执行指令(无论这些数据来自CPUcache还是主内存系统)。当前低段系统的内存延迟大约是120-150ns,而CPU速度则达到了4GHz以上,一次单独的内存请求可能会浪费200-300次CPU循环。即使在缓存命中率(cache hit rate)达到99.9%的情况下,CPU也可能会花50%的时间来等待内存请求的结束-比如因为内存延迟的缘故。
在处理器内部整合内存控制器,使得北桥芯片将变得不那么重要,改变了处理器访问主存的方式,有助于提高带宽、降低内存延时和提升处理器性制造工艺:Intel的I5可以达到28纳米,在将来的CPU制造工艺可以达到22纳米。