微处理器由一片或少数几片大规模集成电路组成的中央处理器。这些电路执行控制部件和算术逻辑部件的功能。
微处理器能完成取指令、执行指令,以及与外界存储器和逻辑部件交换信息立思虽鲜技伤等操作,是微型计算机的运算控制部分。它可与存储器和外围电都易房养孩米例吧路芯片组成微型计算机。
- 中文名 微处理器
- 外文名 CPU
- 含义 计算机的运算核心和控制核心
基本信息
迫黑微处理器(英语:Microprocessor,缩写:µ希欢火丰顾未P或uP)是可编程化特殊集成电路来自。一种处理器,其所有组件小型化至一块或数块集成电路内。一种集成电路,可在其一端或多端接受编码指令,执行此指令并输出描述其状态的信号。这些指令能在内部输入、集中或存放360百科起来。又称半导体中央处理机(CPU),是微型计算机的一个主要部件。微处理器的组件常安装在一个单片上或在同一组件内,但有时分布在一些不同芯片上。在具有固定指来很令集的微型计算机中,微处理器由算术逻辑单元和控制逻辑单元组成。在具有微程序卷打食控制的指令集的微型计算机中,它包含另外的控制存储单元(源自:英汉双解计祖士保无选协算机字典)。用作贵限写为前扩希处理通用数据时,叫作中央处理器岩先完末台模苦。这也是最为人所知的应用(如样速:Intel Pentium CPU);专用于作图像数据处理的,叫作Graphics Processing Unit图形处理器(如Nvidia GeForce 7X0 GPU);用于音频数据处理的,叫作Audio 和逐植往致超或设群Processing Unit音频处理单元(如Creative emu10k1 APU)等等。物理性来说,它就是一块集成了数量庞大的微型晶体管与其他电子组件的半导体集成电际入与语端军必甲附计路芯片。
之所以会称为微处理器,并不只是因振担长说丰红化万光死剂为它比迷你电脑所用的处理器还要小而已。最主要的原因,还是因为当初各大芯片厂之制程,已经进入了1 微米的阶段,用1 微米的制程,所产制出来的处理器芯片,厂商就会在祖胜石破雷照浓货业粉轴产品名称上用“微”字己山丰乐,强调他们很高科技。就如同现在的许多商业广告一样,很喜欢用“奈米”字眼。
早在微处派样呀结已团理器问世之前,电子计算机的中央处理单元就经历了从真空管到晶体管以及再后来的离散式TTL集成电路等几个重要阶段。甚至在电子计算机以前,还出现过以齿轮、轮轴和杠杆为基础的机械结构计算机。文艺复兴时期的著名画家兼科学家列奥纳多·达·芬奇就曾做过类似的设计[来源请求],但那个时代落后的制造技术根本没有能力将这个设计付诸实现。微处理器的发明使得复杂的电路群得以制成单一的电子组件。
最新消息
昨天,英特尔宣布推出为高密度微型服务器以及新级别节能存储和网络设备打造的凌动(观裂Atom)S1200产品家族,同时这也是全球首个低功耗64位服务器级系统芯片(So喜罗站白九C)。该家族目前包含三款新品(S1220/S1240/S1260),最低功耗仅为6瓦,处理器主频为1.6GHz。
面对这一战略性举动,英特尔副总裁兼数据中心与互联系统事业部总经理柏安娜表示侵:“数据中心正在不断演变成为一个独特的细分市场,英特尔将继续引领这一发展趋势。几年前,我们就意放衣带啊识到市场对新型高密度高能效比服务器和其它数据中心设备的需求。”
英特尔为何要推出基于凌动平台的微处理器,它将如何平衡凌动和至强两大产品平台之间的关系;英特尔微服务器与竞争对手相比,有哪些独特的优势,产业链的支持能力如何;其后续产品技术路线图又将怎样,带着这些问题,中国联保网编辑对英特尔存储产品市场经理亢海峰进行了专访。
无关竞争对手 面向三大类市场
在亢海峰看来,英特尔之所以推出超低功耗的微服务器,与ARM进入服务器市场并没有必然关联。“多样化的IT使用场景和不同的工作负载,才是英特尔进入微服务器市场的最根本因素。”
亢海峰简略的将IT应用分为三个场景:首先是企业级应用,非常看重IT基础设施的可用性、可靠性、高效率和易用性;其次是科学计算,更加强调性能和浮点计算能力,而对于功耗和TCO等的需求没有计算能力需求那么强烈;第三是云服务提供商,与前两者应用场景不同的是,IT不再是支撑手段而是核心业务,这类客户非常看重TCO,需要在成本收入、性能功耗等方面找到平衡。
“而从工作负载角度来看,之前业界主要简略划分为处理器密集型、内存密集型和IO密集型,”亢海峰说,“其实还有一种类型是节点密集型,强调的是高密度和多节点,特别是满足轻量级横向可扩展的工作负载。比如对于云服务提供商而言,通过部署高密度多节点的IT基础设施,可以服务于更多的有需求的用户,因为很多用户并不愿意采用多租户模式。”
在他看来,英特尔微处理器主要面向专用主机托管、存储和网络交换市场。“采用传统的服务器芯片,单机柜的节点数量是有限的,而采用微服务器芯片单机柜节点数量将会超过1000个,可以满足主机托管市场需求;在存储方面,则主要面向入门级中低端存储和大数据,未来我们会对所有数据做归档,具备计算能力的存储节点将会优于磁带存储;在网络交换方面,微处理器同样是面向入门级产品。”
生态系统延伸 至强凌动和平共处
其实,英特尔早在数年之前就开始关注低功耗服务器,并对至强E3产品家族进行了扩展。那么至强E3和凌动微服务器是否会有冲突呢?
亢海峰表示,虽然至强E3和凌动微服务器都是面向低功耗市场,但两者之间还是有明显的区别。至强E3和凌动微服务器主要追求的是性能和功耗的平衡,E3突出效能,而凌动微服务器则突出高密度。
目前E3低功耗服务器的功耗在17瓦到45瓦之间,而凌动则在6瓦到8瓦。从两个平台的技术路线图来看,E3和凌动都将在明年引入22纳米制程工艺,2014年引入14纳米。
亢海峰不断强调新推出的凌动S1200是数据中心级产品:英特尔凌动微处理器可确保服务器级的可靠性和可管理性,同时大幅降低总成本。具备2颗物理内核,可通过使用英特尔超线程技术共支持4条线程。同时它还包括64位支持、支持最多可达8GB DDR3内存的内存控制器、英特尔虚拟化技术(Intel VT)、8个 PCI Express 2.0通道、可提高可靠性的错误代码纠正(ECC)支持,以及与英特尔芯片组集成的其它I/O接口。
其实,我们不难发现英特尔凌动S1200系列芯片与竞争对手相比,还有一个非常大的特征,就是完全兼容数据中心常用的x86软件。“这将使集成新的低功率设备成为可能,并且避免导入和维护新软件栈的额外投资。要知道,软件测试与平台移植的成本是非常高的。”英特尔凌动S1200系列处理器在12月11日开始向用户出货,建议起始零售价为每千颗54美元。
基本简介
来自 微处理器用一片或少数几360百科片大规模集成电路组成的中央处理器。这些电路执行控制部件和附老标曲磁老胜根算术逻辑部件的功能。微处理器与传统的中央固点处理器相比,具有体积小、重量轻和容易模块化等优点。
微处理器的基本组成部分有:寄存器堆、运算器、时序控制电路,以及数据和地址总线。微处理器能完成取指令、执行指令,以及与外界存储器和逻辑部件交换信息等操控高庆协圆作,是微型计算机的运算控制部分。它可与存储器和外围电路芯片组成微型计算机。
自从人类1947年发明晶体管以来,50多年间半导己十洲宪记体技术经历了硅晶体管、
集成电路、超大规模集成电路、甚大规模集成电路等几代,发展速度之快是其他产业所没有的。半导体技术对整个社会产生了广泛的影响,因此被称为“产业的种子”。中央处理器是指计算机内部对数据进行处理并对处理过程进行控制的部件,伴随着大规模集成电路技术的迅速发展,芯片集等宽编言今激机成成密度越来越高,CPU可以集成在一个半导体芯片上,这种具有中央处理器功能的大规模集成电路器件,被统称为“微处理器”。
主要组成
微处理器由算术逻辑单元(ALU,Arithmetic Logical Unit);累加器和通用寄存器组;程序计数器(也叫指令指标器);时序和控制逻辑部件;数据妒林术助穿克千演加与地址锁存器/缓冲器;内部总线组成。其中运算器和控制器是其主要组成部分.
算术逻辑单元
算术逻辑单元ALU主要完成算术运算(+,-、×、÷、比较)和各种逻辑运算(与、或、非、异或、移位)等操作。ALU是组合电路,本身无寄存操作数的功能,因而必须有保存操作数的两个寄存器:暂存味冲领范今增汉附练器TMP和累加器AC,累加器既向ALU提供操作数,又接收ALU的运算结果。
寄存器阵列实际上相当于微处理器内部的RAM,静聚困它包括通用寄存器组和专用寄存器组两部分,通用寄存器(A,B,C,D)用来存放参加运算的数据、中间结果或地址。它们一般均可作为两个8位的寄存器来使用。处理器内部有了这些寄存器之后,就可避免频繁地访问存储器,可缩短高少传印马外硫内孙缩吃指令长度和指令执行时间,提
高机器的运行速度,也给编程带来方便。专用寄存器包括程序计数器PC、堆栈指示器SP和标志寄存器FR,它们的作用是固定的,用来存帝放地址或地址基值。其中:
A)程担培序计数器PC用来存放下一条要执行的指令地址,因销前终脸妈的密但文次李而它控制着程序的执行顺序。在顺序执行指令的条件下,每取出指令的一个字节,PC的内容自动加1。当程物圆打序发生转移时,就必须把新的指令地址(目标积试六错句担胶传六脱地址)装入PC,这通常由界光黄件格车着云转移指令来实现。
B)堆栈指示器SP用来存放栈顶地址。堆栈是存储器中的一个特定区域。它按“后进先出”方式工作,当新的数顾督似宜伯谈据压入堆栈时,栈中原存信息不变,只改变栈顶形新爱家降显露位置,当数据从栈弹出时,弹出的是栈顶位置的数据,弹出后自动调正栈顶位置。也就是说,数据在进行压栈、出栈操作时,总是在栈顶进行。堆栈一旦初始化(即确定了栈底在内存中的位置)后,SP的内容(即栈顶位置)使由CPU自动管理。
C)标志寄存器也称程序状态字最水消派每娘入(PSW)寄存器,用来存放算术、逻辑运算指令执行后的结果特征,如结果为0时,产生进位或溢出标志等。
定时与控制逻辑是微处理器的核心控制部件,负责对整个计算机进行控制、包括从存储器中取指令,分析指令(即指令译码)确定指令操作和操作数地址,取操作数,执行指令规定的操作,送运算结果到存储器或I/O端口等。它还向微机的其它各部件发出相应的控制信号,使CPU内、外各部件间协调工作。
内部总线用来连接微处理器的各功能部件并传送微处理器内部的数据和控制信号。
必须指出,微处理器本身并不能单独构成一个独立的工作系统,也不能独立地执行程序,必须配上存储器、输入输出设备构成一个完整的微型计算机后才能独立工作。
存储器
微型计算机的存储器用来存放当前正在使用的或经常使用的程序和数据。存储器按读、写方式分为随机存储器RAM(Random Access Memory)和只读存储器ROM(Read only Memory)。RAM也称为读/写存储器,工作过程中CPU可根据需要随时对其内容进行读或写操作。RAM是易失性存储器,即其内容在断电后会全部丢失,因而只能存放暂时性的程序和数据。ROM的内容只能读出不能写入,断电后其所存信息仍保留不变,是非易失性存储器。所以ROM常用来存放永久件的程序和数据。如初始导引程序、监控程序、操作系统中的基本输入、输出管理程序BIOS等。
输入/输出接口电路 I/O接口
输入/输出接口电路是微型计算机的重要组成部件。他是微型计算机连接外部输入、输出设备及各种控制对象并与外界进行信息交换的逻辑控制电路。由于外设的结构、工作速度、信号形式和数据格式等各不相同,因此它们不能直接挂接到系统总线上,必须用输入/输出接口电路来做中间转换,才能实现与CPU间的信息交换。I/O接口也称I/O适配器,不同的外设必须配备不同的I/O适配器。I/O接口电路是微机应用系统必不可少的重要组成部分。任何一个微机应用系统的研制和设计,实际上主要是I/O接口的研制和设计。因此I/O接口技术是本课程讨论的重要内容之一,我们将在第八章中详细介绍。
总线BUS
总线是计算机系统中各部件之间传送信息的公共通道,是微型计算机的重要组成部件。它由若干条通信线和起驱动,隔离作用的各种三态门器件组成。微型计算机在结构形式上总是采用总线结构,即构成微机的各功能部件(微处理器、存储器、I/O接口电路等)之间通过总线相连接,这是微型计算机系统结构上的独特之处。采用总线结构之后,使系统中各功能部件间的相互关系转变为各部件面向总线的单一关系,一个部件(功能板/卡)只要符合总线标准,就可以连接到采用这种总线标准的系统中,从而使系统功能扩充或更新容易、结构简单、可靠性大大提高。在微型计算机中,根据他们所处位置和应用场合,总线可被分为以下四级。
(1)片内总线:它位于微处理器芯片内部,故称为芯片内部总线。用于微处理器内部ALU和各种寄存器等部件间的互连及信息传送(如图1.3中的内部总线就是片内总线)。由于受芯片面积及对外引脚数的限制,片内总线大多采用单总线结构,这有利于芯片集成度和成品率的提高,如果要求加快内部数据传送速度,也可采用双总线或三总线结构。
(2)片总线:片总线又称元件级(芯片级)总线或局部总线。微机主板、单扳机以及其它一些插件板、卡(如各种I/O接口板/卡),它们本身就是一个完整的子系统,板/卡上包含有CPU,RAM,ROM,I/O接口等各种芯片,这些芯片间也是通过总线来连接的,因为这有利于简化结构,减少连线,提高可靠性,方便信息的传送与控制。通常把各种板、卡上实现芯片间相互连接的总线称为片总线或元件级总线。
相对于一台完整的微型计算机来说,各种板/卡只是一个子系统,是一个局部,故又把片总线称为局部总线,而把用于连接微机各功能部件插卡的总线称为系统总线。局部总线是一个重要的概念,我们将在第七章中讨论。
(3)内总线:内总线又称系统总线或板级总线。因为该总线是用来连接微机各功能部件而构成一个完整微机系统的,如图1.2中所示,所以称之为系统总线。系统总线是微机系统中最重要的总线,人们平常所说的微机总线就是指系统总线,如PC总线、AT总线(ISA总线)、PCI总线等。系统总线是我们要讨论的重点内容之一。
系统总线上传送的信息包括数据信息、地址信息、控制信息,因此,系统总线包含有三种不同功能的总线,即数据总线DB(Data Bus)、地址总线AB(Address Bus)和控制总线CB(Control Bus),如图1.2中所示。
数据总线DB用于传送数据信息。数据总线是双向三态形式的总线,即他既可以把CPU的数据传送到存储器或I/O接口等其它部件,也可以将其它部件的数据传送到CPU。数据总线的位数是微型计算机的一个重要指标,通常与微处理的字长相一致。例如Intel 8086微处理器字长16位,其数据总线宽度也是16位。需要指出的是,数据的含义是广义的,它可以是真正的数据,也可以指令代码或状态信息,有时甚至是一个控制信息,因此,在实际工作中,数据总线上传送的并不一定仅仅是真正意义上的数据。
地址总线AB是专门用来传送地址的,由于地址只能从CPU传向外部存储器或I/O端口,所以地址总线总是单向三态的,这与数据总线不同。地址总线的位数决定了CPU可直接寻址的内存空间大小,比如8位微机的地址总线为16位,则其最大可寻址空间为216=64KB,16位微型机的地址总线为20位,其可寻址空间为220=1MB。一般来说,若地址总线为n位,则可寻址空间为2n字节。
控制总线CB用来传送控制信号和时序信号。控制信号中,有的是微处理器送往存储器和I/O接口电路的,如读/写信号,片选信号、中断响应信号等;也有是其它部件反馈给CPU的,比如:中断申请信号、复位信号、总线请求信号、限备就绪信号等。因此,控制总线的传送方向由具体控制信号而定,一般是双向的,控制总线的位数要根据系统的实际控制需要而定。实际上控制总线的具体情况主要取决于CPU。
(4)外总线:也称通信总线。用于两个系统之间的连接与通信,如两台微机系统之间、微机系统与其他电子仪器或电子设备之间的通信。常用的通信总线有IEEE-488总线,VXI总线和RS-232串行总线等。外总线不是微机系统本身固有的,只有微型机应用系统中才有。
根据微处理器的应用领域,微处理器大致可以分为三类:通用高性能微处理器、嵌入式微处理器和数字信号处理器、微控制器。一般而言,通用处理器追求高性能,它们用于运行通用软件,配备完备、复杂的操作系统;嵌入式微处理器强调处理特定应用问题的高性能,主要用于运行面向特定领域的专用程序,配备轻量级操作系统,主要用于蜂窝电话、CD播放机等消费类家电;微控制器价位相对较低,在微处理器市场上需求量最大,主要用于汽车、空调、自动机械等领域的自控设备。
CPU是Central Processing Unit(中央微处理器)的缩写,它是计算机中最重要的一个部分,由运算器和控制器组成。如果把计算机比作人,那么CPU就是人的大脑。CPU的发展非常迅速,个人电脑从8088(XT)发展到现在的Pentium 4时代,只经过了不到二十年的时间。
从生产技术来说,最初的8088集成了29000个晶体管,而PentiumⅢ的集成度超过了2810万个晶体管;CPU的运行速度,以MIPS(百万个指令每秒)为单位,8088是0.75MIPS,到高能奔腾时已超过了1000MIPS。不管什么样的CPU,其内部结构归纳起来都可以分为控制单元、逻辑单元和存储单元三大部分,这三个部分相互协调,对命令和数据进行分析、判断、运算并控制计算机各部分协调工作。
发展历史
CPU从最初发展至今已经有二十多年的历史了,这期间,按照其处理信息的字长,CPU可以分为:4位微处理器、8位微处理器、16位微处理器、32位微处理器以及最新的64位微处理器,可以说个人电脑的发展是随着CPU的发展而前进的。
微机是指以大规模、超大规模集成电路为主要部件,以集成了计算机主要部件——控制器和运算器的微处理器MP(Micro Processor)为核心,所构造出的计算系经过30多年的发展,微处理器的发展大致可分为:
第一代微处理器 1971—1973年
通常以字长是4位或8位微处理器,典型的是美国 Intel 4004和Intel 8008微处理器。Intel 4004是一种4位微处理器,可进行4位二进制的并行运算,它有45条指令,速度0.05MIPs(Million Instruction Per Second,每秒百万条指令)。Intel 4004的功能有限,主要用于计算器、电动打字机、照相机、台秤、电视机等家用电器上,使这些电器设备具有智能化,从而提高它们的性能。Intel 8008是世界上第一种8位的微处理器。存储器采用PMOS工艺。该阶段计算机工作速度较慢,微处理器的指令系统不完整,存储器容量很小,只有几百字节,没有操作系统,只有汇编语言。主要用于工业仪表、过程控制。
第二代微处理器 1974—1977年
典型的微处理器有Intel 8080/8085,Zilog公司的Z80和Motorola公司的M6800。与第一代微处理器相比,集成度提高了1~4倍,运算速度提高了10~15倍,指令系统相对比较完善,已具备典型的计算机体系结构及中断、直接存储器存取等功能。存储容量达64KB,配有荧光屏显示器、键盘、软盘驱动器等设备构成。
第三代微处理器 1978—1984年
1978 年,Intel公司率先推出16位微处理器8086,同时,为了方便原来的8位机用户,Intel公司又提出了一种准16位微处理器8088。在Intel公司推出8086、8088 CPU之后,各公司也相继推出了同类的产品,有Zilog公司Z8000和Motorola公司的M68000等。16位微处理器比8位微处理器有更大的寻址空间、更强的运算能力、更快的处理速度和更完善的指令系统。所以,16位微处理器已能够替代部分小型机的功能,特别在单任务、单用户的系统中,8086等16位微处理器更是得到了广泛的应用。1982年,Intel公司又推出16位高级微处理器80286。微处理器采用短沟道高性能NMOS工艺。在体系结构方面吸纳了传统小型机甚至大型机的设计思想,如虚拟存储和存储保护等,时钟频率提高到5~25MHz。在20世纪80年代中、后期至1991年初,80286一直是微机的驻留CPU。
第四代微处理器
1985年,Intel公司推出了第四代微处理器80386。它是一种与8086向上兼容的32位微处理器80386,它具32位的数据总线和32位的地址总线,存储器可寻址空间达4GB,运算速度达到每秒300~400万条指令,即3~4MPIS。CPU内部采用6级流水线结构,使用二级存储器管理方式,支持带有存储器保护的虚拟存储机制。随着集成电路工艺水平的进一步提高,1989年,Intel公司又推出了性能更高的32位微处理器80486,在芯片上集成约120万个晶体管,是80386的4倍,80486由3个部件组成:一个是80386体系结构的主处理器,一个是与80387兼容的数字协处理器和一个8KB容量的高速缓冲存储器,并采用了RISC(精简指令集计算机)技术和突发总线技术,提高了速度,在相同频率下,80486的处理速度一般比80386快2~4倍。以这些高性能32位微处理器为CPU构成的微机的性能指标已达到或超过当时的高档小型机甚至大型机的水平,被称为高档或超级微机。同期推出的产品还有MC68040和NEC公司的V80,
第五代微处理器
1993年,Intel公司推出了第五代微处理器Pentium(中文译名为奔腾)。Pentium微处理器的推出使微处理器的技术发展到了一个崭新的阶段,标志着微处理器完成从CISC向RISC 时代的过渡,也标志着微处理器向工作站和超级小型机冲击的开始。
亚微米CMOS工艺,它具有64位的数据总线和32位的地址总线,CPU内部采用超标量流水线设计,Pentium芯片内采用双Cache结构(指令Cache和数据Cache),每个Cache容量为8KB,数据宽度为32位,数据Cache采用回写技术,大大节省了处理时间。Pentium 处理器为了提高浮点运算速度,采用8级流水线和部分指令固化技术,芯片内设置分支目标缓冲器(BTB),可动态预测分支程序的指令流向,节省了CPU判别分支的时间,大大提高了处理速度。Pentium系列处理器有多种工作频率,工作在60MHz和66MHz时,其速度可达每秒1亿条指令。同期推出的第五代微处理器还有IBM、Apple和Motorola这3家公司联盟PowerPC(这是一种完全的RISC微处理器),以及AMD公司的K5和Cyrix公司的M1等。
第六代微处理器
1996年Intel公司将其第六代微处理器正式命名为Pentium Pro(奔腾)。该处理器的集成电路采用了0.35的工艺,时钟频率为200MHz,在处理方面,Pentium Pro引入了新的指令执行方式,其内部核心是PISC处理器,运算速度达200MIPs。Pentium Pro允许在一个系统里安装4个处理器,因此,Pentium Pro最合适的位置是作为高性能服务器和工作 站。
2001年Intel公司发布了Itanium(安腾)处理器。Itanium处理器是Intel公司第一款64位元的产品。这是为顶级、企业级服务器及工作站设计的,在Itanium处理器中体现了一种全新的设计思想,完全是基于平行并发计算而设计(EPIC)。对于最苛求性能的企业或者需要高性能运算功能支持的应用(包括电子交易安全处理、超大型数据库、计算机辅助机械引擎、尖端科学运算等)而言,Itanium处理器基本是计算机处理器中唯一的选择。
2002年Intel公司发布了Itanium2处理器。代号为McKinley的Itanium2处理器是Intel公司的第二代64位系列产品,Itanium2处理器是以Itanium架构为基础建立与扩充的产品,可与专为第一代Itanium处理器优化编译的应用程序兼容,并大幅提升了50%~100%的效能。Itanium2处理器系列以低成本与更高效能,提供高阶服务器与工作站各种平台与应用支持。
第七代微处理器
1999年,AMD推出了世界上第一款第七代微处理器,取名为速龙MP处理器,可支持高性能多处理器平台的服务器及工作站。新一代的应用程序需要一个稳定可靠的操作环境进行大量的运算,AMD速龙 MP处理器可以满足这类应用软件的需要。
2000年11月,Intel也推出了他的第七代微处理器:奔腾4(Pentium 4,或简称奔4或P4),这一新的架构称做NetBurst。Pentium 4有着非常快速到400MHz的前端总线,之后更有提升到533MHz、800MHz。它其实是一个为100MHz的四条并列总线(100Mhz x4 并列),因此理论上它可以传送比一般总线多四倍的容量,所以号称有400MHz的速度。
初期CPU
Intel 4004
1971年,英特尔公司推出了世界上第一款微处理器4004,这是第一个可用于微型计算机的四位微处理器,它包含2300个晶体管。随后英特尔又推出了8008,由于运算性能很差,其市场反应十分不理想。1974年,8008发展成8080,成为第二代微处理器。8080作为代替电子逻辑电路的器件被用于各种应用电路和设备中,如果没有微处理器,这些应用就无法实现。
由于微处理器可用来完成很多以前需要用较大设备完成的计算任务,价格又便宜,于是各半导体公司开始竞相生产微处理器芯片。Zilog公司生产了8080的增强型Z80,摩托罗拉公司生产了6800,英特尔公司于1976年又生产了增强型8085,但这些芯片基本没有改变8080的基本特点,都属于第二代微处理器。它们均采用NMOS工艺,集成度约9000只晶体管,平均指令执行时间为1μS~2μS,采用汇编语言、BASIC、Fortran编程,使用单用户操作系统。
Intel 8086
1978年英特尔公司生产的8086是第一个16位的微处理器。很快Zilog公司和摩托罗拉公司也宣布计划生产Z8000和68000。这就是第三代微处理器的起点。
8086微处理器最高主频速度为8MHz,具有16位数据通道,内存寻址能力为1MB。同时英特尔还生产出与之相配合的数学协处理器i8087,这两种芯片使用相互兼容的指令集,但i8087指令集中增加了一些专门用于对数、指数和三角函数等数学计算的指令。人们将这些指令集统一称之为 x86指令集。虽然以后英特尔又陆续生产出第二代、第三代等更先进和更快的新型CPU,但都仍然兼容原来的x86指令,而且英特尔在后续CPU的命名上沿用了原先的x86序列,直到后来因商标注册问题,才放弃了继续用阿拉伯数字命名。
1979年,英特尔公司又开发出了8088。8086和8088在芯片内部均采用16位数据传输,所以都称为16位微处理器,但8086每周期能传送或接收16位数据,而8088每周期只采用8位。因为最初的大部分设备和芯片是8位的,而8088的外部8位数据传送、接收能与这些设备相兼容。8088采用40针的DIP封装,工作频率为6.66MHz、7.16MHz或8MHz,微处理器集成了大约29000个晶体管。
8086和8088问世后不久,英特尔公司就开始对他们进行改进,他们将更多功能集成在芯片上,这样就诞生了80186和80188。这两款微处理器内部均以16位工作,在外部输入输出上80186采用16位,而80188和8088一样是采用8位工作。
1981年,美国IBM公司将8088芯片用于其研制的PC机中,从而开创了全新的微机时代。也正是从8088开始,个人电脑(PC)的概念开始在全世界范围内发展起来。从8088应用到IBM PC机上开始,个人电脑真正走进了人们的工作和生活之中,它也标志着一个新时代的开始。
Intel 80286
1982年,英特尔公司在8086的基础上,研制出了80286微处理器,该微处理器的最大主频为20MHz,内、外部数据传输均为16位,使用24位内存储器的寻址,内存寻址能力为16MB。80286可工作于两种方式,一种叫实模式,另一种叫保护方式。
在实模式下,微处理器可以访问的内存总量限制在1兆字节;而在保护方式之下,80286可直接访问16兆字节的内存。此外,80286工作在保护方式之下,可以保护操作系统,使之不像实模式或8086等不受保护的微处理器那样,在遇到异常应用时会使系统停机。
IBM公司将80286微处理器用在先进技术微机即AT机中,引起了极大的轰动。80286在以下四个方面比它的前辈有显著的改进:支持更大的内存;能够模拟内存空间;能同时运行多个任务;提高了处理速度。最早PC机的速度是4MHz,第一台基于80286的AT机运行速度为6MHz至8MHz,一些制造商还自行提高速度,使80286达到了20MHz,这意味着性能上有了重大的进步。
80286的封装是一种被称为PGA的正方形包装。PGA是源于PLCC的便宜封装,它有一块内部和外部固体插脚,在这个封装中,80286集成了大约130000个晶体管。
IBM PC/AT微机的总线保持了XT的三层总线结构,并增加了高低位字节总线驱动器转换逻辑和高位字节总线。与XT机一样,CPU也是焊接在主板上的。
那时的原装机仅指IBM PC机,而兼容机就是除了IBM PC以外的其它机器。在当时,生产CPU的公司除英特尔外,还有AMD及西门子公司等,而人们对自己电脑用的什么CPU也不关心,因为AMD等公司生产的CPU几乎同英特尔的一样,直到486时代人们才关心起自己的CPU来。
8086~80286这个时代是个人电脑起步的时代,当时在国内使用甚至见到过PC机的人很少,它在人们心中是一个神秘的东西。到九十年代初,国内才开始普及计算机。
从386到奔腾
1985年春天的时候,英特尔公司已经成为了第一流的芯片公司,它决心全力开发新一代的32位核心的CPU—80386。Intel给80386设计了三个技术要点:使用“类286”结构,开发80387微处理器增强浮点运算能力,开发高速缓存解决内存速度瓶颈。
1985年10月17日,英特尔划时代的产品——80386DX正式发布了,其内部包含27.5万个晶体管,时钟频率为12.5MHz,后逐步提高到20MHz、25MHz、33MHz,最后还有少量的40MHz产品。
80386DX的内部和外部数据总线是32位,地址总线也是32位,可以寻址到4GB内存,并可以管理64TB的虚拟存储空间。它的运算模式除了具有实模式和保护模式以外,还增加了一种“虚拟86”的工作方式,可以通过同时模拟多个8086微处理器来提供多任务能力。
80386DX有比80286更多的指令,频率为12.5MHz的80386每秒钟可执行6百万条指令,比频率为16MHz的80286快2.2倍。80386最经典的产品为80386DX-33MHz,一般我们说的80386就是指它。
由于32位微处理器的强大运算能力,PC的应用扩展到很多的领域,如商业办公和计算、工程设计和计算、数据中心、个人娱乐。80386使32位CPU成为了PC工业的标准。
虽然当时80386没有完善和强大的浮点运算单元,但配上80387协处理器,80386就可以顺利完成许多需要大量浮点运算的任务,从而顺利进入了主流的商用电脑市场。另外,30386还有其他丰富的外围配件支持,如82258(DMA控制器)、8259A(中断控制器)、8272(磁盘控制器)、82385(Cache控制器)、82062(硬盘控制器)等。针对内存的速度瓶颈,英特尔为80386设计了高速缓存(Cache),采取预读内存的方法来缓解这个速度瓶颈,从此以后,Cache就和CPU成为了如影随形的东西。
严格地说,80387并不是一块真正意义上的CPU,而是配合80386DX的协处理芯片,也就是说,80387只能协助80386完成浮点运算方面的功能,功能很单一。 1989年英特尔公司又推出准32位微处理器芯片80386SX。这是Intel为了扩大市场份额而推出的一种较便宜的普及型CPU,它的内部数据总线为32位,外部数据总线为16位,它可以接受为80286开发的16位输入/输出接口芯片,降低整机成本。
80386SX推出后,受到市场的广泛的欢迎,因为80386SX的性能大大优于80286,而价格只是80386的三分之一。英特尔在1990年推出了专门用于笔记本电脑的80386SL和80386DL两种型号的386芯片。这两个类型的芯片可以说是80386DX/SX的节能型,其中,80386DL是基于80386DX内核,而80386SL是基于80386SX内核的。这两种类型的芯片,不但耗电少,而且具有电源管理功能,在CPU不工作的时候,自动切断电源供应。
摩托罗拉的68000是最早推出的32位微微处理器,当时是1984年,推出后,性能超群,并获得如日中天的苹果公司青睐,在自己的划时代个人电脑“PC-MAC”中采用该芯片。但80386推出后,日渐没落。 AMD的Am386SX/DX是兼容80386DX的第三方芯片,性能上和英特尔的80386DX相差无己,也成为当时的主流产品之一。
这个是由IBM在研究80386的基础上设计的,和80386完全兼容,由英特尔生产制造。386SLC基本上是一个在80386SX的基础上配上内置Cache,同时包含80486SX的指令集,性能也不错。
1989年,我们大家耳熟能详的80486芯片由英特尔推出。这款经过四年开发和3亿美元资金投入的芯片的伟大之处在于它首次实破了100万个晶体管的界限,集成了120万个晶体管,使用1微米的制造工艺。80486的时钟频率从25MHz逐步提高到33MHz、40MHz、50MHz。80486是将80386和数学协微处理器80387以及一个8KB的高速缓存集成在一个芯片内。80486中集成的80487的数字运算速度是以前80387的两倍,内部缓存缩短了微处理器与慢速DRAM的等待时间。并且,在80x86系列中首次采用了RISC(精简指令集)技术,可以在一个时钟周期内执行一条指令。它还采用了突发总线方式,大大提高了与内存的数据交换速度。由于这些改进,80486的性能比带有80387数学协微处理器的80386 DX性能提高了4倍。
随着芯片技术的不断发展,CPU的频率越来越快,而PC机外部设备受工艺限制,能够承受的工作频率有限,这就阻碍了CPU主频的进一步提高。在这种情况下,出现了CPU倍频技术,该技术使CPU内部工作频率为微处理器外频的2~3倍,486 DX2、486 DX4的名字便是由此而来。
常见的80486 CPU有80486 DX-33、40、50。486 CPU与386 DX一样内外都是32位的,但是最慢的486 CPU也比最快的386 CPU要快,这是因为486 SX/DX执行一条指令,只需要一个振荡周期,而386DX CPU却需要两个周期。
因为80486 DX CPU具有内置的浮点协微处理器,功能强大,当然价格也就比较昂贵。为了适应普通的用户的需要,尤其是不需要进行大量浮点运算的用户,英特尔公司推出了486 SX CPU。80486 SX主板上一般都有80487协微处理器插座,如果需要浮点协微处理器的功能,可以插上一个80487协微处理器芯片,这样就等同于486 DX了。常见的80486 SX CPU有:80486 SX-25、33。
其实这种CPU的名字与频率是有关的,这种CPU的内部频率是主板频率的两/四倍,如80486 DX2-66,CPU的频率是66MHz,而主板的频率只要是33MHz就可以了。
80486 SL CPU最初是为笔记本电脑和其他便携机设计的,与386SL一样,这种芯片使用3.3V而不是5V电源,而且也有内部切断电路,使微处理器和其他一些可选择的部件在不工作时,处于休眠状态,这样就可以减少笔记本电脑和其他便携机的能耗,延长使用时间。
升级486 SX可以在主板的协微处理器插槽上安装一个80487SX芯片,使其等效于486 DX,但是这样升级后,只是增加了浮点协微处理器的能力,并没有提高系统的速度。为了提高系统的速度,还有另外一种升级的方法,就是在协微处理器插槽上插上一个486 OverDrive CPU,它的原理与486 DX2 CPU一样,其内部操作速度可以是外部速度的两倍。如一个20MHz的主板上安插了OverDrive CPU之后,CPU内部的操作速度可以达到40MHz。486 OverDrive CPU也有浮点协微处理器的功能,常见的有:OverDrive-50、66、80。
作为全球知名的半导体厂商之一,美国德州仪器(TI)也在486时代异军突起,它自行生产了486 DX系列CPU,尤其在486DX2成为主流后,其DX2-80因较高的性价比成为当时主流产品之一,TI 486最高主频为DX4-100,但其后再也没有进入过CPU市场。
这是Cyrix公司生产的486 CPU,说它是486 CPU,是指它的效率上逼近486 CPU,却并不是严格意义上的486 CPU,这是由486 CPU的特点而定的。486DLC CPU只是将386DX CPU与1K Cache组合在一块芯片里,没有内含浮点协微处理器,执行一条指令需要两个振荡周期。但是由于486DLC CPU设计精巧,486DLC-33 CPU的效率逼近英特尔公司的486 SX-25,而486DLC-40 CPU则超过了486 SX-25,并且486DLC-40 CPU的价格比486 SX-25便宜。486DLC CPU是为了升级386DM而设计的,如果原来有一台386电脑,想升级到486,但是又不想更换主板,就可以拔下原来的386 CPU,插上一块486DLC CPU就可以了。
自从英特尔另辟蹊径,开发了Pentium之后,Cyrix也很快推出了自己的新一代产品5x86。它仍然延用原来486系列的CPU插座,而将主频从100MHz提高到120MHz。5x86比起486来说性能是有所增加,可是比起Pentium来说,不但浮点性能远远不足,就连Cyrix一向自豪的整数运算性能也不那么高超,给人一种比上不足比下有余的感觉。由于5x86可以使用486的主板,因此一般将它看成是过渡产品。
AMD 486DX是AMD公司在 486市场的利器,它内置16KB回写缓存,并且开始了单周期多指令的时代,还具有分页虚拟内存管理技术。由于后期TI推出了486DX2-80,价格非常低,英特尔又推出了Pentium系列,AMD为了抢占市场的空缺,推出了5x86系列CPU。它是486级最高主频的产品,为5x86-120及133。它采用了一体的16K回写缓存,0.35微米工艺,33×4的133频率,性能直指Pentium 75,并且功耗要小于Pentium。
1993年,全面超越486的新一代586 CPU问世,为了摆脱486时代微处理器名称混乱的困扰,英特尔公司把自己的新一代产品命名为Pentium(奔腾)以区别AMD和Cyrix的产品。AMD和Cyrix也分别推出了K5和6x86微处理器来对付芯片巨人,但是由于奔腾微处理器的性能最佳,英特尔逐渐占据了大部分市场。
Pentium最初级的CPU是Pentium 60和Pentium 66,分别工作在与系统总线频率相同的60MHz和66MHz两种频率下,没有我们现在所说的倍频设置。
早期的奔腾75MHz~120MHz使用0.5微米的制造工艺,后期120MHz频率以上的奔腾则改用0.35微米工艺。经典奔腾的性能相当平均,整数运算和浮点运算都不错。 为了提高电脑在多媒体、3D图形方面的应用能力,许多新指令集应运而生,其中最著名的三种便是英特尔的MMX、SSE和AMD的3D NOW!。 MMX(MultiMedia Extensions,多媒体扩展指令集)是英特尔于1996年发明的一项多媒体指令增强技术,包括57条多媒体指令,这些指令可以一次处理多个数据,MMX技术在软件的配合下,就可以得到更好的性能。
多能奔腾(Pentium MMX)的正式名称就是“带有MMX技术的Pentium”,是在1996年底发布的。从多能奔腾开始,英特尔就对其生产的CPU开始锁倍频了,但是MMX的CPU超外频能力特别强,而且还可以通过提高核心电压来超倍频,所以那个时候超频是一个很时髦的行动。超频这个词语也是从那个时候开始流行的。
多能奔腾是继Pentium后英特尔又一个成功的产品,其生命力也相当顽强。多能奔腾在原Pentium的基础上进行了重大的改进,增加了片内16KB数据缓存和16KB指令缓存,4路写缓存以及分支预测单元和返回堆栈技术。特别是新增加的57条MMX多媒体指令,使得多能奔腾即使在运行非MMX优化的程序时,也比同主频的Pentium CPU要快得多。
这57条MMX指令专门用来处理音频、视频等数据。这些指令可以大大缩短CPU在处理多媒体数据时的等待时间,使CPU拥有更强大的数据处理能力。与经典奔腾不同,多能奔腾采用了双电压设计,其内核电压为2.8V,系统I/O电压仍为原来的3.3V。如果主板不支持双电压设计,那么就无法升级到多能奔腾。
多能奔腾的代号为P55C,是第一个有MMX技术(整量型单元执行)的CPU,拥有16KB数据L1 Cache,16KB指令L1 Cache,兼容SMM,64位总线,528MB/s的频宽,2时钟等待时间,450万个晶体管,功耗17瓦。支持的工作频率有:133MHz、150MHz、166MHz、200MHz、233MHz。 曾几何时,Pentium Pro是高端CPU的代名词,Pentium Pro所表现的性能在当时让很多人大吃一惊,但是Pentium Pro是32位数据结构设计的CPU,所以Pentium Pro运行16位应用程序时性能一般,但仍然是32位的赢家,但是后来,MMX的出现使它黯然失色。
Pentium Pro(高能奔腾,686级的CPU)的核心架构代号为P6(也是未来PⅡ、PⅢ所使用的核心架构),这是第一代产品,二级Cache有256KB或512KB,最大有1MB的二级Cache。工作频率有:133/66MHz(工程样品),150/60MHz、166/66MHz、180/60MHz、200/66MHz。 K5是AMD公司第一个独立生产的x86级CPU,发布时间在1996年。由于K5在开发上遇到了问题,其上市时间比英特尔的Pentium晚了许多,再加上性能不好,这个不成功的产品一度使得AMD的市场份额大量丧失。K5的性能非常一般,整数运算能力不如Cyrix的6x86,但是仍比Pentium略强,浮点运算能力远远比不上Pentium,但稍强于Cyrix。综合来看,K5属于实力比较平均的那一种产品。K5低廉的价格显然比其性能更能吸引消费者,低价是这款CPU最大的卖点。
AMD 自然不甘心Pentium在CPU市场上呼风唤雨,因此它们在1997年又推出了K6。K6这款CPU的设计指标是相当高的,它拥有全新的MMX指令以及64KB L1 Cache(比奔腾MMX多了一倍),整体性能要优于奔腾MMX,接近同主频PⅡ的水平。K6与K5相比,可以平行地处理更多的指令,并运行在更高的时钟频率上。AMD在整数运算方面做得非常成功,K6稍微落后的地方是在运行需要使用到MMX或浮点运算的应用程序方面,比起同样频率的Pentium 要差许多。
K6拥有32KB数据L1 Cache,32KB指令L1 Cache,集成了880万个晶体管,采用0.35微米技术,五层CMOS,C4工艺反装晶片,内核面积168平方毫米(新产品为68平方毫米),使用Socket7架构。 Cyrix 也算是一家老资格的CPU开发商了,早在x86时代,它和英特尔,AMD就形成了三雄并立的局面。
自从Cyrix与美国国家半导体公司合并后,使它终于拥有了自己的芯片生产线,成品也日益完善和完备。Cyrix的6x86是投放到市场上与Pentium兼容的微处理器。 美国IDT公司(Integrated Device Technology)作为新加入此领域的CPU生产厂商,在1997年推出的第一个微微处理器产品是WinChip(即C6),在整个CPU市场上所占的份额还不足1%。1998年5月,IDT宣布了它的第二代产品WinChip 2 。
WinChip 2在原有WinChip的基础上作了一些改进,增加了一个双指令的MMX单元,增强了浮点运算功能。改进后的WinChip 2比相同频率的WinChip性能提高约10%,基本达到Intel Pentium微处理器的性能。 1997年~1998年是CPU市场竞争异常激烈的一年,这一时期的CPU芯片异彩纷呈,令人目不暇接。
PentiumⅡ的中文名称叫“奔腾二代”,它有Klamath、Deschutes、Mendocino、Katmai等几种不同核心结构的系列产品,其中第一代采用Klamath核心,0.35微米工艺制造,内部集成750万个晶体管,核心工作电压为2.8V。
PentiumⅡ微处理器采用了双重独立总线结构,即其中一条总线连通二级缓存,另一条负责主要内存。PentiumⅡ使用了一种脱离芯片的外部高速L2 Cache,容量为512KB,并以CPU主频的一半速度运行。作为一种补偿,英特尔将PentiumⅡ的L1 Cache从16KB增至32KB。另外,为了打败竞争对手,英特尔第一次在PentiumⅡ中采用了具有专利权保护的Slot 1接口标准和SECC(单边接触盒)封装技术。
1998年4月16日,英特尔第一个支持100MHz额定外频的、代号为Deschutes的350、400MHz CPU正式推出。采用新核心的PentiumⅡ微处理器不但外频提升至100MHz,而且它们采用0.25微米工艺制造,其核心工作电压也由2.8V降至2.0V,L1 Cache和L2 Cache分别是32KB、512KB。支持芯片组主要是Intel的440BX。
在1998年至1999年间,英特尔公司推出了比PentiumⅡ功能更强大的CPU--Xeon(至强微处理器)。该款微处理器采用的核心和PentiumⅡ差不多,0.25微米制造工艺,支持100MHz外频。Xeon最大可配备2MB Cache,并运行在CPU核心频率下,它和PentiumⅡ采用的芯片不同,被称为CSRAM(Custom StaticRAM,定制静态存储器)。除此之外,它支持八个CPU系统;使用36位内存地址和PSE模式(PSE36模式),最大800MB/s的内存带宽。Xeon微处理器主要面向对性能要求更高的服务器和工作站系统,另外,Xeon的接口形式也有所变化,采用了比Slot 1稍大一些的Slot 2架构(可支持四个微处理器)。
英特尔为进一步抢占低端市场,于1998年4月推出了一款廉价的CPU—Celeron(中文名叫赛扬)。最初推出的Celeron有266MHz、300MHz两个版本,且都采用Covington核心,0.35微米工艺制造,内部集成1900万个晶体管和32KB一级缓存,工作电压为2.0V,外频66MHz。Celeron与PentiumⅡ相比,去掉了片上的L2 Cache,此举虽然大大降低了成本,但也正因为没有二级缓存,该微处理器在性能上大打折扣,其整数性能甚至不如Pentium MMX。
为弥补缺乏二级缓存的Celeron微处理器性能上的不足,进一步在低端市场上打击竞争对手,英特尔在Celeron266、300推出后不久,又发布了采用Mendocino核心的新Celeron微处理器—Celeron300A、333、366。与旧Celeron不同的是,新Celeron采用0.25微米工艺制造,同时它采用Slot 1架构及SEPP封装形式,内建32KB L1 Cache、128KB L2 Cache,且以CPU相同的核心频率工作,从而大大提高了L2 Cache的工作效率。 AMD于1998年4月正式推出了K6-2微处理器。它采用0.25微米工艺制造,芯片面积减小到了68平方毫米,晶体管数目也增加到930万个。另外,K6-2具有64KB L1 Cache,二级缓存集成在主板上,容量从512KB到2MB之间,速度与系统总线频率同步,工作电压为2.2V,支持Socket 7架构。
K6-2是一个K6芯片加上100MHz总线频率和支持3D Now!浮点指令的“结合物”。3D Now!技术是对x86体系的重大突破,它大大加强了处理3D图形和多媒体所需要的密集浮点运算性能。此外,K6-2支持超标量MMX技术,支持100MHz总线频率,这意味着系统与L2缓存和内存的传输率提高近50%,从而大大提高了整个系统的表现。 作为Cyrix公司独自研发的最后一款微处理器,Cyrix MⅡ是于1998年3月开始生产的。除了具有6x86本身的特性外,该微处理器还支持MMX指令,其核心电压为2.9V,具有256字节指令;3.5X倍频;核心内集成650万个晶体管,功耗20.6瓦;64KB一级缓存。 Rise公司是一家成立于1993年11月的美国公司,主要生产x86兼容的CPU,在1998年推出了mP6 CPU。mp6不仅价格便宜,而且性能优异,有着很好的多媒体性能和强大的浮点运算。mp6使用Socket 7/Super 7兼容插座,只有16KB的一级缓存。
1999年春节刚过,英特尔公司就发布了采用Katmai核心的新一代微处理器—PentiumⅢ。该微处理器除采用0.25微米工艺制造,内部集成950万个晶体管,Slot 1架构之外,它还具有以下新特点:系统总线频率为100MHz;采用第六代CPU核心—P6微架构,针对32位应用程序进行优化,双重独立总线;一级缓存为32KB(16KB指令缓存加16KB数据缓存),二级缓存大小为512KB,以CPU核心速度的一半运行;采用SECC2封装形式;新增加了能够增强音频、视频和3D图形效果的SSE(Streaming SIMD Extensions,数据流单指令多数据扩展)指令集,共70条新指令。PentiumⅢ的起始主频速度为450MHz。
和PentiumⅡ Xeon一样,英特尔同样也推出了面向服务器和工作站系统的高性能CPU—PentiumⅢ Xeon至强微处理器。除前期的PentiumⅡ Xeon500、550采用0.25微米技术外,该款微处理器是采用0.18微米工艺制造,Slot 2架构和SECC封装形式,内置32KB一级缓存和512KB二级缓存,工作电压为1.6V。 为进一步巩固低端市场优势,英特尔于2000年3月29日推出了采用Coppermine核心CeleronⅡ。该款微处理器同样采用0.18微米工艺制造,核心集成1900万个晶体管,采用FC-PGA封装形式,它和赛扬Mendocino一样内建128KB和CPU同步运行的L2 Cache,故其内核也称为Coppermine 128。CeleronⅡ不支持多微处理器系统。但是,CeleronⅡ的外频仍然只有66MHz,这在很大程度上限制了其性能的发挥。
AMD于1999年2月推出了代号为“Sharptooth”(利齿)的K6-Ⅲ,它是该公司最后一款支持Super 7架构和CPGA封装形式的CPU,采用0.25微米制造工艺、内核面积是135平方毫米,集成了2130万个晶体管,工作电压为2.2V/2.4V。
相对于K6-2而言,K6-Ⅲ最大的变化就是内部集成了256KB二级缓存(新赛扬只有128KB),并以CPU的主频速度运行。K6-Ⅲ的这一变化将能够更大限度发挥高主频的优势。此外,该微处理器还带有64KB一级缓存(32KB用于指令,另32KB用于数据),而且在主板上还集成了以系统总线频率同步运行的三级缓存,其容量大小从512KB到2MB之间。 1999年6月23日,AMD公司推出了具有重大战略意义的K7微处理器,并将其正式命名为Athlon。K7有两种规格的产品:第一种采用0.25微米工艺制造,使用K7核心,工作电压为1.6V(其缓存以主频速度的一半运行);第二种采用0.18微米工艺制造,使用K75核心;工作电压有1.7V和1.8V两种。上述两种类型的K7微处理器内部都集成了2130万个晶体管,外频均为200MHz。
Athlon包含128KB的L1 Cache(PⅡ/PⅢ只有32KB);512KB~1MB L2 Cache的片外缓存。同时,它还采用了全新的宏处理结构,拥有三个并行的x86指令译码器,可以动态推测时序,乱序执行;K7拥有一个强劲的浮点处理单元,在3DNOW!指令的帮助下会有更进一步的3D和多媒体处理能力,这个先进的FPU使K7拥有超越其他x86微处理器2倍的性能!另外,K7采用了一种类似于Slot 1的全新的Slot A架构,从物理结构上两者可以互换,但后者的电器性能和前者完全不兼容。在总线方面,使用的是Digital公司的Alpha系统总线协议EV6,外频达200MHz;Athlon是AMD第一个具有SMP(对称多微处理器技术)能力的桌面CPU,即使用者可以用Athlon构建双微处理器甚至4微处理器系统!
AMD公司在2000年6月份连续推出了新款的Thunderbird(雷鸟)、Duron(毒龙)微处理器,再次向英特尔Coppermine(铜矿)核心的微处理器发出了强有力的挑战。
Thunderbird是AMD面向高端的Athlon系列延续产品,采用0.18微米的制造工艺,共有Slot A和Socket A两种不同的架构,但它们在设计上大致相同:均内置128KB的一级缓存和256KB的二级缓存,其二级缓存与CPU主频速度同步运行;工作电压为1.70V~1.75V,相应的功耗也比老的Athlon要小;集成3700万个晶体管,核心面积达到120平方毫米。
另外,Thunderbird微处理器支持200MHz系统总线频率,提供巨大的带宽,且支持Alpha EV6总线协议,具有多重并行x86指令解码器。
Duron微处理器是AMD首款基于Athlon核心改进的低端微处理器,它原来的研发代号称为“Spitfire”。Duron外频也是200MHz,内置128KB的一级缓存和64KB的全速二级缓存,它的工作电压为1.5V,因而功耗要较Thunderbird小。而且它核心面积是100平方毫米,内部集成的晶体管数量为2500万个,比K7核心的Athlon多300万个。这些特点符合了AMD面对低端市场的策略,即低成本低功耗而又高性能。在浮点性能上,基于K7体系的Duron明显优于采用P6核心设计的Intel系列微处理器,它具有三个全流水乱序执行单元,一个用于加/减运算,一个用于复合指令还有一个是浮点存储单元。
VIA公司在收购Cyrix之后,同期正式推出了代号为Joshua的第一款微处理器,它采用0.18微米工艺制造,Socket 370架构,支持133MHz外频,并拥有256KB L2 Cache及3D NOW!指令集。
另外,VIA后来还推出了采用新一代Samuel核心的CyrixⅢ微处理器,它加入新一代的3D Now!多媒体指令集,提供133MHz系统外频,128K一级高速缓存,采用0.18微米制造工艺生产,芯片面积仅76平方毫米。它还采用了动态电源缓存结构(Dynamic Power Caching Architecture,DPCA)技术,使新CyrixⅢ微处理器的耗电量已不到10瓦,因此新CyrixⅢ微处理器也可适用在笔记型电脑或其它IA产品上。 在AMD推出Athlon后不久,2000年11月,Intel同样推出了一台强大的第7代x86微处理器,名为奔腾4(Pentium 4,或简称奔4或P4),并且是继1995年出品的Pentium Pro之后的第一款重新设计过的处理器,这一新的架构称做NetBurst。
首款产品代码为:Willamette,拥有1.4GHz左右的内核时钟,并使用Socket 423脚位架构,首款处理器于2000年11月发布。不同于Pentium II、Pentium III和各种Celeron处理器,因为是全新设计的产品,所以与Pentium Pro的关联很小。值得注意的是,Pentium 4有着非常快速到400MHz的前端总线,之后更有提升到533MHz、800MHz。它其实是一个为100MHz的四条并列总线 (100Mhz x4 并列),因此理论上它可以传送比一般总线多四倍的容量,所以号称有400MHz的速度。AMD Athlon的前端总线则有266MHz的速度(133MHz双倍并列总线)。
内部结构
16位微处理器(图中为8086微处理器)可分成两个部分,一部分是执行部件(EU),即执行指令的部分;另一部分是总线接口部件(BIU),与8086总线联系,执行从存储器取指令的操作。微处理器分成EU和BIU后,可使取指令和执行指令的操作重叠进行。EU部分有一个寄存器堆,由8个16位的寄存器组成,可用以存放数据、变址和堆栈指针、算术运算逻辑单元 (ALU)执行算术运算和逻辑操作,标志寄存器寄存这些操作结果的条件。
执行部件中的这些部件是通过数据总线传送数据的。总线接口部件也有一个寄存器堆,其中CS、DS、SS和ES是存储空间分段的分段寄存器。IP是指令指针。内部通信寄存器也是暂时存放数据的寄存器。指令队列是把预先取来的指令流存放起来。总线接口部件还有一个地址加法器,把分段寄存器值和偏置值相加,取得20位的物理地址。数据和地址通过总线控制逻辑与外面的8086系统总线相联系。
其他资料
中国微处理器简介
2004年2月18日,由清华大学自主研发的32位微处理器THUMP芯片终于领到了由国家教育部颁发的“身份证”:典型工作频率400MHz,功耗1.17mW/MHz,芯片颗粒40片,最高工作频率可达500MHz,是目前国内工作频率最高的微处理器。 “这标志着我国在自主研发CPU芯片领域迈开了实质性的一大步。”教育部对THUMP的诞生给予了较高评价。
在龙芯1号、龙芯2号的基础上,中国正在自主研发新一代的龙芯3号。
龙芯3A的工作频率为900MHz~1GHz,功耗约15W,频率为1GHz时双精度浮点运算速度峰值达到每秒160亿次,单精度浮点运算速度峰值每秒320亿次。龙芯3A采用意法半导体公司(STMicro)65纳米CMOS工艺生产,晶体管数目达4.25亿个,芯片采用BGA封装,引脚的数目为1121个,功耗小于15瓦。 龙芯3A集成了四个64位超标量处理器核、4MB的二级Cache、两个DDR2/3内存控制器、两个高性能HyperTransport控制器、一个PCI/PCIX控制器以及LPC、SPI、UART、GPIO等低速I/O控制器。龙芯3A的指令系统与MIPS64兼容并通过指令扩展支持X86二进制翻译。 龙芯3号在包括服务器、高性能计算机、低能耗数据中心、个人高性能计算机、高端桌面应用、高吞吐计算应用、工业控制、数字信号处理、高端嵌入式应用等产品中具有广阔的市场应用前景。
工作原理
可用晶体管的数量对处理器性能有巨大影响。如上所述,在8088这样的处理器中,通常要花费15个时钟周期才能执行一条指令。由于乘法器的设计方式,在 8088上进行16位的乘法运算大约需要80个时钟周期。而晶体管越多,就越有可能在一个周期中执行更多的乘法运算。
晶体管数量的增多还使我们能够使用一种称为流水线的技术。在流水线式的体系结构中,指令的执行过程是相互重叠的。所以,虽然需要花费5个时钟周期来执行每条指令,但是可以同时执行5条指令的各个阶段。这样,表面看起来在每个时钟周期内即可执行完一条指令。
许多现代的处理器具有多个指令解码器,每一个都有自己的流水线。这样便存在多个指令流,也就是说每个时钟周期可以完成多条指令。但是这种技术实现起来非常复杂,因此需要使用大量的晶体管。
发展趋势
处理器设计的发展趋势主要是:完全32位的ALU(内置快速浮点处理器)和多指令流的流水线式执行方式。处理器设计的最新进展是64位ALU,预计在下一个十年中家用PC就会用上这种处理器。此外,还存在为处理器添加可高效执行某些操作的特殊指令(例如MMX指令)的趋势,以及在处理器芯片中增加硬件虚拟内存支持和L1缓存的趋势。所有这些趋势都进一步增加了晶体管的数量,导致现在的处理器包含数千万个晶体管。而这些处理器每秒大约可以执行十亿条指令。