3.2 服务器的硬件特征
服务器拆开了说,基本上也是由主板、CPU、内存、硬盘、机箱、电源构成,通常不包含显示器;服务器采取统一管理方式,所以往往也不带鼠标、键盘,这就使得服务器配件也显得比较另类。
3.2.1 服务器主板特征
服务器主板与普通主板最具有相似性,看上去不会觉得多么陌生,如图3-10所示。我们同样可以用服务器的“四性”(SUMA)来揭示服务器主板的特性。所谓“四性”,即“Scalability(可扩展性)”、“Usability(可用性)”、“Managbility(可管理性)”、“Availability(可利用性)”,简称“SUMA”。
图3-10
对于服务器而言,稳定性是首要的,服务器必须能够承担长年累月的高负荷工作,而且不能像台式机一样随意地重启。为了提高可靠性,普遍的采取做法是部件冗余技术,而这一切的支持都最终落在主板的身上。
下面就来看看服务器主板的一些特性。
(1)服务器的可扩展性决定它的专用板型为较大的ATX、EATX(Extended ATX)或WATX(Workstation ATX)。ATX板型一般人都熟悉,EATX是ATX板型的扩展。EATX主板尺寸为12×13英寸(305mm×330mm),较ATX主板更为宽大。由于板型宽大,对机箱的宽容度就有了特殊要求。
(2)中高端服务器主板一般都支持多个处理器,所采用的CPU也是专用的CPU,其中多为Intel“至强”系列。所以可以在服务器主板上看到两个或两个以上的CPU插座,如图3-11所示。
(3)主板的芯片组也是采用专用的服务器芯片组,比如Intel 5500、Intel 602等。不过,也有入门级的服务器主板采用高端的台式机芯片组,只是在稳定性和支持一些服务器应用方面有所增强。
(4)服务器通常要安装多个扩展板卡(比如网卡,SCSI卡等),因此我们通常会发现服务器主板上有较多的PCI、PCI-X插槽。一些PCI-X插槽是64位的,这是普通主板上看不到的,如图3-12所示。
图3-11
图3-12
(5)服务器主板会承载一些管理功能。一般都会在服务器主板上集成各种传感器,用于检测服务器的各种硬件设备;配合相应管理软件,借助这些传感器可以远程检测服务器,从而使网络管理员能够对服务器进行及时有效的管理。
(6)在内存支持方面。由于服务器要适应长时间、大流量的高速数据处理任务,因此服务器对内存的支持可高达十几GB甚至几十GB。因此,服务器主板上常见有4组以上的内存插槽,而且大多支持ECC内存,以提高服务器的可靠性。
(7)在存储设备接口方面。中高端服务器主板多采用SCSI接口、SAS、SATA接口而非IDE接口,并且支持RAID方式,以提高数据处理能力和数据安全性。为了支持更大的硬盘容量,主板上会看到更多的硬盘接口,如图3-13所示。
(8)在显示支持方面。服务器与工作站有很大不同,服务器对显示设备要求不高,一般多采用集成显卡,以确保服务器显示系统的稳定性而不是高性能。当然,图形服务器例外。
(9)在网络接口方面。服务器主板也与台式机主板不同。服务器主板大多配备双网卡,甚至是双千兆、万兆网卡,以满足局域网与Internet的不同需求,如图3-14所示。
图3-13
图3-14
(10)最后是服务器主板的价格。一般台式机主板贵的也不过一两千元,而服务器主板的价格则从一千多元的入门级产品到几万元甚至十几万元的高档产品都有。
3.2.2 服务器的CPU特征
服务器的CPU是服务器与普通计算机的又一重大区别,不仅是快慢的问题。
1.主频和外频
主频即CPU内核工作的时钟频率。CPU的主频=外频×倍频系数。很多人认为主频决定着CPU的运行速度,这是片面的,尤其对服务器而言。CPU的主频与CPU实际的运算能力没有直接关系。在Intel的处理器产品中也可以看到这样的例子:1 GHz Itanium(“安腾”)芯片能够表现的差不多跟2.66 GHz Xeon/Opteron一样快,或是1.5 GHz Itanium 2大约跟4 GHz Xeon/Opteron一样快。
外频是CPU的基准频率,单位也是MHz。CPU的外频决定着整块主板的运行速度。在台式机中,所谓的超频就是超CPU外频。但对于服务器CPU而言,超频是绝对不允许的。如果把服务器CPU超频了,改变了外频,会产生异步运行(台式机很多主板都支持异步运行),这会造成整个服务器系统的不稳定。
2.缓存
缓存大小也是CPU的重要指标之一,缓存的结构和大小对CPU速度的影响很大。CPU内缓存的运行频率极高,一般是和处理器同频运作,工作效率远远大于系统内存和硬盘。
L1 Cache(一级缓存)是CPU第一层高速缓存,分为数据缓存和指令缓存。L1高速缓存的容量和结构对CPU的性能影响较大,不过高速缓冲存储器由静态RAM组成,结构复杂,在CPU管芯面积不能太大的情况下,L1缓存的容量不可能做得太大。一般服务器CPU的L1缓存的容量在32~256KB之间。
L2 Cache(二级缓存)是CPU的第二层高速缓存,分为内部和外部两种芯片。内部芯片二级缓存运行速度与主频相同,而外部的缓存则只有主频的一半。L2高速缓存容量也会影响CPU的性能,原则是越大越好。服务器CPU的L2高速缓存高达1MB,有的达2MB或者3MB。
L3 Cache(三级缓存)的应用可以进一步降低内存延迟,同时提升大数据量计算时处理器的性能。在服务器领域增加L3缓存在性能方面仍有显著提升。现在服务器CPU的三级缓存多在10MB以上,有的高达30MB。
3.指令集
CPU的指令集主要有两种:CISC指令集和RISC指令集。
CISC(Complex Instruction Set Computer)指令集也称为复杂指令集。在CISC处理器中,程序的各条指令是按顺序串行执行的,每条指令中的各个操作也是按顺序串行执行的。顺序执行的优点是控制简单,但计算机各部分的利用率不高,执行速度慢。英特尔生产的x86系列CPU(IA-32架构)及其兼容CPU(如AMD、VIA)、X86-64都属于CISC的范畴。
RISC(Reduced Instruction Set Computing,精简指令集)是在CISC指令系统基础上发展起来的。相比而言,RISC的指令格式统一,种类比较少,寻址方式也比复杂指令集少,当然处理速度就提高了。RISC指令系统更加适合高档服务器的操作系统UNIX,现在Linux也属于类似UNIX的操作系统。RISC型CPU与Intel和AMD的CPU在软件和硬件上都不兼容。
EPIC(Explicitly Parallel Instruction Computers,精确并行指令计算机)是否是RISC和CISC体系的继承者,争论很多。单以EPIC体系来说,它更像Intel处理器迈向RISC体系的重要步骤。从理论上说,按EPIC体系设计的CPU在相同的主机配置下处理Windows的应用软件要比基于UNIX下的应用软件要好得多。Intel采用EPIC技术的服务器CPU是安腾,它是IA-64系列中的第一款产品。IA-64突破了传统IA-32架构的许多限制,在数据的处理能力,系统的稳定性、安全性、可用性等方面获得了突破性的提高。但它有一个重大缺陷,就是缺乏与x86的兼容。
为了解决64位处理器对32位程序的兼容问题,AMD公司设计出了X86-64架构的服务器CPU产品,这就是AMD Opteron系列,中文译名“皓龙”。这种架构的CPU可实现对32位程序的完美兼容。而Intel为了解决IA-64架构的兼容问题,也依照AMD的思路推出了采用EM64T技术的CPU产品,就是现在的“至强”系列。
4.多线程
多线程(Simultaneous Multithreading,SMT)可通过复制处理器上的结构状态,让同一个处理器上的多个线程同步执行并共享处理器的执行资源,可最大限度地实现宽发射、乱序的超标量处理,提高处理器运算部件的利用率,缓和由于数据相关或Cache未命中带来的访问内存延时。多线程技术则可以为高速的运算核心准备更多的待处理数据,减少运算核心的闲置时间。Intel从3.06GHz Pentium 4开始,所有处理器都支持SMT技术。最新的“至强”CPU多为8~16线程。
5.多核心
多核心,也指单芯片多处理器(Chip Multi Processors,CMP),其设计思想是:将大规模并行处理器中的SMP(对称多处理器)集成到同一芯片内,各个处理器并行执行不同的进程。与多线程相比,由于CMP结构被划分成多个处理器核来设计,每个核都比较简单,有利于优化设计,因此更有发展前途。2005年下半年起,Intel和AMD的新型处理器都开始融入CMP结构。Intel最新的服务器CPU核心数从双核心、4核心、6核心、8核心到10核心不等,AMD还有16核心的产品。
6.多路
对称多处理结构(Symmetric Multi-Processing,SMP),是指在一个计算机上汇集一组多个处理器。在这种技术的支持下,一个服务器系统可以同时运行多个处理器,并共享内存和其他的主机资源。例如,双“至强”,也就是我们所说的二路,这是在对称处理器系统中最常见的一种(“至强”SMP可以支持到四路,AMD皓龙可以支持1~8路)。但一般来讲,SMP结构的服务器可扩展性较差,很难做到100个以上的处理器,常规的是8~16个。UNIX系统的服务器可支持最多256颗CPU。
7.制造工艺
制造工艺的纳米(nm)是指IC内电路与电路之间的距离。制造工艺的趋势是向密集度愈高的方向发展。密度愈高的IC电路设计,意味着在同样大小面积的IC中可以拥有密度更高、功能更复杂的电路设计。现在的CPU制造工艺从90nm、45nm、32nm到22nm都有。
3.2.3 服务器的内存特征
服务器内存与个人计算机内存在外观和结构上没有什么明显的区别,主要是在内存上引入了一些新的特有的技术,如ECC、ChipKill等,具有极高的稳定性和纠错性能。
1.ECC
在普通内存上常常使用一种叫作同位检查码(Parity check codes)的技术,用于侦测一个字符中所有奇(偶)同位的错误。但Parity有一个缺点,当计算机查到某个Byte有错误时,并不能确定错误在哪一位,无法修正错误。基于上述情况,产生了一种新的内存纠错技术,就是ECC。
ECC(Error Checking and Correcting)对应的中文名称叫作“错误检查和纠正”,从这个名称可以看出它的主要功能是“发现并纠正错误”,它比奇偶校正技术更先进的方面主要在于,它不仅能发现错误,而且能纠正这些错误,确保服务器的正常运行。ECC内存主要是从SD内存开始得到广泛应用,而新的DDR、RDRAM也有相应的应用,目前主流的ECC内存其实是一种SD内存。
2.Chipkill
ECC内存只能同时检测和纠正单一比特错误,如果同时检测出两个以上比特的数据有错误,则无能为力。Chipkill技术正是IBM公司为解决ECC技术的不足而开发的一种新的ECC内存保护标准。
随着基于Intel处理器架构的服务器的CPU性能以几何级的倍数提高,而硬盘驱动器的性能同期只提高了少数的倍数,因此为了获得足够的性能,服务器需要大量的内存来临时保存CPU上需要读取的数据,这样大的数据访问量就导致单一内存芯片上每次访问时通常要提供4(32位)或8(64位)比特以上的数据,一次性读取这么多数据,出现多位数据错误的可能性会大大地提高,而ECC又不能纠正双比特以上的错误,这可能造成全部比特数据的丢失。Chipkill技术是利用内存的子结构方法解决了这一难题,使服务器的可靠性和稳定得到了更加充分的保障。
3.Register
Register即寄存器或目录寄存器,在内存上的作用它可以理解为书的目录,有了它,当内存接到读/写指令时,会先检索此目录,然后再进行读/写操作,这将大大提高服务器内存的工作效率。带有Register的内存一定带Buffer(缓冲),并且目前能见到的Register内存也都具有ECC功能,主要应用在中高端服务器及图形工作站上。
4.FB-DIMM
FB-DIMM(Fully Buffered-DIMM,全缓冲内存模组)是Intel在DDR2、DDR3的基础上发展出来的一种新型内存模组与互连架构,既可以搭配现在的DDR2内存芯片,也可以搭配DDR3内存芯片。FB-DIMM可以极大地提升系统内存带宽,并且极大地增加了内存最大容量。
3.2.4 服务器的硬盘特征
很多人以为服务器硬盘与个人计算机硬盘相同,殊不知二者也存在很多差异。
1.更高的稳定性和可靠性
服务器一般需要24×7小时不停地运行,因此,服务器硬盘对稳定性和可靠性有着很高的要求。一般来说服务器硬盘主要从以下3个方面来保证其稳定性和可靠性。
(1)服务器硬盘采用了S.M.A.R.T技术(自监测、分析和报告技术),同时各硬盘厂商也会采用各自独有的先进技术来保证其数据的安全性,例如希捷与IBM的DST(驱动器自我检测)和DFT(驱动器健康检测)技术。
(2)服务器硬盘一般会采用冗余磁盘阵列(RAID)技术,RAID简而言之就是把同样份数据分别保存在不同的硬盘中,这样当其中一个硬盘发生损坏时可以从另一个硬盘进行据恢复。
(3)为了避免意外碰撞,服务器硬盘在抗外力方面都做了特殊处理,一般都能够承受300GB~1000GB的冲击力。
2.支持热插拔
热插拔(HotSwap)是服务器支持的一种硬盘安装方式,它可以在服务器不停机的情况下,拔出或插入一块硬盘,操作系统可以自动识别硬盘的改动。例如,SCSI硬盘有专门支持热拔插技术的SCA2接口(80-pin),在与SCSI背板配合使用的情况下实现硬盘的热拔插。这种技术对于24小时不间断运行的服务器来说,是非常必要的。
3.更快的硬盘速度
服务器硬盘转速比较快,可以达到7200 r/min、10000 r/min、15000 r/min甚至更高,而普通硬盘基本上都在10000 r/min以下;另外,由于服务器需要进行频繁的读/写操作,所以硬盘缓存的作用也不容忽视,一般服务器硬盘的缓存为8MB、16MB,甚至更高。另外,在平均访问时间、外部传输率及内部传输率等参数上也都比普通硬盘具有更多优势。
4.更多样的硬盘类型
目前,服务器市场上采用的硬盘主要有3种:SATA硬盘、SCSI硬盘及SAS硬盘,其中SATA硬盘主要应用在低端服务器领域,而SCSI和SAS硬盘则面向中高端服务器。
(1)SATA硬盘
SATA(Serial Advanced Technology Attachment)是串行ATA的缩写。与并行ATA硬盘相比(见图3-15),SATA硬盘(见图3-16)在接口上有着很大的不同。首先,SATA以连续串行的方式传送数据,一次只会传送1位数据,这样能减少SATA接口的针脚数目,使连接电缆数目变少,效率也会更高。实际上,SATA仅用4支针脚就能完成所有的工作,分别用于连接电缆、连接地线、发送数据和接收数据,同时这样的架构还能降低系统能耗和减小系统复杂性。
图3-15
图3-16
其次,SATA的起点更高、发展潜力更大,SATA 1.0定义的数据传输率可达150MB/s,比并行ATA(ATA/133)所能达到的133MB/s的最高数据传输率还高,而SATA2.0的数据传输率可达到300MB/s,SATA3.0的数据传输率可达到350MB/s,最终SATA将实现600MB/s的数据传输。
(2)SCSI硬盘
SCSI(Small Computer System Interface)是一种专门为小型计算机系统设计的存储单元接口模式(见图3-17),可以对计算机中的多个设备进行动态分工操作,对于系统同时要求的多个任务可以灵活机动地适当分配,动态完成。
SCSI规范发展到今天,已经是第六代了,从刚创建时的SCSI(8bit)、WideSCSI(8bit)、UltraWideSCSI(8bit/16bit)、UltraWideSCSI2(16bit)、Ultra160SCSI(16bit)到今天的Ultra320 SCSI,速度从1.2MB/s到现在的320MB/s有了质的飞跃。目前主流的SCSI硬盘都采用了Ultra320 SCSI接口,能提供320MB/s的接口传输速度。
(3)SAS硬盘
SAS(Serial Attached SCSI),即串行连接SCSI,如图3-18所示。SAS是新一代的SCSI技术,和现在流行的Serial ATA(SATA)硬盘相同,都是采用串行技术以获得更高的传输速度。目前,SAS硬盘传输数据可以达到3.0Gbit/s,其SAS扩展器多为12端口。第二代和第三代的SAS界面将提供6~12Gbit/s的数据带宽。
图3-17
图3-18
SAS技术引入了SAS扩展器,使SAS系统可以连接更多的设备,其中每个扩展器允许连接多个端口,每个端口可以连接SAS设备、主机或其他SAS扩展器。为保护用户投资,SAS规范兼容SATA,这使得SAS的背板可以兼容SAS和SATA两类硬盘。
3.2.5 服务器的机箱特征
服务器机箱较之于个人计算机机箱更加丰富多彩。但与更注重外观设计的普通台式机机箱不同,服务器机箱功能性更强,更注重品质与内涵。
(1)在用料上,服务器机箱绝少使用塑料、彩塑、有机玻璃等材质,钢板及铝合金是其主要的用料,如常见的电镀锌、热镀锌、镀铝锌都是服务器机箱常见的用料。此外,铝合金也是服务器机箱常见的用料之一。铝合金密度低,但强度比较高,塑性好,可加工成各种型材,具有优良的导电性、导热性和抗蚀性,在服务器机箱上使用广泛。
(2)考虑到服务器的稳定性需求,服务器机箱在散热性上一定要做得到位。例如,在散热通道的设计上一定要合理,要求服务器机箱可形成前进后出或下进上出的合理的通风散热通道,以便及时带走机箱内的大量热量,保证服务器的稳定运行。又如,由于服务器大多会采用多处理器或多硬盘的组合,或使用机柜的形式形成服务器集群,所以要求服务器机箱的散热器配备及风扇位一定要满足散热需求。
(3)扩展能力和冗余性强否也是服务器机箱设计是否合理的重要因素。这要求服务器机箱要有比普通机箱更强的扩充能力,以备网络扩充、硬盘扩充、外设扩充之用。服务器机箱一般必须配备专门的冗余风扇或电源(见图3-19和图3-20),当一些风扇或电源发生故障时,要求冗余风扇或电源可立刻接替工作。
图3-19
图3-20
除此之外,服务器机箱的安全性(如可上锁等)、安全认证更严格,可靠性、易维护性等方面都比普通机箱做得更好。
3.2.6 服务器的冗余设计
在一些较高档的服务器中,一台服务器中会有两个电源,多个风扇及并没有真正连接的网卡,它们都是用于当工作中的相同部件出现故障时来接替工作的,俗称“冗余”。冗余设计对确保服务器的高稳定性、不间断工作非常重要。
电源、风扇和网卡冗余都比较容易理解,直接替换即可。而对于硬盘,一般来说,用于冗余的硬盘也要定期和工作的硬盘进行同步,只有这样才可以使冗余硬盘接替工作后能够立即提供软件或网络存储服务。
另外,热插拔技术主要是方便对服务器的维护,如硬盘容量不足,或者是发现某个硬盘损坏,支持热插拔的硬盘可以直接从服务器上拔下来进行维修,而这一切操作都不需要关闭服务器系统,保证服务器的不间断运行。
目前主要支持热插拔技术的有硬盘(见图3-21所示)、电源(见图3-22所示)、风扇、PCI适配卡(主要是指网卡)等。目前还有些较高档的服务器支持内存、CPU的热插拔。
图3-21
图3-22