作為提供主機(jī)級(jí)別高可用性的服務(wù)器產(chǎn)品,容錯(cuò)服務(wù)器的概念近年來(lái)在中國(guó)用戶中得到普及,但不可否認(rèn)的是,在用戶心目中尚有諸多關(guān)于容錯(cuò)服務(wù)器的誤讀。   近日,本報(bào)記者獨(dú)家專(zhuān)訪NEC信息系統(tǒng)(中國(guó))有限公司信息通信系統(tǒng)事業(yè)部總經(jīng)理大島清志及NEC東京總部IT平臺(tái)全球事業(yè)部中國(guó)大區(qū)總經(jīng)理加藤啟,就這些誤區(qū)進(jìn)行了交流。   誤讀一:容錯(cuò)很好很昂貴   由于容錯(cuò)服務(wù)器采用的是硬件全冗余的技術(shù),而且在兩套硬件之間還通過(guò)獨(dú)立芯片和軟件保證故障時(shí)零時(shí)間切換,因而其價(jià)格要比同規(guī)格的PC服務(wù)器高出許多。   在中國(guó)做了四年容錯(cuò)服務(wù)器的大島清志則表示,他接觸到更為典型的一個(gè)用戶反饋是:NEC容錯(cuò)服務(wù)器產(chǎn)品很好,可用性很高,但是不是像IBM的z系列和HP的NonStop系列動(dòng)輒都是百萬(wàn)美元?   從上述兩種態(tài)度可以看出中國(guó)用戶對(duì)容錯(cuò)的應(yīng)用定位尚屬模糊。根據(jù)IDC數(shù)據(jù),廣義概念上的容錯(cuò)市場(chǎng)約占整個(gè)服務(wù)器市場(chǎng)的4%,包括IBM的System z、HP的NonStop和NEC的Santa Clara、Express 5800/ft以及Stratus的ftServer 6200,前三者為傳統(tǒng)大型主機(jī),后二者為容錯(cuò)服務(wù)器。顯而易見(jiàn),這一市場(chǎng)面對(duì)的是屬于中高端的窄眾用戶。   而了解上述用戶特征后自然明白,容錯(cuò)所謂的昂貴其實(shí)純屬誤讀:如果只需要進(jìn)行基礎(chǔ)IT建設(shè)的成長(zhǎng)型企業(yè),完全可以采用普通的塔式和機(jī)架式服務(wù)器,而不必使用容錯(cuò)產(chǎn)品;如果是需要高可用性的中高端用戶,那么容錯(cuò)服務(wù)器相對(duì)大型主機(jī)而言,其實(shí)相當(dāng)便宜。大島清志介紹說(shuō),以NEC的容錯(cuò)服務(wù)器Express 5800/ft為例,目前最低配置的成本甚至已經(jīng)與同規(guī)格的雙機(jī)熱備方案相當(dāng)。   誤讀二:虛擬化取代容錯(cuò)   隨著用戶對(duì)計(jì)算資源利用率、靈活調(diào)度的高度渴求,導(dǎo)致近幾年來(lái)虛擬技術(shù)在PC服務(wù)器上快速增長(zhǎng),VMware、Citrix等技術(shù)供應(yīng)商也迅速走紅,由此也產(chǎn)生了這樣一種觀念:虛擬萬(wàn)能,即通過(guò)虛擬就能實(shí)現(xiàn)計(jì)算資源的靈活配置、調(diào)度并保證故障時(shí)的自動(dòng)遷移。   虛擬化真是萬(wàn)靈丹嗎?顯然不是。從硬件架構(gòu)的層次上看,虛擬層位于底層硬件之上,只能解決虛擬機(jī)及其應(yīng)用的故障遷移。如果是底層硬件故障,諸如主板故障、電源故障、CPU損壞等,虛擬技術(shù)是無(wú)能為力的。   大島清志認(rèn)為,隨著虛擬化技術(shù)的普及,容錯(cuò)服務(wù)器會(huì)變得越來(lái)越重要。因?yàn)楫?dāng)物理機(jī)宕掉的時(shí)候,它會(huì)影響運(yùn)行在其上的虛擬機(jī),所以越是依賴虛擬技術(shù)的用戶越需要保證底層硬件的高可用。   誤讀三:容錯(cuò)使用很復(fù)雜   對(duì)于使用過(guò)大型主機(jī)和雙機(jī)熱備等高可用方案的用戶來(lái)說(shuō),配置及管理系統(tǒng)絕對(duì)是一個(gè)技術(shù)上的考驗(yàn)。這也使得一些用戶產(chǎn)生了“高可用等于高復(fù)雜”的觀點(diǎn)。   而容錯(cuò)服務(wù)器的優(yōu)勢(shì)恰恰在于簡(jiǎn)化的配置及管理。加藤啟介紹,采用NEC ESMPRO作為服務(wù)器管理工具,不須修改應(yīng)用程序,就可在NEC Express 5800/ft系列服務(wù)器上運(yùn)行支持Windows和Linux的應(yīng)用程序,不必像其他容錯(cuò)產(chǎn)品那樣需要特殊的API或腳本。   當(dāng)故障排除后,故障模塊重新啟動(dòng)時(shí),NEC ESMPRO將自動(dòng)執(zhí)行重新配置,并且根據(jù)需要,能夠?qū)κ苡绊懩K進(jìn)行重新同步。此外,NEC還通過(guò)在線更新技術(shù)保證無(wú)宕機(jī)的應(yīng)用程序更新功能。   容錯(cuò)服務(wù)器技術(shù)特性   容錯(cuò)服務(wù)器的技術(shù)特性在于高可用,即當(dāng)系統(tǒng)組件發(fā)生一個(gè)或多個(gè)錯(cuò)誤時(shí)系統(tǒng)仍可正常工作。   容錯(cuò)服務(wù)器不同于基于軟件的錯(cuò)誤恢復(fù)集群。后者當(dāng)出現(xiàn)硬件或者軟件失效時(shí),服務(wù)器會(huì)將負(fù)載移到另一個(gè)服務(wù)器上。即使高端非容錯(cuò)服務(wù)器采用了一些冗余組件,當(dāng)非冗余的組件失效時(shí),這些服務(wù)器最終依然會(huì)失效。   而在容錯(cuò)服務(wù)器中,冗余組件執(zhí)行著同樣的指令,且自我檢測(cè)技術(shù)會(huì)在組件級(jí)監(jiān)測(cè)并隔離錯(cuò)誤。當(dāng)錯(cuò)誤發(fā)生時(shí),冗余組件繼續(xù)工作。   來(lái)源:中國(guó)計(jì)算機(jī)報(bào) 作者:謝文硯