監(jiān)控系統(tǒng)解圍企業(yè)應(yīng)用集成平臺(tái)困境
監(jiān)控系統(tǒng)解圍企業(yè)應(yīng)用集成平臺(tái)困境
2011年04月22日08:23【IT168 信息化】
最近我們?yōu)橐患已肫筮M(jìn)行了關(guān)于基于企業(yè)服務(wù)總線(ESB)和面向服務(wù)架構(gòu)(SOA)的企業(yè)應(yīng)用集成(EAI)平臺(tái)的咨詢與實(shí)施,在此過程中,客戶經(jīng)常會(huì)提出這樣的問題:應(yīng)用集成平臺(tái)通常處于企業(yè)信息平臺(tái)的核心位置,很多系統(tǒng)都與集成平臺(tái)關(guān)聯(lián),很多需要跨系統(tǒng)實(shí)現(xiàn)的業(yè)務(wù)都要經(jīng)過集成平臺(tái),因此集成平臺(tái)能否正常的運(yùn)行,將對(duì)企業(yè)的業(yè)務(wù)運(yùn)營產(chǎn)生重要的影響。
那如何才能確保企業(yè)應(yīng)用集成平臺(tái)正常運(yùn)行,保證業(yè)務(wù)運(yùn)營的正常運(yùn)作呢針對(duì)這樣的問題,實(shí)施顧問們都會(huì)建議客戶進(jìn)行集群部署,實(shí)現(xiàn)Fault Tolerance或者Load Balance等等,來確保平臺(tái)的可靠運(yùn)行。除此之外,我還建議客戶建立一套集成平臺(tái)管理監(jiān)控系統(tǒng),對(duì)企業(yè)應(yīng)用集成平臺(tái)以及平臺(tái)上部署的應(yīng)用進(jìn)行管理與監(jiān)控,隨時(shí)掌握平臺(tái)和應(yīng)用的運(yùn)行情況,及時(shí)發(fā)現(xiàn)問題,保證企業(yè)業(yè)務(wù)的正常運(yùn)營。
其實(shí),很多ESB、SOA產(chǎn)品都提供管理和監(jiān)控的功能,比如TIBCO Administrator和Service Performance Management等等,這些產(chǎn)品能除了能夠進(jìn)行集成應(yīng)用的部署、啟動(dòng)等操作之外,也可以進(jìn)行應(yīng)用狀態(tài)的監(jiān)控,但是這些功能對(duì)于企業(yè)應(yīng)用集成平臺(tái)來說還遠(yuǎn)遠(yuǎn)不夠,尤其是對(duì)那些采用分布式應(yīng)用集成平臺(tái)的大型企業(yè),比如我們的客戶。
我建議企業(yè)應(yīng)用集成平臺(tái)管理監(jiān)控系統(tǒng)需要包括如下基本功能:
服務(wù)信息維護(hù)與管理
提到基于SOA的應(yīng)用集成平臺(tái)就不能沒有服務(wù),而且在實(shí)際的實(shí)施中,服務(wù)的形式也多種多樣,除了常用的Web Service,還有其他各種技術(shù)(比如JMS)接口和各類適配器接口。為了能夠充分發(fā)揮這些服務(wù)的作用,提高服務(wù)的重用性,就需要對(duì)這些服務(wù)進(jìn)行維護(hù)和管理,功能包括:
服務(wù)基本信息維護(hù):包括服務(wù)功能、位置、類型、輸入/輸出參數(shù)、調(diào)用方法說明等等,使用戶在需要調(diào)用某種功能的服務(wù)時(shí),能夠快速的查找服務(wù)資源,便于應(yīng)用系統(tǒng)的開發(fā)。
服務(wù)訪問管理:管理和維護(hù)服務(wù)的訪問者信息,以便管理人員能夠了解服務(wù)的應(yīng)用范圍和使用情況,并對(duì)新增加的訪未者(應(yīng)用系統(tǒng))設(shè)置審批流程,防止服務(wù)訪問的隨意性和不可控性。
服務(wù)變更管理:記錄因?yàn)閼?yīng)用系統(tǒng)需求變更產(chǎn)生的服務(wù)版本的變更,并對(duì)訂閱該服務(wù)用戶及應(yīng)用系統(tǒng)發(fā)布變更通知,便于服務(wù)調(diào)用方及時(shí)進(jìn)行更新。
平臺(tái)監(jiān)控:
應(yīng)用集成平臺(tái)通常都會(huì)基于一種或者多種產(chǎn)品平臺(tái)進(jìn)行搭建,這些平臺(tái)運(yùn)行是否正常,決定了整個(gè)應(yīng)用集成平臺(tái)運(yùn)行的穩(wěn)定。雖然很多產(chǎn)品本身自帶了監(jiān)控工具,但是這些監(jiān)控工具提供的功能往往還不能滿足用戶的一些個(gè)性化得需求,尤其是針對(duì)一些大型的客戶采用多種平臺(tái)產(chǎn)品,進(jìn)行分布式部署的時(shí)候。如果能對(duì)這些平臺(tái)產(chǎn)品進(jìn)行統(tǒng)一的監(jiān)控和管理,將會(huì)大大提高應(yīng)用集成平臺(tái)的可靠性。用戶可以使用產(chǎn)品提供的API,比如TIBCO Hawk API來定制化開發(fā)自己的監(jiān)控平臺(tái)產(chǎn)品。平臺(tái)監(jiān)控的功能包括:
平臺(tái)資源監(jiān)控:比如服務(wù)器的CPU占用率、內(nèi)存占用率、磁盤空間等等的監(jiān)控。
平臺(tái)進(jìn)程的監(jiān)控:監(jiān)控平臺(tái)是否運(yùn)行正常,有沒有意外停機(jī)之類。
報(bào)警:在平臺(tái)出現(xiàn)異常時(shí)進(jìn)行報(bào)警,比如向管理員發(fā)送短信提醒等。
集成應(yīng)用管理與監(jiān)控:
集成應(yīng)用是企業(yè)應(yīng)用集成平臺(tái)的核心,是真正幫助企業(yè)實(shí)現(xiàn)集成業(yè)務(wù)的地方。集成應(yīng)用的管理與監(jiān)控既能夠幫助平臺(tái)的運(yùn)維人員掌握平臺(tái)的運(yùn)行情況,也能夠?yàn)闃I(yè)務(wù)用戶對(duì)業(yè)務(wù)的運(yùn)作情況提供參考依據(jù)。功能包括:
應(yīng)用運(yùn)行統(tǒng)計(jì):記錄集成應(yīng)用的運(yùn)行情況,比如某一服務(wù)接口每天進(jìn)行的交易數(shù)量,成功記錄數(shù)、失敗記錄數(shù)等等。
應(yīng)用異常報(bào)警:針對(duì)失敗記錄過多的應(yīng)用進(jìn)行報(bào)警處理,通知管理員及時(shí)查看失敗原因。
應(yīng)用日志管理:管理集成應(yīng)用中的接口日志,運(yùn)行日志,異常日志等等。
業(yè)務(wù)沖正處理:針對(duì)失敗的業(yè)務(wù),管理和設(shè)置他們的沖正處理流程,保證業(yè)務(wù)運(yùn)行的正確性。
評(píng)論排行