(2)接入服務器:接入服務器為營業(yè)系統(tǒng)提供自建營業(yè)廳、合作營業(yè)廳、代辦點、連鎖店等所有的營業(yè)終端接入服務,以及電子渠道等營業(yè)相關(guān)業(yè)務接入,通過網(wǎng)頁的形式展現(xiàn)。前端訪問請求可以通過負載均衡器,分配訪問量到各個WEB Server。這樣,即使有某臺Server出現(xiàn)故障,其他Server將繼續(xù)提供服務,接入服務器群主要采用HP ProLiant BladeSystem刀片服務器系統(tǒng),機型是基于AMD四核皓龍的HP Blade System BL465c G5,BL465c 配備兩顆AMD四核皓龍?zhí)幚砥?,具有與標準 1U 機架安裝式服務器相同的特性,集成了節(jié)能的計算功能和高密度性、擴展的內(nèi)存和 I/O,極大地提高了性能。此款均衡架構(gòu)帶有AMD 四核皓龍TM處理器、DDR2 內(nèi)存、串行硬盤、多功能千兆網(wǎng)絡支持和多 I/O 卡,可提供一個適合多種應用的高性能系統(tǒng)。尤其是采用的AMD四核皓龍TM處理器,憑借直連架構(gòu)以及超傳輸總線和集成內(nèi)存控制器等優(yōu)秀技術(shù),為接入服務器帶來了業(yè)界領先的性能和穩(wěn)定性。同時,外形小巧的 BL465c 中還包括確保高可用性的特性,如熱插拔硬盤驅(qū)動器、內(nèi)存交錯、嵌入式 RAID 功能、以及提高的遠程 Lights-Out 管理。采用HP C7000機箱,10U高,可放16個半高或8個全高的刀片服務器,
(3)數(shù)據(jù)庫服務器:直接與應用服務器進行數(shù)據(jù)交換,應用服務器訪問數(shù)據(jù)庫進行數(shù)據(jù)操作,數(shù)據(jù)庫服務器采用RAC方式提供性能和可靠性的保證,數(shù)據(jù)庫服務器采用UNIX小型機。
在進行CRM應用服務器替換為刀片服務器的同時,CRM應用、部署進行了相應的優(yōu)化、調(diào)整,保證設備替換后系統(tǒng)運行的高性能、高穩(wěn)定性。
(1)CRM應用優(yōu)化。針對應用部署的集群化,優(yōu)化應用發(fā)布模塊,實現(xiàn)應用分布式、自動化部署。優(yōu)化系統(tǒng)監(jiān)控模塊提供對分布式系統(tǒng)應用追蹤、監(jiān)控功能,實現(xiàn)對服務、事物/數(shù)據(jù)庫連接、系統(tǒng)訪問、SQL的多方面監(jiān)控。及時發(fā)現(xiàn)問題和缺陷并進行優(yōu)化調(diào)整。如:服務跟蹤功能可以實時進行營業(yè)員前臺操作、后臺服務調(diào)用、數(shù)據(jù)庫數(shù)據(jù)操作的整個操作軌跡的跟蹤、分析。
(2)應用整合。CRM應用架構(gòu)整合所有業(yè)務功能,而不是原有的一套業(yè)務屬性對應一套業(yè)務系統(tǒng)。在每臺服務器上均部署相同的應用,通過設置實現(xiàn)不同服務器/業(yè)務域?qū)崿F(xiàn)不同的功能;單個模塊或者功能點的失效、升級或者failover通過模塊控制進行設置。
(3)應用部署集群化。CRM應用采用集群部署,將若干服務器設置為一個功能域,為特定的接入渠道服務;同時,同一集群的刀片分布于不同的機框中,避免一個機柜故障導致整個應用集群的不可用。采用分散部署的方式可以在單個進程/設備/機柜不可用情況下由其他設備進行應用分擔,任一點出現(xiàn)問題,不會造成系統(tǒng)整體影響問題,提高系統(tǒng)的可用性。
(4)應用部署自適應調(diào)整機制。不同應用集群應用負載設置性能壓力閾值,當某個集群壓力超過閾值將自適應/手工進行調(diào)整,使用備用集群或其它集群部分資源進行負載分擔。當業(yè)務量降低,又會調(diào)整回去。通過自適應調(diào)整機制均衡各應用集群的能力。
(5)設置備用刀片集群。當生產(chǎn)設備故障時可以將應用接入到備用集群;同時,在應用系統(tǒng)升級、生產(chǎn)設備檢修時也可以將應用切換到備用集群上。通過備用刀片集群的設置提升了系統(tǒng)的穩(wěn)定性和可維護性。
業(yè)務支撐系統(tǒng)應用刀片服務器效果分析
1.降低購置成本
如果用8臺機架式服務器和8臺基于AMD皓龍?zhí)幚砥鞯牡镀掌飨啾容^,帶有光纖通道連接的HP BladeSystem的成本比機架式服務器成本低15-2%,服務器數(shù)量超過3-4臺之后,購買刀片服務器就要比傳統(tǒng)機架式服務器更加經(jīng)濟。
采用上面相同的比較,不帶光纖通道連接的HP BladeSystem(只有內(nèi)部驅(qū)動器)的成本比同級別機架安裝基礎設施成本低1-4%,服務器數(shù)量超過6-8臺之后,購買刀片服務器就要比傳統(tǒng)機架式服務器更加經(jīng)濟。
2.降低運營成本
初始設置時間從每臺服務器12小時降低到30分鐘,實施變更和重新配置的時間從4小時降低到30分鐘,假設每小時的平均管理成本為43美元,若使用基于AMD皓龍?zhí)幚砥鞯腍P BladeSystem,每年100臺服務器的成本可從68800美元降低到8600美元。
與采用專用服務器存儲相比,采用網(wǎng)絡存儲可管理多達6倍的存儲,從而將從存儲管理節(jié)省的資源用于戰(zhàn)略創(chuàng)新。
3.更好的性能表現(xiàn)
采用分布式系統(tǒng)設計和操作系統(tǒng)優(yōu)秀的內(nèi)核應用處理效率獲得顯著提升。CRM部分業(yè)務的性能提高在30%-50%之間。
現(xiàn)有系統(tǒng)采用集群方式部署、分布式計算,在計算能力提升的同時有效降低單主機負載。采用小型機時,主機忙時平均負載在35%;替換后,單主機忙時平均負載降低到20%。
4.更高可用性
(1)系統(tǒng)可用性提升
河南移動CRM系統(tǒng)的刀片服務器安置于多臺機柜中,應用劃分為多個業(yè)務組,同一分組的應用部署于不同機柜的刀片上。通過應用部署避免設備故障導致全系統(tǒng)癱瘓。
系統(tǒng)提供故障節(jié)點判斷能力,當發(fā)現(xiàn)某進程/設備故障時,系統(tǒng)自動將請求分發(fā)至其他節(jié)點并進行告警,由于采用多服務器集群方式進行負載分擔,降低了單節(jié)點故障對整體系統(tǒng)影響。
系統(tǒng)提供應用分組負載自適應調(diào)整機制,某分組壓力過大時,可以將服務請求分流至其他低負載分組上。
設置備用刀片組作為系統(tǒng)設備冗余。備用服務器上應用部署與其他設備相同,處于在線運行狀態(tài),當生產(chǎn)設備故障、應用升級、設備檢修時可以將服務請求接入至備用集群。
(2)硬件可用性提升
刀片服務器具備"熱插拔"的能力。某臺刀片設備故障時,僅需將故障刀片拖出機箱,插入新刀片替換即可。
整合的基礎設施可避免由于各種原因所造成的停機現(xiàn)象,諸如線纜、服務器、存儲、開關(guān)故障;人為配置錯誤、以及軟件、電源和散熱問題。解決上述問題的時間大幅度減少,每年計劃內(nèi)和計劃外的停機時間可減少近100%;設備內(nèi)建N+1冗余,因而無需閑置、備用的部件,另外還提供了N+1冗余設計,因此而降低了冗余硬件成本。
5.更高可維護性
刀片服務器通過集群方式提供高性能的服務,但設備數(shù)量成倍增加給系統(tǒng)的維護、管理帶來一定的難度和工作量的增加??紤]到這一問題,CRM系統(tǒng)提供了自動部署和系統(tǒng)服務追蹤、監(jiān)控功能,保證應用服務器刀片化的同時系統(tǒng)仍具備高可維護性。
自動應用部署支持自動化、分布式的部署方式,極大簡化應用部署。發(fā)布通過控制設備支持全量、增量可視化發(fā)布,整個發(fā)布過程無須人工干預,僅需要15分鐘;支持針對不同邏輯業(yè)務組定向發(fā)布。通過平臺發(fā)布組件的應用自動發(fā)布功能,系統(tǒng)不因服務器數(shù)量的增加而增加發(fā)布的工作量和差錯率。
CRM系統(tǒng)實現(xiàn)了追蹤、監(jiān)控功能,可以實現(xiàn)對服務、事物/數(shù)據(jù)庫連接、系統(tǒng)訪問、SQL的多方面監(jiān)控。及時發(fā)現(xiàn)問題和缺陷并進行優(yōu)化調(diào)整。如:服務跟蹤功能可以實時進行營業(yè)員前臺操作、后臺服務調(diào)用、數(shù)據(jù)庫數(shù)據(jù)操作的整個操作軌跡的跟蹤、分析。系統(tǒng)的實時監(jiān)控、服務狀態(tài)跟蹤和故障定位能力使維護人員可以及時發(fā)現(xiàn)薄弱環(huán)節(jié)、準確定位問題從而指導系統(tǒng)優(yōu)化。
系統(tǒng)使用刀片服務器替換后,數(shù)據(jù)中心設備與管理員的比例大為降低,節(jié)省大量的管理投入。
6.更高可擴展性
軟件系統(tǒng)由于采用J2EE技術(shù),具備了跨平臺運行能力和極強的擴展能力。系統(tǒng)在不進行任何編碼的情況下,可以實時,在線的進行容量擴展,利用更多的設備,為移動業(yè)務發(fā)展提高更高的保證。
硬件設備擴容上,刀片服務器可以通過在線/離線增加設備的方式進行擴容和優(yōu)化,即Scale out模式。刀片集群擴展時,僅需要根據(jù)處理能力需求將擴容刀片插入機框即可。系統(tǒng)可以實時、在線的進行容量擴展。
采用全新的軟件架構(gòu)與刀片服務器的CRM系統(tǒng)擴容更加靈活性、簡便。計算能力需求實現(xiàn)的顆粒度更加細致。
7.更好的節(jié)能減排效果
通過CRM應用服務器替換,因為引入了節(jié)能高效的AMD四核皓龍?zhí)幚砥?,標?2U機柜占用減少40%,耗電量更是節(jié)省高達57%。
8.線纜復雜度降低
傳統(tǒng)服務器架構(gòu)的布線增加了巨大的復雜性,是系統(tǒng)停機和不靈活的一個主要根源。
采用刀片服務器可以減少87%的線纜,平均每個1000M網(wǎng)絡端口可節(jié)約100到350美元。
通過先進的采用IP的iLO2管理功能,消除了KVM交換機和線纜的需要,每個機架可另外節(jié)省高達25000美元。
創(chuàng)新性分析
1.設備選擇創(chuàng)新
率先在業(yè)務支撐系統(tǒng)的核心應用系統(tǒng)中采用刀片服務器,與傳統(tǒng)的UNIX服務器相比,刀片服務器的采購成本大大降低,且具備占用空間小、耗電量低、管理和配置簡單靈活等特點,在實際的系統(tǒng)運營過程中同時降低了機房空間、耗電和管理成本。
2.系統(tǒng)架構(gòu)創(chuàng)新
傳統(tǒng)的業(yè)務支撐系統(tǒng)應用服務器部署一般采用集群軟件形成主備方式的集群,當主服務器發(fā)生故障時,集群軟件監(jiān)測到故障,自動將系統(tǒng)和應用切換到備份服務器上。河南移動BOSS3.0 CRM系統(tǒng)應用服務器采用統(tǒng)一開發(fā)、運行平臺,所有的應用服務器統(tǒng)一提供對外服務,業(yè)務邏輯分布在多個節(jié)點上處理,單臺節(jié)點發(fā)生故障不影響系統(tǒng)正常服務,從另外一個層面提供了系統(tǒng)可靠性保證。
此外,系統(tǒng)性能的擴展也可以通過增加服務器節(jié)點的方式實現(xiàn),不需要停止現(xiàn)有的應用服務,簡單靈活。
3.系統(tǒng)運營管理創(chuàng)新
新系統(tǒng)建成后,整體的系統(tǒng)管理從單一服務器管理轉(zhuǎn)換為刀片服務器集群管理,利用HP刀片服務器完善的管理工具,新服務器的擴展從傳統(tǒng)的單機安裝、連線、加電、配置、上線,轉(zhuǎn)換成插板、集群配置和發(fā)布、上線,大大降低了系統(tǒng)升級、配置和管理的工作量。