既要治理對(duì)內(nèi)的應(yīng)用程序又要治理對(duì)外的 Web 站點(diǎn),這種多樣性的工作使得 Steve 的團(tuán)隊(duì)擁有另人驚異的、全方位的、使用 Oracle 產(chǎn)品的、綜合的 Web 經(jīng)驗(yàn)。 Steve 說,“我們已經(jīng)部署了 OracleAS Container for J2EE (OC4J)應(yīng)用程序、Web 高速緩存、移動(dòng)服務(wù)、文件代理、門戶—您可以講出這些名詞,而我們可能已經(jīng)將這些東西應(yīng)用到生產(chǎn)環(huán)境中服務(wù)于大量的用戶并要求這些應(yīng)用程序具有最好的可視性和可靠性。”
但是無論是一個(gè)內(nèi)部的應(yīng)用程序、一個(gè) Web 站點(diǎn)還是一項(xiàng)托管服務(wù),對(duì)于 Steve 的團(tuán)隊(duì),每種情況都面臨著相同的商務(wù)問題。“它總是具有很高的可用性。多年以來,我們發(fā)現(xiàn)我們正在對(duì)內(nèi)部或外部的用戶提供服務(wù)并不會(huì)對(duì)它產(chǎn)生什么影響。同樣的規(guī)則也適用于我們?nèi)绾蝸斫咏?shí)現(xiàn)高的可用性。”
而且為一家業(yè)界領(lǐng)先的、全球性的軟件公司工作,也給我們帶來了一些不平常的挑戰(zhàn)。Steve 說,“Oracle 是時(shí)刻變化的環(huán)境,在這里存在很多偉大的思想,一個(gè)嶄新的應(yīng)用程序可能在第二天就過時(shí)了。我們?cè)?Global IT 中的工作就是確保 Oracle 在這些站點(diǎn)所部署的應(yīng)用程序是穩(wěn)定的,并運(yùn)行得很好。從本質(zhì)上講,我們提供硬件和軟件,來公司的站點(diǎn)和部署服務(wù)。
開始著手預(yù)備并加馬上運(yùn)行起來 對(duì)于 Steve 的團(tuán)隊(duì),部署新應(yīng)用程序的過程是一門藝術(shù)也是一門科學(xué)。Steve 團(tuán)隊(duì)要與研發(fā)人員,以及 Oracle 內(nèi)部的設(shè)計(jì)師、網(wǎng)絡(luò)組、數(shù)據(jù)中心團(tuán)隊(duì),甚至是采購(gòu)人員進(jìn)行大量的協(xié)調(diào)工作。下面 Steve 將解釋這一過程:
“一旦有一個(gè)新的研發(fā)項(xiàng)目需要我們來進(jìn)行部署,就會(huì)牽涉到許多部門。就象畫畫一樣,我們?cè)?Global IT 就是一塊空白的畫布。開發(fā)團(tuán)隊(duì)可以向我們提供所有的顏料和畫筆。然后我們就將不同的部分整合在一起形成一幅畫。我們從網(wǎng)絡(luò)連接開始,這樣我們就可以將所需要的新服務(wù)器接入到 Oracle 的主干網(wǎng)中。
“然后我會(huì)與采購(gòu)和運(yùn)作部門相互配合來選購(gòu)最適合于該項(xiàng)目的服務(wù)器。我還會(huì)與 Global IT 中的體系結(jié)構(gòu)組相互配合來確保我所要購(gòu)買的服務(wù)器能夠滿足新應(yīng)用程序的需要并能被我們現(xiàn)有的基礎(chǔ)架構(gòu)所支持。
Steve 的團(tuán)隊(duì)最終確定實(shí)施這一項(xiàng)目的最佳方式就是按從前端到后臺(tái)的方式進(jìn)行。“最終目標(biāo)就是要將 OTN 移植到門戶上。但是我們還希望運(yùn)行在 linux 上的 OTN 可以真正證實(shí) Oracle 的 Linux RAC 解決方案是可行的。基于這一點(diǎn),我們希望新的 OTN 的性能即使不能超越現(xiàn)有 OTN 的性能,也不能比現(xiàn)在差。為此使用現(xiàn)有 OTN 的性能指標(biāo)數(shù)值,我們可以向后對(duì)比的方式來工作,以確定什么是新體系結(jié)構(gòu)所需要的。”
明確性能目標(biāo)幫助 Steve 的團(tuán)隊(duì)架構(gòu)了這個(gè)新的門戶解決方案,但這還不能稱作是真正的科學(xué)。 “前端是 Web 高速緩存,以及 HTTP 服務(wù)器和門戶服務(wù)器。其后則是位于兩節(jié)點(diǎn) RAC 集群上的數(shù)據(jù)庫(kù)服務(wù)器,為門戶數(shù)據(jù)庫(kù)提供服務(wù)。”
除了產(chǎn)品的體系結(jié)構(gòu)以外,Steve 確保有一個(gè)階梯層作為開發(fā)的一部分。“假如沒有臨時(shí)分區(qū),我們就寸步難行。”,他這樣解釋說。“這是我們的必由之路,因?yàn)樵谀氵M(jìn)行測(cè)試和部署的時(shí)候,你會(huì)想要將可能出錯(cuò)的地方劃定在一個(gè)區(qū)域內(nèi),并進(jìn)行驗(yàn)證,得出結(jié)論。”例如,你可能認(rèn)為在 Web 高速緩存中調(diào)整一個(gè)參數(shù)會(huì)出現(xiàn)問題,但最后卻發(fā)現(xiàn)這樣做是不對(duì)的。為了回過頭來再次進(jìn)行觀察,同時(shí)又不想中斷生產(chǎn),那就必須將臨時(shí)分區(qū)作為系統(tǒng)的一部分。”
利用 Oracle 產(chǎn)品套件(Oracle 應(yīng)用服務(wù)器和 Oracle 數(shù)據(jù)庫(kù))中構(gòu)建的高可用性,就有可能配置和架構(gòu)一個(gè)解決方案使這些特性發(fā)揚(yáng)光大。使用 Dell/Linux 解決方案的成本是非常高效的,因此只需在高端服務(wù)器解決方案上花費(fèi)很小的成本就可以實(shí)現(xiàn)。這就使得 Global IT 能夠獲得更多的服務(wù)器來支持故障切換或是備用解決方案,這樣一來在構(gòu)建高可用解決方案的同時(shí)還可以兼顧到靈活性的提高。
Steve 經(jīng)常會(huì)用到的另一個(gè)竅門就是創(chuàng)建他自己的 psuedo 網(wǎng)格環(huán)境。 “我們有雙倍的額外服務(wù)器可以使用,已經(jīng)配置好并預(yù)備就緒,一旦需要就可以運(yùn)轉(zhuǎn)起來,”,他這樣解釋說。這些額外的服務(wù)器所能作的不僅僅是備份,在網(wǎng)絡(luò)流量突增的時(shí)候,這些服務(wù)器可以真正地部署進(jìn)來。“就像在 OracleWorld 的前一周,我們需要更優(yōu)的性能,于是我們加入了一些額外的服務(wù)器,并在使用高峰期間,提供了比 OTN 期望水平更高質(zhì)量的服務(wù)。一旦點(diǎn)擊率下降,我們就可以將這些服務(wù)器撤出,讓它們?nèi)ネ瓿善渌蝿?wù)。”
在需要“額外的機(jī)箱”只以及體系結(jié)構(gòu)不同部分需要進(jìn)行交換時(shí),廉價(jià)的 Linux 選項(xiàng)才是最適用的。通常認(rèn)為使用更廉價(jià)的軟、硬件,比如 Lintel 機(jī)箱,就意味著需要更多的軟、硬件治理,而且與昂貴的 Sun機(jī)箱相比很可能會(huì)存在一些性能上的問題。事實(shí)讓 Steve 明白這種簡(jiǎn)單的推理并不總與事實(shí)相符。
Steve 說,“使用 OTN 之前的體系結(jié)構(gòu),我們有四個(gè) Sun 機(jī)箱來運(yùn)行 Web 高速緩存,還有四個(gè) Sun 機(jī)箱運(yùn)行 AIS 服務(wù)器。我們用三個(gè) Linux 服務(wù)器來替換這八個(gè) Sun 服務(wù)器,結(jié)果我們即使沒能獲得更好的性能也至少獲得了同等的性能。”據(jù) Steve 說,在成本方面更沒有爭(zhēng)議。“我還可以為每個(gè) Solaris 服務(wù)器買 6 個(gè) Lintel 服務(wù)器。”
Steve 建議最起碼也要對(duì)體系結(jié)構(gòu)進(jìn)行權(quán)威性的負(fù)載測(cè)試和 OS 評(píng)測(cè)—非凡是磁盤 I/O、內(nèi)存的使用情況和 CPU 的使用情況和這些部件在負(fù)載下的表現(xiàn)。“假如你在 OS 中發(fā)現(xiàn)了一個(gè)熱點(diǎn),那么你是否能確定是什么引起該熱點(diǎn)的嗎?查看一下可能引發(fā)這一熱點(diǎn)的技術(shù)。是 java 中的 OC4J?是 HTTP 或 Apache?是 Web 高速緩存?以上任何一