《計算WEB服務器的最大負載量》由會員分享,可在線閱讀,更多相關《計算WEB服務器的最大負載量(4頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、計算 WEB 服務器的最大負載量
動態(tài)反饋負載均衡算法考慮服務器的實時負載和響應情況,不斷調整服務器間處理請求 的比例,來避免有些服務器超載時依然收到大量請求,從而提高整個系統(tǒng)的吞吐率。圖 1 顯示了該算法的工作環(huán)境,在負載調度器上運行Monitor Daemon進程,Monitor Daemon來 監(jiān)視和收集各個服務器的負載信息。Monitor Daemon可根據(jù)多個負載信息算出一個綜合負 載值。 Monito r Daemon 將各個服務器的綜合負載值和當前權值算出一組新的權值,若新權 值和當前權值的差值大于設定的閥值, Monitor Daemon 將該服務器的權值設置到內(nèi)核中的 IP
2、VS 調度中,而在內(nèi)核中連接調度一般采用加權輪叫調度算法或者加權最小連接調度算法。
LirtuxDirectF^r
Monitor Daemon
峭N A
/ i i
X i 、
: Weights
丿 i <.
J
?刼Mt盼 User_space
■■- 1 1 i
F
kernel
/ : '、 iPVS
/ I i
Load Queries
Server 1
Server'Z, Servef.-S'
Server N
LAN
圖 1:動態(tài)反饋負載均衡算法的工作環(huán)境
連接調度
當客戶通過 TCP 連接訪問網(wǎng)絡
3、訪問時,服務所需的時間和所要消耗的計算資源是千差 萬別的,它依賴于很多因素。例如,它依賴于請求的服務類型、當前網(wǎng)絡帶寬的情況、以及 當前服務器資源利用的情況。一些負載比較重的請求需要進行計算密集的查詢、數(shù)據(jù)庫訪問、 很長響應數(shù)據(jù)流;而負載比較輕的請求往往只需要讀一個HTML頁面或者進行很簡單的計 算。
請求處理時間的千差萬別可能會導致服務器利用的傾斜(Skew),即服務器間的負載不 平衡。例如,有一個WEB頁面有A、B、C和D文件,其中D是大圖像文件,瀏覽器需要 建立四個連接來取這些文件。當多個用戶通過瀏覽器同時訪問該頁面時,最極端的情況是所 有 D 文件的請求被發(fā)到同一臺服務器。所以說,有
4、可能存在這樣情況,有些服務器已經(jīng)超 負荷運行,而其他服務器基本是閑置著。同時,有些服務器已經(jīng)忙不過來,有很長的請求隊 列,還不斷地收到新的請求。反過來說,這會導致客戶長時間的等待,覺得系統(tǒng)的服務質量 差。
簡單連接調度 簡單連接調度可能會使得服務器傾斜的發(fā)生。在上面的例子中,若采用輪叫調度算法, 且集群中正好有四臺服務器,必有一臺服務器總是收到D文件的請求。這種調度策略會導 致整個系統(tǒng)資源的低利用率,因為有些資源被用盡導致客戶的長時間等待,而其他資源空閑 著。
實際TCP/IP流量的特征
文獻說明網(wǎng)絡流量是呈波浪型發(fā)生的,在一段較長時間的小流量后,會有一段大流量的 訪問,然后是小流量,這
5、樣跟波浪一樣周期性地發(fā)生。文獻揭示在WAN和LAN上網(wǎng)絡流 量存在自相似的特征,在WEB訪問流也存在自相似性。這就需要一個動態(tài)反饋機制,利用 服務器組的狀態(tài)來應對訪問流的自相似性。
動態(tài)反饋負載均衡機制
TCP/IP 流量的特征通俗地說是有許多短事務和一些長事務組成,而長事務的工作量在 整個工作量占有較高的比例。所以,我們要設計一種負載均衡算法,來避免長事務的請求總 被分配到一些機器上,而是盡可能將帶有毛刺(Burst)的分布分割成相對較均勻的分布。
我們提出基于動態(tài)反饋負載均衡機制,來控制新連接的分配,從而控制各個服務器的負 載。例如,在IPVS調度器的內(nèi)核中使用加權輪叫調度(Weig
6、hted Round-Robin Scheduling) 算法來調度新的請求連接;在負載調度器的用戶空間中運行 Monitor Daemon 。 Monitor Daemon定時地監(jiān)視和收集各個服務器的負載信息,根據(jù)多個負載信息算出一個綜合負載值。 Monitor Daemon 將各個服務器的綜合負載值和當前權值算出一組新的權值。當綜合負載值 表示服務器比較忙時,新算出的權值會比其當前權值要小,這樣新分配到該服務器的請求數(shù) 就會少一些。當綜合負載值表示服務器處于低利用率時,新算出的權值會比其當前權值要大, 來增加新分配到該服務器的請求數(shù)。若新權值和當前權值的差值大于設定的閥值, Monitor
7、 Daemon將該服務器的權值設置到內(nèi)核中的IPVS調度中。過了一定的時間間隔(如2秒鐘), Monitor Daemon再查詢各個服務器的情況,并相應調整服務器的權值;這樣周期生地進行。 可以說,這是一個負反饋機制,使得服務器保持較好的利用率。
在加權輪叫調度算法中,當服務器的權值為零,已建立的連接會繼續(xù)得到該服務器的服 務,而新的連接不會分配到該服務器。系統(tǒng)管理員可以將一臺服務器的權值設置為零,使得 該服務器安靜下來,當已有的連接都結束后,他可以將該服務器切出,對其進行維護。維護 工作對系統(tǒng)都是不可少的,比如硬件升級和軟件更新等,零權值使得服務器安靜的功能很主 要。所以,在動態(tài)反饋負載均
8、衡機制中我們要保證該功能,當服務器的權值為零時,我們不 對服務器的權值進行調整。
綜合負載
在計算綜合負載時,我們主要使用兩大類負載信息:輸入指標和服務器指標。輸入指標 是在調度器上收集到的,而服務器指標是在服務器上的各種負載信息。我們用綜合負載來反 映服務器當前的比較確切負載情況,對于不同的應用,會有不同的負載情況,這里我們引入 各個負載信息的系數(shù),來表示各個負載信息在綜合負載中輕重。系統(tǒng)管理員根據(jù)不同應用的 需求,調整各個負載信息的系數(shù)。另外,系統(tǒng)管理員設置收集負載信息的時間間隔。
輸入指標主要是在單位時間內(nèi)服務器收到新連接數(shù)與平均連接數(shù)的比例,它是在調度器 上收集到的,所以這個指標
9、是對服務器負載情況的一個估計值。在調度器上有各個服務器收 到連接數(shù)的計數(shù)器,對于服務器Si,可以得到分別在時間T1和T2時的計數(shù)器值Cil和Ci2, 計算出在時間間隔T2-T1內(nèi)服務器Si收到新連接數(shù)Ni = Ci2 - Ci1。這樣,得到一組服務器 在時間間隔T2-T1內(nèi)服務器Si收到新連接數(shù){Ni},服務器Si的輸入指標INPUTi為其新連
接數(shù)與n臺服務器收到平均連接數(shù)的比值,其公式為
INPU71 = —
M-1
服務器指標主要記錄服務器各種負載信息,如服務器當前CPU負載LOADi、服務器當 前磁盤使用情況Di、當前內(nèi)存利用情況Mi和當前進程數(shù)目Pi。有兩種方法可以獲得這些
10、信息;一是在所有的服務器上運行著SNMP(Simple Network Management Protoco 1)服務進 程,而在調度器上的 Monitor Daemon 通過 SNMP 向各個服務器查詢獲得這些信息;二是在 服務器上實現(xiàn)和運行收集信息的Agent,由Agent定時地向Monitor Daemon報告負載信息。 若服務器在設定的時間間隔內(nèi)沒有響應,Monitor Daemon認為服務器是不可達的,將服務 器在調度器中的權值設置為零,不會有新的連接再被分配到該服務器;若在下一次服務器有 響應,再對服務器的權值進行調整。再對這些數(shù)據(jù)進行處理,使其落在[0, R)的區(qū)間內(nèi),1 表示負
11、載正好,大于1表示服務器超載,小于1 表示服務器處于低負載狀態(tài)。獲得調整后的 數(shù)據(jù)有 DISKi、MEMORYi 和 PROCESSi。
另一個重要的服務器指標是服務器所提供服務的響應時間,它能比較好地反映服務器上 請求等待隊列的長度和請求的處理時間。調度器上的Monitor Daemon作為客戶訪問服務器 所提供的服務,測得其響應時間。例如,測試從WEB服務器取一個HTML頁面的響應延 時,Monitor Daemon只要發(fā)送一個“GET/”請求到每個服務器,然后記錄響應時間。若服 務器在設定的時間間隔內(nèi)沒有響應,Monitor Daemon認為服務器是不可達的,將服務器在 調度器中的權值
12、設置為零。同樣,我們對響應時間進行如上調整,得到RESPONSEi。
這里,我們引入一組可以動態(tài)調整的系數(shù)Ri來表示各個負載參數(shù)的重要程度,其中》 Ri = 1。綜合負載可以通過以下公式計算出:
AGGREGATE_ LOADi = INPUT! + ^LOADi + +
止 4 ^MSMORYi + 3 PROCESS + 尿母 REEFON^
例如,在WEB服務器集群中,我們采用以下系數(shù){0.1, 0.3, 0.1, 0.1, 0.1, 0.3},認為服務 器的CPU負載和請求響應時間較其他參數(shù)重要一些。若當前的系數(shù)Ri不能很好地反映應用 的負載,系統(tǒng)管理員可以對系數(shù)不斷地修正,直
13、到找到貼近當前應用的一組系數(shù)。
另外,關于查詢時間間隔的設置,雖然很短的間隔可以更確切地反映各個服務器的負載, 但是很頻繁地查詢(如 1 秒鐘幾次)會給調度器和服務器帶來一定的負載,如頻繁執(zhí)行的 Monitor Daemon 在調度器會有一定的開銷,同樣頻繁地查詢服務器指標會服務器帶來一定 的開銷。所以,這里要有個折衷(Tradeoff),我們一般建議將時間間隔設置在5到20秒之 間。
權值計算
當服務器投入集群系統(tǒng)中使用時, 系統(tǒng)管理員對服務器都設定一個初始權值 DEFAULT_WEIGHTi在內(nèi)核的IPVS調度中也先使用這個權值。然后,隨著服務器負載的 變化,對權值進行調整。為了避免
14、權值變成一個很大的值,我們對權值的范圍作一個限制 [DEFAULT_WEIGHTi, SCALE*DEFAULT_WEIGHTi] SCALE 是可以調整的,它的 Monitor Daemon周期性地運行,若DEFAULT_WEIGHTi不為零,則查詢該服務器的各負載參數(shù), 并計算出綜合負載值AGGREGATE_LOADi。我們引入以下權值計算公式,根據(jù)服務器的綜 合負載值調整其權值。
fwi +A^.95-AGGREGATE_LOADi 當AGGREGATE_LOADi 0.95
朋 h 當 AGGREGATE _LOADz =0.95
在公式中,0.95是我們想要達到的系統(tǒng)利用率,A
15、是一個可調整的系數(shù)(缺省值為5)。 當綜合負載值為0.95時,服務器權值不變;當綜合負載值大于0.95時,權值變小;當綜合 負載值小于0.95時,權值變大。若新權值大于SCALE*DEFAULT_WEIGHTi我們將新權 值設為SCALE*DEFAULT_WEIGHT。若新權值與當前權值的差異超過設定的閥值,則將 新權值設置到內(nèi)核中的IPVS調度參數(shù)中,否則避免打斷IPVS調度的開銷。我們可以看出 這是一個負反饋公式,會使得權值調整到一個穩(wěn)定點,如系統(tǒng)達到理想利用率時,權值是不 變的。
在實際使用中,若發(fā)現(xiàn)所有服務器的權值都小于他們的DEFAULT_WEIGHT,則說明 整個服務器集群處于超
16、載狀態(tài),這時需要加入新的服務器結點到集群中來處理部分負載;反 之,若所有服務器的權值都接近于SCALE*DEFAULT_WEIGHT則說明當前系統(tǒng)的負載都 比較輕。
一個實現(xiàn)例子
我們在 RedHat 集群管理工具 Piranha 中實現(xiàn)了一個簡單的動態(tài)反饋負載均衡算法。在 綜合負載上,它只考慮服務器的CPU負載(Load Average),使用以下公式進行權值調整:
忖 + 曲 - AGGREGATE_LOADi 當AGGREGATE_ LOADi 工 1
[他 當川 GGREGA TE_L OADi = 1
服務器權值調整區(qū)間為[DEFAULT_WEIGHTi, 10*DEFAULT_WEIGHTi], A 為 DEFAULT_WEIGHTi/2,而權值調整的閥值為DEFAULT_WEIGHTi/4。1是所想要達到的 系統(tǒng)利用率。Piranha每隔20秒查詢各臺服務器的CPU負載,進行權值計算和調整。