H.323是一種標準的音視頻傳輸協(xié)議,能夠實現(xiàn)遠程提審功能。
簡介H.323是ITU-T第16工作組的建議,由一組協(xié)議構成,其中有負責音頻與視頻信號的編碼、解碼和包裝,有負責呼叫信令收發(fā)和控制的信令,還有負責能力交換的信令。H.323的第4版本具備做電信級大網的特征,以它為標準構建的IP電話網能很容易地與傳統(tǒng)PSTN電話網兼容,從這點上看,H.323更適合于構建電話到電話的電信級大網。
H.323協(xié)議族規(guī)定了在主要包括IP網絡在內的基于分組交換的網絡上提供多媒體通信的部件、協(xié)議和規(guī)程。H.323一共定義了四種部件:終端,網關,網守和多點控制單元。利用它們,H.323可以支持音頻、視頻和數(shù)據(jù)的點到點或點到多點的通信。H.323協(xié)議族包括用于建立呼叫的H.225.0、用于控制的H.245、用于大型會議的H.332 以及用于補充業(yè)務的H.450.X等。H.323 協(xié)議中包含3條信令控制信道:RAS信令信道、呼叫信令信道和H.245 控制信道。3 條信道的協(xié)調工作使得H.323的呼叫得以進行。1
體系結構為了能在不保證QoS的分組交換網絡上展開多媒體會議,由ITU的第15研究組SG-15于1996年通過H.323建議的第一版,并在1998年提出了H.323的第二版。H.323制定了無QoS(服務質量)保證的分組網絡PBN(packet Based Networks)上的多媒體通信系統(tǒng)標準,這些分組網絡主宰了當今的桌面網絡系統(tǒng),包括基于TCP/IP、IPX分組交換的以太網、快速以太網、令牌網、FDDI技術。因此,H.323標準為LAN、WAN、Internet、因特網上的多媒體通信應用提供了技術基礎和保障。
H.323是ITU多媒體通信系列標準H.32x的一部份,該系列標準使得在現(xiàn)有通信網絡上進行視頻會議成為可能,其中,H.320是在N-ISDN上進行多媒體通信的標準:H.321是在B-ISDN上進行多媒體通信的標準:H.322是在有服務質量保證的LAN上進行多媒體通信的標準:H.324是在GSTN和無線網絡上進行多媒體通信的標準。H.323為現(xiàn)有的分組網絡PBN(如IP網絡)提供多媒體通信標準。若和其它的IP技術如IETF的資源預留協(xié)議RSVP相結合,就可以實現(xiàn)IP網絡的多媒體通信?;贗P的LAN正變得越來越強大,如IP over SDH/SONET、IP over ATM技術正在快速發(fā)展以及LAN寬帶正在不斷的提高。由于能提供設備與設備、應用與應用、供應商與供應商之間的互操作能力,因此,H.323能夠保證所有H.323兼容設備的互操作性。更高速率的處理器、日益增強的圖形器件和強大的多媒體加速芯片使提PC成為一個越來越強大的多媒體平臺。H.323可提供PBN與別的網絡之間進行多媒體通信的互連互通標準。許多計算機、網絡通信公司,如Inter、Microsoft和Netscape都支持H.323標準。H.323標準包括在無QoS保證的分組網絡中進行多媒體通信所需的技術要求。這些分組網絡包括LAN、WAN、Internet/因特網以及使用PPP等分組協(xié)議通過GSTN或ISDN的撥號連接或點對點連接。
從整體上來說,H.323是一個框架性建設,它涉及到終端設備、視頻、音頻和數(shù)據(jù)傳輸、通信控制、網絡接口方面的內容,還包括了組成多點會議的多點控制單元(MCU)、多點控制器(MC)、多點處理器(MP)、網關以及關守等設備。它的基本組成單元是"域",在H.323系統(tǒng)中,所謂域是指一個由關守管理的網關、多點控制單元(MCU)、多點控制器(MC)、多點處理器(MP)和所有終端組成的集合。一個域最少包含一個終端,而且必須有且只有一個關守。H.323系統(tǒng)中各個邏輯組成部份稱為H.323的實體,其種類有:終端、網關、多點控制單元(MCU)、多點控制器(MC)、多點處理器(MP)。其中終端、網關、多點控制單元(MCU)是H.323中的終端設備,是網絡中的邏輯單元。終端設備是可呼叫的和被呼叫的,而有些實體是不通被呼叫的,如關守。H.323包括了H.323終端與其它終端之間的、通過不同網絡的、端到端的連接。2
終端組成H.323為基于網絡的通信系統(tǒng)定義了四個主要的組件:終端(Terminal)、網關(Gateway)、關守(Gatekeeper)、多點控制單元(MCU)。終端是分組網絡中能提供實時、雙向通信的節(jié)點設備,也是一種終端用戶設備,可以和網關、多點接入控制單元通信。所有終端都必須支持語音通信,視頻和數(shù)據(jù)通信可選。H.323規(guī)定了不同的音頻、視頻或數(shù)據(jù)終端協(xié)同工作所需的操作模式。它將是下一代因特網電話、音頻會議終端和視頻會議技術的主要標準。圖為H.323終端的組成框圖,在發(fā)端,從輸入設備獲取的視頻和音頻信號,經編碼器壓縮后,按照一定格式打包,通過網絡發(fā)送出去,在收端,來自網絡的數(shù)據(jù)包首先被解包,獲得的視頻、音頻壓縮數(shù)據(jù)經解碼后送入輸出設備,用戶數(shù)據(jù)和控制數(shù)據(jù)也得到了相應的處理。它所包含的各個功能單元及其標準備或協(xié)議分別是:
視頻編解碼(H.263/H.261):完成對視頻碼流的冗余壓縮編碼。
音頻編解碼(H.723.1等):完成語音信號的編解碼,并在接收端可選擇地加入緩沖延遲以保證語音的連續(xù)性。所采用的標準為ITU-T的H.723.1,它提供5.3kbit/s和6.3kbit/s兩種碼率,采用線性預測綜合分析編碼方法,分別使用代數(shù)碼本激勵線性預測和多脈沖最大似然量化,從而各自獲得編碼復雜度和質量的優(yōu)化。
各種數(shù)據(jù)應用:包括電子白板、靜止圖像傳輸、文件交換、數(shù)據(jù)庫共存、數(shù)據(jù)會議、運程設備控制等,可用的標準為T.120、T.84、T.434等。
控制單元(H.245):提供端到端信令,以保證H.323終端的正常通信。所采用的協(xié)議為H.245(多媒體通信控制協(xié)議),它定義了請求、應答、信令和指示四種信息,通過各種終端間進行通信能力協(xié)商,打開/關閉邏輯信道,發(fā)送命令或指示等操作,完成對通信的控制。
H.225層:將視頻、音頻、控制等數(shù)據(jù)格式化并發(fā)送,同時從網絡接收數(shù)據(jù)。另外,還負責處理一些諸如邏輯分幀、加序列號、錯誤檢測等功能。
協(xié)議簇H.323是國際電信聯(lián)盟(ITU)的一個標準協(xié)議棧,該協(xié)議棧是一個有機的整體,根據(jù)功能可以將其分為四類協(xié)議,也就是說該協(xié)議從系統(tǒng)的總體框架(H.323)、視頻編解碼(H.263)、音頻編解碼(H.723.1)、系統(tǒng)控制(H.245)、數(shù)據(jù)流的復用(H.225)等各方 面作了比較祥細的規(guī)定。為網絡電話和可視電話會議系統(tǒng)的進一步發(fā)展和系統(tǒng)的兼容性提供了良好的條件。其中系統(tǒng)控制協(xié)議包括H.323、H.245、和H.225.0,Q.931和RTP/RTCP是H.225.0的主要組成部份。系統(tǒng)控制是H.323終端的核心。整個系統(tǒng)控制由H.245控制信道、H.225.0呼叫信令信道和RAS(注冊、許可、狀態(tài))信道提供,音頻編解碼協(xié)議包括G.711協(xié)議(必選)、G.722、G.723.1、G.728、G.729等協(xié)議。編碼器使用的音頻標準必須由H.245協(xié)議協(xié)商確定。H.323終端應由對本身所具有的音頻編解碼能力進行非對稱操作。如以G.711發(fā)送,以G.729接收。視頻編解碼協(xié)議主要包括H.261協(xié)議(必選)和H.263協(xié)議。H.323系統(tǒng)中視頻功能是可選的。數(shù)據(jù)會議功能也是可選的,其標準是多媒體會議數(shù)據(jù)協(xié)議T.120。
通信原理在H.323多媒體通信系統(tǒng)中,控制信令和數(shù)據(jù)流的傳送利用了面向連接的傳輸機制。在IP游戲棧中,IP與TCP協(xié)作,共同完成面向連接的傳輸??煽康膫鬏敱WC了數(shù)據(jù)數(shù)據(jù)包傳輸時的流量控制、連續(xù)性以及正確性,但也可能引起傳輸時延以及占用網絡寬帶。H.323將可靠的TCP用于H.245控制信道、T.120數(shù)據(jù)信道,呼叫信令信道。而視頻和音頻信息采用不可靠的、面向非連接的傳輸方式,即利用用戶數(shù)據(jù)協(xié)議UDP(User Datagram Protocol)。UDP無法提供很好的QoS,只提供最少的控制信息,因此傳輸時延較TCP小。 在有多個視頻流和音頻流的多媒體通信系統(tǒng)中,基于UDP和不可靠傳輸利用IP多點廣播和由IETF實時傳輸協(xié)議RTP處理視頻和音頻信息。IP多播是以UDP方式進行不可靠多點廣播傳輸?shù)膮f(xié)議。RTP工作于IP多播的頂層,用于處理IP網上的視頻和音頻流,每個UDP包均加上一個包含時間戳和序號的報頭。若接收端配以適當?shù)木彌_,那么它就可以種用時間戳和序號信息"復原,再生"數(shù)據(jù)包、記錄失序包、同步語音、圖像和數(shù)據(jù)以及改善邊接重放效果。實時控制協(xié)議RTCP用于RTP的控制。RTCP監(jiān)視服務質量以及網上傳送的信息,并定期將包含服務質量信息的控制信息包發(fā)分給所有通信節(jié)點。
在大型分組網絡如因特網中,為一個多媒體呼叫保留點足夠的寬帶是很重要的,也是很困難的。另一個IETF協(xié)議--資源預流協(xié)議RSVP允許接收端為某一特殊的數(shù)據(jù)流申請一定數(shù)量的寬帶,并得到一個答復,確認申請是否被許可。雖然RSVP不是H.323標準的正式組成部份,但大多數(shù)H.323產品都必須支持他,因為寬帶的預流對IP網絡上多媒體通信的成功至關重要,RSVP需要得到終端、網關、裝有多點處理器的MCU以及中間路由器或交換機的支持。3
相關音視頻協(xié)議H.225.0適用于不同類型的網絡,其中包括以太網、令牌環(huán)網等。H.225.0被定義在諸如TCP/IP,SPX/IPX傳輸層。H.225.0通信的范圍是在H.323網關之間,并且是在同一個網上,使用同一種傳輸協(xié)議。如果在整個因特網上使用H.323協(xié)議,通信性能將會下降。H.323試圖把H.320擴展到無質量保證的局域網中,通過使用強大的認可控制會議控制,使一個專門會議的參加者從幾人到幾千人。
H.225.0建立了一個呼叫模型,在這個模型中,呼叫建立和性能協(xié)商沒有使用RTP傳輸?shù)刂?,呼叫建立之后才建立若干個RTP/RTCP連接。呼叫建立之前,終端可以向某個關守(Gatekeeper)注冊。如果終端要向某個關守注冊,它必須知道這個關守的年限(Vintage)。正因為如此,發(fā)現(xiàn)(discovery)和注冊(registion)結構都包含了一個H.245類型的對象標志,它提供了H.323應用版本的年限。這些結構還包含了可選擇的非標準消息,它允許終端建立非標準關系。在這些結構的末尾,還包括了版本號的非標準狀態(tài)。其中:版本號是必須的,非標準信息是可選的。非標準信息用來在兩個終端之間相通知其年限及非標準狀態(tài)。雖然所有的Q.931消息在用戶到用戶信息中具有可選的非標準信息,但在所有的RAS通道信息中還是具有可選的非標準信息。另外,在任何時候都能發(fā)送一個非標準RAS消息。進行注冊、認可和狀態(tài)通信的不可靠通道稱為RAS通道。開始一個呼叫一般必須首先發(fā)送一個認可請求消息,接著發(fā)送一個初始建立消息,這個過程以收到連接消息為結束。
當可靠的H.245控制通道建立之后,音頻、視頻以及數(shù)據(jù)的傳輸通道都可以相應建立。多媒體會議的有關設置也可以在這里設置。當使用可靠的H.245控制通道傳送消息后,H.225終端可以通過不可靠通道發(fā)送音頻、視頻數(shù)據(jù)。錯誤隱藏和其它一些信息是用來處理發(fā)生丟包的情況。一般情況下,音頻、視頻數(shù)據(jù)包不會重發(fā),因為重發(fā)將引起網絡網絡上的延時。假設底層已經處理了對位出錯的檢測,而且錯誤的包不會傳給H.225。音頻、視頻數(shù)據(jù)和呼叫信號不會在同一個通道里傳輸,并且不使用同樣的消息結構。H.225.0有能力使用不同的傳輸?shù)刂?,在不同的RTP實例當中發(fā)送和接收音頻、視頻數(shù)據(jù),以確保不同媒體幀的序列號和每種媒體的服務質量。ITU正在研究如何把音頻、視頻數(shù)據(jù)包混合在同一個傳輸?shù)刂分型粠校m然音頻、視頻數(shù)據(jù)能夠憑錯傳輸層服務訪問點標識來共享同一個網絡地址,但是制造商還是選擇使用不同的網絡地址來分別傳輸音頻、視頻數(shù)據(jù)。在網關、多點控制單元和關守中可以使用動態(tài)傳輸層服務訪問點標識來代替固定傳輸層服務訪問點標識。
一個可靠的傳輸?shù)刂酚糜诮K端與終端之間的呼叫建立,也可以用于關守之間,可靠的呼叫信號連接必須按照下例規(guī)則進行。在終端與終端的呼叫信號傳輸中,每個終端都可以打開或關閉可靠呼叫信號通道。對于關守的呼叫信號傳輸,終端必須保證在整個過程中打開可靠端口。雖然關守能夠選擇是否關閉信號通道,但是對于網關正在使用的呼叫通道,關守必須保證它打開。諸如顯示信息等Q.931信息可以在端到端之間傳輸。如果由于傳輸層的某個原因使得可靠的連接被斷開,這個連接必須重建,此次呼叫不認為是失敗。除非H.245通道被關閉。呼叫狀態(tài)和呼叫參考值不受關閉可靠連接的影響。同一時間可以打開多個H.245通道,因此同一個終端可以同時參加多個會議。在一個會議中,一個終端甚至可以同時打開多種類型的通道,例如,同時打開兩個音頻通道來得到立體聲效果。但是在一個點對點的呼叫中只能打開一個H.245控制通道。
H.245協(xié)議定義了主從判別功能,當在一個呼叫中的兩個終端同時初始化一個相同的事件時,就產生了沖突。例如,資源只能被一個事件使用。為了解決這個問題,終端必須判斷誰是主終端,誰是從終端,主從叛別過程用來判斷哪個終端是主終端,哪個是從終端。終端的狀態(tài)一旦決定,在整個呼叫過程期間都不會改變。性能交換過程用來保證傳輸?shù)拿襟w信號是能夠被接收端接收的,也就是接收端必須能夠解碼接收數(shù)據(jù)。這要求每一個終端的接收和解碼能力必須被對方終端知道。終端不需具備所有的能力,對于不能理解的要求可以不予理睬。終端通過發(fā)送它的性能集使對方知道自己的接收和解碼能力。接收性能描述了終端接收和處理信息流的能力。發(fā)送必須確保所發(fā)送的性能集的內容是自己能夠做到的。發(fā)送性能給接收方提供了操作方式的選擇集,接收方可以從中選擇某種方式。如果缺省了發(fā)送性能集,這說明了發(fā)送方沒有給接收方選擇,但這并不說明發(fā)送方不會向接收方發(fā)送數(shù)據(jù)。這些性能集使得終端可以同時提供多種媒體流的處理。例如,一個終端可以同時接收兩路不同的H.262視頻信號和兩路不同的H.722音頻信號。性能消息描述的不僅僅是終端具有的固有能力,還描述了它可以同時具有哪些模型。它也可能表示了發(fā)送性能和接收性能之間的一種折中。終端可以使用非標準參數(shù)結構來發(fā)送非標準性能和控制消息。非標準消息是制造商或其它組織定義的,用來表明其終端所具有的特殊能力。
邏輯通道信號過程確保在邏輯通道打開時,終端就具有接收和解碼數(shù)據(jù)的能力。打開邏輯通道消息包含了關于傳送數(shù)據(jù)的描述。邏輯通道必須在終端有能力同時接收所有打開通道的數(shù)據(jù)時才通被打開。一個邏輯通道由傳送方打開。接收方可以向傳送方請求關閉邏輯通道,傳送方可以接受請求,也可以拒絕請求。當性能交換結束時,雙方終端通過交換的性能描述符都知道了對方的性能。終端不需要知道描述符中所有性通,只要知道它使用的性能即可。終端知道自己與對方終端的環(huán)型延時是很有用的。環(huán)型延時判別就是用來測試環(huán)型延時的,它還可以用來測試遠方終端是否存在。命令和說明可以用來傳送一些特殊的數(shù)據(jù)。命令和說明不會得到遠程終端的響應消息。命令用于強迫遠程終端執(zhí)行一個動作,說明用于提供信息。
H.323協(xié)議規(guī)定,音頻和視頻分組必須被封裝在實時協(xié)議RTP中,并通過發(fā)送端和接收端的一個UDP的Socket對來進行承載。而實時控制協(xié)議RTCP用來評估會話和連接質量,以及在通信方之間提供反饋信息。相應的數(shù)據(jù)及其支持性的分組可以通過TCP或UDP進行操作。H.323協(xié)議還規(guī)定,所有的H.323終端都必須帶一個語音編碼器,最低要求是必須支持G.711建議。4
本詞條內容貢獻者為:
李嘉騫 - 博士 - 同濟大學