基于軟件定義網(wǎng)絡(luò)的媒體分發(fā)網(wǎng)絡(luò)的接入控制
研究傳統(tǒng)媒體分發(fā)網(wǎng)絡(luò)的接入控制問題時(shí),利用可獲取得到的服務(wù)節(jié)點(diǎn)的容量和負(fù)載等信息,那么,怎樣分析基于軟件定義網(wǎng)絡(luò)的媒體分發(fā)網(wǎng)絡(luò)的接入控制。
針對(duì)軟件定義網(wǎng)絡(luò)(SDN)環(huán)境下的媒體分發(fā)計(jì)算機(jī)網(wǎng)絡(luò)的接入控制問題,提出了一種綜合考慮服務(wù)節(jié)點(diǎn)和傳輸鏈路服務(wù)性能優(yōu)化問題的接入控制方案。該方案利用SDN控制器對(duì)路由器的直接管控和對(duì)全網(wǎng)的感知能力,對(duì)應(yīng)用層上服務(wù)節(jié)點(diǎn)服務(wù)性能和網(wǎng)絡(luò)層上服務(wù)節(jié)點(diǎn)到用戶之間的傳輸鏈路的服務(wù)性能進(jìn)行聯(lián)合優(yōu)化,減少了鏈路擁塞對(duì)數(shù)據(jù)傳輸和用戶服務(wù)質(zhì)量的影響。首先,為SDN服務(wù)系統(tǒng)的接入控制過程建立部分可觀Markov決策過程(POMDP)模型;然后,使用基于觀測的隨機(jī)策略作為系統(tǒng)的接入控制策略;最后,通過策略梯度算法對(duì)接入控制策略進(jìn)行優(yōu)化,求解出模型的最優(yōu)策略。仿真結(jié)果表明,與盡力而為的服務(wù)策略相比,基于POMDP模型的最優(yōu)接入控制策略使系統(tǒng)性能提高了10%,驗(yàn)證了所提方法的有效性。
0引言
采用媒體分發(fā)網(wǎng)絡(luò)的視頻接入系統(tǒng)對(duì)傳輸時(shí)延和帶寬具有高度靈敏性,許多工作致力于研究如何提高該類系統(tǒng)的性能和媒體分發(fā)的效率。接入控制在資源有限情況下對(duì)于提高系統(tǒng)資源利用率、提供服務(wù)質(zhì)量保障非常重要[1]。選擇一個(gè)好的接入控制策略可以保證在資源有限情況下,最大化系統(tǒng)資源利用率;同時(shí)顯著地減少相應(yīng)延遲,讓更多的用戶享受到高質(zhì)量的服務(wù)[2]。
研究傳統(tǒng)媒體分發(fā)網(wǎng)絡(luò)的接入控制問題時(shí),主要利用可獲取得到的服務(wù)節(jié)點(diǎn)的容量和負(fù)載等信息,來制定接入控制方案,即主要考慮應(yīng)用層上服務(wù)節(jié)點(diǎn)的服務(wù)能力存在瓶頸,通過尋找最優(yōu)策略來優(yōu)化節(jié)點(diǎn)的服務(wù)性能,從而提高系統(tǒng)資源利用率和用戶的服務(wù)質(zhì)量。目前,關(guān)于傳統(tǒng)媒體分發(fā)網(wǎng)絡(luò)的接入控制問題的研究有很多,基于閾值的接入控制方法由于結(jié)構(gòu)簡單且易于實(shí)現(xiàn),已經(jīng)被廣泛應(yīng)用[3],其中幾種基礎(chǔ)的基于簡單結(jié)構(gòu)的閾值策略有完全共享策略[4-5]、完全區(qū)分策略[6-7]、資源預(yù)留策略[8-9]、自適應(yīng)閾值策略[10]等。相對(duì)于基于閾值的接入控制方法,基于隨機(jī)優(yōu)化的接入控制著重于通過隨機(jī)模型來描述系統(tǒng)狀態(tài)在網(wǎng)絡(luò)系統(tǒng)接入控制過程中的動(dòng)態(tài)演化,并通過策略優(yōu)化算法對(duì)系統(tǒng)接入控制進(jìn)行優(yōu)化。文獻(xiàn)[11]為資源共享系統(tǒng)設(shè)計(jì)了一種基于Markov決策過程(Markov Decision Process, MDP)模型的接入控制方案,用于分析和求解具有多個(gè)級(jí)別服務(wù)的系統(tǒng)的接入控制策略;陔S機(jī)優(yōu)化的方法在對(duì)網(wǎng)絡(luò)系統(tǒng)接入控制過程的描述上更為準(zhǔn)確,并且得到的接入控制策略也更為精細(xì)。
在傳統(tǒng)的網(wǎng)絡(luò)中,在網(wǎng)絡(luò)層上采用盡力而為的服務(wù)方式,沒有考慮不穩(wěn)定的網(wǎng)絡(luò)狀態(tài)和網(wǎng)絡(luò)擁塞對(duì)視頻傳輸質(zhì)量以及用戶服務(wù)質(zhì)量造成的影響[12]。軟件定義網(wǎng)絡(luò)(Software Defined Network,SDN)作為一種可以克服上述缺陷的新型網(wǎng)絡(luò)系統(tǒng)架構(gòu),已經(jīng)成為研究熱點(diǎn)。SDN將網(wǎng)絡(luò)控制平面從傳統(tǒng)的分布式網(wǎng)絡(luò)設(shè)備中獨(dú)立出來,使得網(wǎng)絡(luò)管理員能夠通過在控制器上編制軟件來靈活地控制和部署網(wǎng)絡(luò)功能,實(shí)現(xiàn)了網(wǎng)絡(luò)的可編程性。在基于SDN的媒體分發(fā)網(wǎng)絡(luò)中,可以通過SDN控制器來控制網(wǎng)絡(luò)層視頻流的路徑選擇,從而降低視頻傳輸時(shí)延,提高服務(wù)質(zhì)量[13]。文獻(xiàn)[14]提出一種基于SDN的內(nèi)容分發(fā)方案,該方案采用基于名稱的路由和緩存技術(shù)來進(jìn)行流量管理,并根據(jù)網(wǎng)絡(luò)狀態(tài)動(dòng)態(tài)選擇、修改內(nèi)容傳輸路徑,從而提高內(nèi)容分發(fā)效率。文獻(xiàn)[15]為視頻供應(yīng)商提出一種采用OpenFlow組播技術(shù)的內(nèi)容分發(fā)方案,該方案根據(jù)當(dāng)前網(wǎng)絡(luò)狀態(tài)動(dòng)態(tài)地重構(gòu)組播樹,并通過修剪擁塞鏈路對(duì)應(yīng)的組播樹分支,來有效地減少網(wǎng)絡(luò)資源浪費(fèi)。然而上述已有文獻(xiàn)并沒有對(duì)此類系統(tǒng)的接入控制問題進(jìn)行探討,為了進(jìn)一步提高系統(tǒng)資源利用率和用戶的服務(wù)質(zhì)量,本文對(duì)基于SDN的媒體分發(fā)網(wǎng)絡(luò)的接入控制問題進(jìn)行研究。而傳統(tǒng)媒體分發(fā)網(wǎng)絡(luò)的接入控制方案只在應(yīng)用層上考慮優(yōu)化服務(wù)節(jié)點(diǎn)服務(wù)性能,而沒有考慮網(wǎng)絡(luò)層上傳輸鏈路的優(yōu)化問題,因此,在研究基于SDN的媒體分發(fā)網(wǎng)絡(luò)的接入控制問題時(shí),采用上述方法已經(jīng)不合時(shí)宜。
本文認(rèn)為在研究基于SDN的媒體分發(fā)網(wǎng)絡(luò)的接入控制問題時(shí),應(yīng)該充分利用SDN系統(tǒng)架構(gòu)的優(yōu)勢和特點(diǎn),不僅要考慮應(yīng)用層上服務(wù)節(jié)點(diǎn)存在性能瓶頸;同時(shí)還應(yīng)該考慮網(wǎng)絡(luò)層上鏈路擁塞對(duì)數(shù)據(jù)傳輸質(zhì)量和用戶服務(wù)質(zhì)量造成的影響。為此,利用SDN控制器對(duì)網(wǎng)絡(luò)的管理和控制能力,在獲取服務(wù)節(jié)點(diǎn)的資源分配和服務(wù)狀況信息的同時(shí),獲取網(wǎng)絡(luò)中數(shù)據(jù)傳輸路徑上的資源使用情況(如可用服務(wù)帶寬等),為基于SDN的媒體分發(fā)網(wǎng)絡(luò)系統(tǒng)提出了一種綜合考慮應(yīng)用層和網(wǎng)絡(luò)層優(yōu)化問題的接入控制方法。該接入控制方法一方面優(yōu)化應(yīng)用層上服務(wù)節(jié)點(diǎn)的服務(wù)性能;另一方面優(yōu)化網(wǎng)絡(luò)層上傳輸鏈路的服務(wù)性能,在有效利用系統(tǒng)資源的同時(shí),提高了系統(tǒng)性能。此外,在傳統(tǒng)的接入控制方案中,決策時(shí)僅考慮是否接入,接入后的節(jié)點(diǎn)選擇依賴于源選擇策略,如Benchmark策略等[16],本文在構(gòu)建系統(tǒng)模型時(shí),將節(jié)點(diǎn)選擇和鏈路選擇融合到行動(dòng)空間中,通過策略梯度優(yōu)化算法,求解出使得系統(tǒng)性能達(dá)到最優(yōu)的接入控制策略。
1基于SDN的媒體分發(fā)網(wǎng)絡(luò)
首先介紹基于SDN的媒體分發(fā)網(wǎng)絡(luò)的基本組成部分、相應(yīng)的功能和相互之間的協(xié)作關(guān)系,在此基礎(chǔ)上再討論該系統(tǒng)的接入控制過程。
圖1給出了基于SDN的媒體分發(fā)網(wǎng)絡(luò)的系統(tǒng)架構(gòu)。與傳統(tǒng)媒體分發(fā)網(wǎng)絡(luò)相比,基于SDN的媒體分發(fā)網(wǎng)絡(luò)通過運(yùn)行在高性能服務(wù)器上的SDN控制器加強(qiáng)了對(duì)整個(gè)網(wǎng)絡(luò)的控制和管理,其中SDN控制器可以查看整個(gè)網(wǎng)絡(luò)的狀態(tài)信息,克服了傳統(tǒng)媒體分發(fā)網(wǎng)絡(luò)中邊緣服務(wù)節(jié)點(diǎn)的局限性,因此基于SDN的媒體分發(fā)網(wǎng)絡(luò)可以更好地進(jìn)行全局優(yōu)化,如流量工程、負(fù)載均衡等,并且集中式的管理框架使得管理大大簡化。其次,在SDN中無需在網(wǎng)絡(luò)邊緣部署昂貴的邊緣代理服務(wù)器,取而代之的是以分布式部署的可編程存儲(chǔ)路由器,其中的可編程存儲(chǔ)路由器是帶有存儲(chǔ)功能的,并以O(shè)penFlow協(xié)議運(yùn)行的路由器,由SDN控制器控制和配置。用戶無需向距離較遠(yuǎn)的邊緣服務(wù)器請求資源,SDN方案允許用戶向距離更近的可編程存儲(chǔ)路由器獲取請求資源,這可以顯著縮短資源傳輸距離,減少網(wǎng)絡(luò)故障等不穩(wěn)定因素的影響,從而提高視頻服務(wù)質(zhì)量和用戶體驗(yàn)質(zhì)量。流媒體服務(wù)器主要負(fù)責(zé)新資源的分發(fā),可編程存儲(chǔ)路由器在SDN控制器的作用下,周期地請求和接受來自源服務(wù)器的新資源。
當(dāng)系統(tǒng)中某個(gè)服務(wù)節(jié)點(diǎn)接收到一個(gè)來自用戶的服務(wù)請求后,該系統(tǒng)的接入控制過程就開始了,圖2給出了這個(gè)接入控制過程的控制結(jié)構(gòu)。首先,用戶向網(wǎng)絡(luò)邊緣的服務(wù)節(jié)點(diǎn)i發(fā)送關(guān)于資源k的服務(wù)請求,本地服務(wù)節(jié)點(diǎn)i將該服務(wù)請求轉(zhuǎn)發(fā)給區(qū)域SDN控制器,該控制器會(huì)根據(jù)請求類型、系統(tǒng)狀態(tài)和接入控制策略決定是否接入此請求。如果決策結(jié)果是接入請求,控制器一方面會(huì)根據(jù)本地服務(wù)節(jié)點(diǎn)i和部分其他服務(wù)節(jié)點(diǎn)的服務(wù)狀態(tài)和資源分配情況,決定是由本地節(jié)點(diǎn)直接向用戶提供服務(wù),或是向其他服務(wù)節(jié)點(diǎn)j發(fā)送資源k的數(shù)據(jù)調(diào)度請求,數(shù)據(jù)調(diào)度的目的是由其他服務(wù)節(jié)點(diǎn)向本地節(jié)點(diǎn)i推送所需資源k;另一方面根據(jù)本地節(jié)點(diǎn)i到用戶之間各條鏈路上的服務(wù)資源和負(fù)載情況,選擇本地節(jié)點(diǎn)i下的一條鏈路完成到用戶的資源傳輸。
當(dāng)一個(gè)服務(wù)節(jié)點(diǎn)收到來自其他節(jié)點(diǎn)的數(shù)據(jù)調(diào)度請求后,不必對(duì)其是否接入進(jìn)行決策,而是需要直接為該請求提供服務(wù)。然而,如果此服務(wù)節(jié)點(diǎn)處沒有足夠資源為這個(gè)請求提供服務(wù)時(shí),為了保證正在被服務(wù)的其他用戶請求的服務(wù)質(zhì)量,服務(wù)節(jié)點(diǎn)會(huì)放棄為這個(gè)請求提供服務(wù)。同樣在選擇傳輸鏈路時(shí),如果鏈路服務(wù)能力達(dá)到上限,為了保證其他正在接收資源的用戶服務(wù)質(zhì)量,傳輸鏈路會(huì)拒絕進(jìn)行該數(shù)據(jù)傳輸。當(dāng)一個(gè)請求所需的服務(wù)完成時(shí),此請求所占用的系統(tǒng)資源也會(huì)隨之釋放;同時(shí)考慮到該系統(tǒng)中服務(wù)節(jié)點(diǎn)是可編程存儲(chǔ)路由器,其存儲(chǔ)空間有限,為了滿足不同用戶的不同資源請求,可以假設(shè)本地節(jié)點(diǎn)接收到的來自其他節(jié)點(diǎn)推送的資源,在服務(wù)完成用戶請求后會(huì)被釋放,即節(jié)點(diǎn)存儲(chǔ)矩陣在系統(tǒng)更新資源前保持不變。
2基于POMDP的接入控制模型
MDP常用于解決接入控制問題,但MDP方法面臨著狀態(tài)空間過大導(dǎo)致的維數(shù)災(zāi)問題[17],由MDP擴(kuò)展的部分可觀Markov決策過程(Partially Observable Markov Decision Process, POMDP)可以基于觀測采取決策,能夠有效地解決MDP維數(shù)災(zāi)問題,因此,本文通過POMDP對(duì)基于SDN的媒體分發(fā)網(wǎng)絡(luò)的接入控制進(jìn)行建模,并通過策略梯度優(yōu)化算法求解最優(yōu)接入策略。
在研究基于SDN的媒體分發(fā)網(wǎng)絡(luò)的接入控制問題時(shí),可以作如下假設(shè):根據(jù)視頻源服務(wù)器更新可編程存儲(chǔ)路由器中存儲(chǔ)資源的時(shí)間間隔較長,可以假設(shè)服務(wù)節(jié)點(diǎn)的存儲(chǔ)信息不變,即存儲(chǔ)矩陣不變;不同服務(wù)節(jié)點(diǎn)可以提供的服務(wù)種類是不一樣的;由于SDN控制器對(duì)網(wǎng)絡(luò)具有集中管控能力,可以為用戶選擇最短路徑來傳輸資源,因此可以假設(shè)每個(gè)用戶都是通過最短路徑向服務(wù)節(jié)點(diǎn)發(fā)送資源請求;當(dāng)收到用戶請求的服務(wù)節(jié)點(diǎn)即本地服務(wù)節(jié)點(diǎn)沒有請求所需的資源時(shí),需要通過數(shù)據(jù)調(diào)度從別的服務(wù)節(jié)點(diǎn)將所需資源推送到本地節(jié)點(diǎn),再由本地節(jié)點(diǎn)向用戶提供服務(wù);用戶只能通過本地節(jié)點(diǎn)下的鏈路接收資源,這是因?yàn)樵趯?shí)際系統(tǒng)中,服務(wù)節(jié)點(diǎn)無法直接向所有用戶提供服務(wù)。
為了充分利用SDN控制器對(duì)路由器的直接管控和全網(wǎng)感知能力,本文在對(duì)系統(tǒng)進(jìn)行POMDP建模時(shí)綜合考慮了服務(wù)節(jié)點(diǎn)和傳輸鏈路的'性能優(yōu)化問題。以服務(wù)用戶數(shù)作為系統(tǒng)狀態(tài)參數(shù)來反映服務(wù)節(jié)點(diǎn)和傳輸鏈路的負(fù)載,以節(jié)點(diǎn)選擇和鏈路選擇作為決策行動(dòng),并定義用戶的請求到達(dá)和服務(wù)完成作為觀測事件,進(jìn)而可以計(jì)算出狀態(tài)之間的轉(zhuǎn)移概率和產(chǎn)生觀測的概率,在模型構(gòu)建完成后,通過策略梯度算法對(duì)接入控制策略進(jìn)行優(yōu)化。由于以系統(tǒng)長期運(yùn)行得到的平均報(bào)酬作為衡量系統(tǒng)性能的準(zhǔn)則,從而求解出的最優(yōu)策略可以提高系統(tǒng)運(yùn)營收益,對(duì)服務(wù)節(jié)點(diǎn)性能優(yōu)化的同時(shí),通過為用戶選擇傳輸鏈路,減少了鏈路擁塞對(duì)數(shù)據(jù)傳輸質(zhì)量和用戶服務(wù)質(zhì)量造成的影響,并改善用戶的服務(wù)體驗(yàn),減少系統(tǒng)資源的浪費(fèi)。
在對(duì)基于SDN的媒體分發(fā)網(wǎng)絡(luò)的接入控制建模之前,首先給出系統(tǒng)的一些主要參數(shù)及描述。在基于SDN的媒體分發(fā)網(wǎng)絡(luò)中,用戶可以請求的資源種類數(shù)為K,K種資源存儲(chǔ)在N個(gè)可編程存儲(chǔ)路由器中,即系統(tǒng)中服務(wù)節(jié)點(diǎn)數(shù)為N;用Vi表示節(jié)點(diǎn)i處的服務(wù)連接數(shù)上限,當(dāng)節(jié)點(diǎn)i的服務(wù)連接數(shù)等于Vi時(shí),拒絕其他接入的請求;Li表示服務(wù)節(jié)點(diǎn)i下向用戶進(jìn)行資源傳輸?shù)逆溌窋?shù),所有服務(wù)節(jié)點(diǎn)到用戶之間用于資源傳輸?shù)逆溌窋?shù)總數(shù)為L,滿足L=L1∪L2∪…∪LN;用Bli表示節(jié)點(diǎn)i下鏈路l上可用于資源傳輸?shù)姆⻊?wù)帶寬上限,當(dāng)該鏈路上已消耗的服務(wù)帶寬等于Bli時(shí),拒絕其他的資源傳輸請求;bk表示向用戶提供第k種資源服務(wù)所消耗的服務(wù)帶寬;假設(shè)用戶請求到達(dá)服從泊松分布,用λilik表示節(jié)點(diǎn)i收到來自鏈路li關(guān)于資源k的請求到達(dá)率;假設(shè)用戶服務(wù)時(shí)間服從指數(shù)分布,用μk表示關(guān)于資源k的服務(wù)率。
根據(jù)上述討論與假設(shè),接入控制的POMDP模型可以描述如下。
2.1狀態(tài)空間
2.2觀測空間
2.4狀態(tài)轉(zhuǎn)移概率
3優(yōu)化算法與仿真
3.1梯度優(yōu)化算法
3.2仿真實(shí)例
假設(shè)一個(gè)基于SDN的媒體分發(fā)網(wǎng)絡(luò)系統(tǒng)可以向用戶提供4種資源服務(wù),并存儲(chǔ)在3個(gè)可編程存儲(chǔ)路由器中,即該系統(tǒng)中服務(wù)節(jié)點(diǎn)數(shù)為3,并假設(shè)每個(gè)服務(wù)節(jié)點(diǎn)下各有3條鏈路可以進(jìn)行資源傳輸,資源在各個(gè)節(jié)點(diǎn)的分布情況由存儲(chǔ)矩陣D決定,下面給出系統(tǒng)仿真參數(shù)取值,如表1所示。
在仿真優(yōu)化初始階段,由于系統(tǒng)資源消耗較少,本文選擇盡力而為的服務(wù)策略作為起始策略,該策略一方面使服務(wù)節(jié)點(diǎn)盡可能大地接入用戶的資源請求;另一方面,選擇最短傳輸鏈路作為服務(wù)節(jié)點(diǎn)向用戶推送資源的路徑選擇策略。起始策略在系統(tǒng)負(fù)載較低的情況下,可以為用戶提供良好的服務(wù)質(zhì)量,但隨著系統(tǒng)內(nèi)服務(wù)用戶數(shù)的增加,由于沒有考慮節(jié)點(diǎn)和傳輸鏈路的負(fù)載情況以及對(duì)用戶造成的服務(wù)延時(shí),會(huì)導(dǎo)致系統(tǒng)整體負(fù)擔(dān)較大,在極大浪費(fèi)系統(tǒng)資源的同時(shí),使用戶得到較差的體驗(yàn)質(zhì)量。
在選定初始策略的基礎(chǔ)上,使用策略梯度優(yōu)化算法進(jìn)行策略迭代,由于選取系統(tǒng)長期運(yùn)行得到的平均報(bào)酬作為系統(tǒng)性能測度,優(yōu)化目標(biāo)是求出最優(yōu)策略使其最大,為了觀測系統(tǒng)性能的變化情況,繪制出系統(tǒng)性能在迭代過程中的變化曲線,如圖3所示。從圖3可以看出,隨著迭代次數(shù)的增加,接入控制策略不斷進(jìn)行更新,系統(tǒng)性能也隨之顯著提升,并最終在最優(yōu)策略下系統(tǒng)性能達(dá)到最優(yōu)。表2給出兩種不同策略下的系統(tǒng)性能對(duì)比數(shù)據(jù),將基于POMDP的最優(yōu)策略與盡力而為策略作對(duì)比,發(fā)現(xiàn)最優(yōu)策略下的系統(tǒng)性能明顯優(yōu)于盡力而為策略,性能提升約10%,驗(yàn)證了本文所提出的綜合優(yōu)化應(yīng)用層服務(wù)節(jié)點(diǎn)和網(wǎng)絡(luò)層傳輸鏈路服務(wù)性能的接入控制方案,在有效利用系統(tǒng)資源的同時(shí),提高了系統(tǒng)的性能。
本文進(jìn)一步研究到達(dá)率對(duì)策略梯度優(yōu)化算法的影響,分別在低到達(dá)率λ2和高到達(dá)率λ3的情況下,觀測系統(tǒng)性能隨迭代次數(shù)增加的變化情況,其中λ2和λ3的取值如下,最終實(shí)驗(yàn)仿真結(jié)果如圖4所示。
由圖4可知,不論是在低到達(dá)率還是高到達(dá)率下,策略梯度優(yōu)化算法都非常有效,接入控制策略的系統(tǒng)性能均隨著迭代次數(shù)的增加逐漸升高,并在迭代結(jié)束后的最優(yōu)策略下達(dá)到最優(yōu)。系統(tǒng)性能的顯著提升意味著與盡力而為策略相比,媒體服務(wù)提供商采用最優(yōu)策略作為接入控制策略將得到更高的收益,從而提高了系統(tǒng)的運(yùn)營能力。
4結(jié)語
本文對(duì)基于SDN的媒體分發(fā)網(wǎng)絡(luò)的接入控制問題進(jìn)行研究,在傳統(tǒng)接入控制方案的基礎(chǔ)上,結(jié)合SDN系統(tǒng)架構(gòu)的特點(diǎn),提出了一種綜合考慮應(yīng)用層和網(wǎng)絡(luò)層優(yōu)化問題的接入控制方案。該方案一方面優(yōu)化應(yīng)用層上服務(wù)節(jié)點(diǎn)的服務(wù)性能;另一方面優(yōu)化網(wǎng)絡(luò)層上服務(wù)節(jié)點(diǎn)到用戶之間的傳輸鏈路的服務(wù)性能,減少鏈路擁塞對(duì)數(shù)據(jù)傳輸和用戶服務(wù)質(zhì)量的影響。本文利用POMDP對(duì)系統(tǒng)的接入控制進(jìn)行建模,并采用策略梯度優(yōu)化算法求解出最優(yōu)策略。最后,通過仿真實(shí)驗(yàn)驗(yàn)證了模型的有效性及優(yōu)勢。
【基于軟件定義網(wǎng)絡(luò)的媒體分發(fā)網(wǎng)絡(luò)的接入控制】相關(guān)文章:
1.新時(shí)期網(wǎng)絡(luò)財(cái)務(wù)軟件的要素論文
2.流媒體在網(wǎng)絡(luò)教學(xué)中的運(yùn)用思考論文
3.基于翻轉(zhuǎn)課堂的《網(wǎng)絡(luò)營銷》教學(xué)探討論文
4.基于網(wǎng)絡(luò)的農(nóng)村社區(qū)教育模塊化的建構(gòu)的論文
6.未來網(wǎng)絡(luò)財(cái)務(wù)軟件應(yīng)用模式的構(gòu)想論文
7.新媒體時(shí)代網(wǎng)絡(luò)禮品市場營銷探究
8.淺談基于Openstack 的網(wǎng)絡(luò)攻防實(shí)驗(yàn)平臺(tái)設(shè)計(jì)與實(shí)現(xiàn)論文
9.基于計(jì)算機(jī)網(wǎng)絡(luò)系統(tǒng)包裝設(shè)計(jì)的軟件開發(fā)技術(shù)研究論文