基于強化學習的多路徑傳輸控制協(xié)議優(yōu)化
【學位單位】:南京大學
【學位級別】:碩士
【學位年份】:2019
【中圖分類】:TP393.06
【部分圖文】:
、??圖1-1:?MPTCP的協(xié)議棧??TCP/IP協(xié)議族是一組不同層次上的多個協(xié)議的組合,如圖1-1左側所示,??TCP/IP通常被表示為一個四層協(xié)議系統(tǒng),每層負責不同的功能,層與層之間分??工合作[I]。鏈路層通常包括操作系統(tǒng)中的設備驅動程序和計算機中對應的網(wǎng)??絡接口卡,處理物理接口的細節(jié);網(wǎng)絡層負責處理分組選路等分組在網(wǎng)絡中的??活動;傳輸層負責為兩臺主機上的應用程序提供端到端的通信。傳輸控制協(xié)議??TCP屬于傳輸層的協(xié)議,可以提供高可靠性的數(shù)據(jù)通信;應用層負責處理特定??的應用程序細節(jié)[1]。??如圖1-1右側所示,MPTCP也屬于傳輸層的協(xié)議,可以看作是單路徑TCP??擴展到多路徑的多路傳輸協(xié)議。MPTCP使得多網(wǎng)卡、多鏈路的資源得以充分利??用,同時提高傳輸?shù)男屎汪敯粜。MPTCP使用與單路徑TCP?—樣的socket??接口,使得能夠兼容現(xiàn)有的TCP應用。同時MPTCP的每個子流和單路徑TCP??流類似,使用相同的TCP首部數(shù)據(jù)格式和數(shù)據(jù)封裝過程,這使得MPTCP能夠??兼容其下的網(wǎng)絡層協(xié)議。??圖1-2展示了使用MPTCP進行數(shù)據(jù)傳輸時
?、、、、?TCP!?TCP2?…TCPn??、??圖1-1:?MPTCP的協(xié)議棧??TCP/IP協(xié)議族是一組不同層次上的多個協(xié)議的組合,如圖1-1左側所示,??TCP/IP通常被表示為一個四層協(xié)議系統(tǒng),每層負責不同的功能,層與層之間分??工合作[I]。鏈路層通常包括操作系統(tǒng)中的設備驅動程序和計算機中對應的網(wǎng)??絡接口卡,處理物理接口的細節(jié);網(wǎng)絡層負責處理分組選路等分組在網(wǎng)絡中的??活動;傳輸層負責為兩臺主機上的應用程序提供端到端的通信。傳輸控制協(xié)議??TCP屬于傳輸層的協(xié)議,可以提供高可靠性的數(shù)據(jù)通信;應用層負責處理特定??的應用程序細節(jié)[1]。??如圖1-1右側所示,MPTCP也屬于傳輸層的協(xié)議,可以看作是單路徑TCP??擴展到多路徑的多路傳輸協(xié)議。MPTCP使得多網(wǎng)卡、多鏈路的資源得以充分利??用,同時提高傳輸?shù)男屎汪敯粜。MPTCP使用與單路徑TCP?—樣的socket??接口,使得能夠兼容現(xiàn)有的TCP應用。同時MPTCP的每個子流和單路徑TCP??流類似
圖3-3:基于強化學習的MPTCP擁塞控制SmartCC的框架??態(tài)映射到離散的狀態(tài)區(qū)域塊。所以每個狀態(tài)s可以由一個狀態(tài)區(qū)域塊t?=?iA〇)??表示,該等式表示狀態(tài)區(qū)域塊T包含狀態(tài)s或者狀態(tài)區(qū)域塊T被狀態(tài)s激活。??因此,2函數(shù)(動作值函數(shù))可以表示為:2(r,a)?=?2(少⑷,a)=E[2:yV,],??其含義為從狀態(tài)s出發(fā),執(zhí)行動作《后,機器能得到的累積折扣獎賞的期望。??本文采用基于表格形式的Q-leaming算法[37],來學出一個貪婪的確定性??策略?7r(a,)?=?argmaxa?2(少(\),^〇。舉例,當?A?=?argmaxa?2(0(4),^,那么如果??機器從狀態(tài)^出發(fā),執(zhí)行動作并一直根據(jù)該策略選擇執(zhí)行動作,機器將??會得到最大化的累積折扣獎賞。訓練器的規(guī)則表也會根據(jù)策略7T添加或更新規(guī)??則—個基于貪婪確定性策略的規(guī)則表如表3-3所示,它指定了不同狀??態(tài)下最大化累積折扣獎賞的動作。例如表3-3的第一行規(guī)則<Tl5?A?>,第一項??被狀態(tài)h激活的狀態(tài)區(qū)域塊n?=?(Ahi),第二項是基于2函數(shù)最大化的動作??ax?=?argmaxa?Q(i//(si),a)〇??
【相似文獻】
相關期刊論文 前10條
1 哈渭濤;;一種新的反饋式流媒體擁塞控制算法[J];科學技術與工程;2010年05期
2 韓燮;安愛芬;;一種網(wǎng)絡擁塞控制算法的研究[J];太原大學學報;2008年03期
3 王滿喜;胡向暉;馬刈非;;混合式的網(wǎng)絡擁塞控制算法[J];電子科技大學學報;2007年03期
4 ?膳;李紹滋;;一種基于反饋的流媒體擁塞控制算法的改進[J];計算機應用;2007年10期
5 楊新宇,曾明,江曉,趙瑞,吳航;一種新的自適應網(wǎng)絡擁塞控制算法[J];計算機工程;2004年08期
6 蔣學勤,楊麗芳;網(wǎng)絡中兩類擁塞控制算法比較[J];貴州大學學報(自然科學版);2003年04期
7 熊曉將;;基于探測機制的衛(wèi)星鏈路擁塞控制算法研究[J];航天器工程;2012年05期
8 黨美瑩;歐陽;孫元姝;甄長飛;;一種新的流媒體擁塞控制算法[J];小型微型計算機系統(tǒng);2011年08期
9 彭立宏;張鶴穎;姜新文;竇文華;;一種快速公平收斂的擁塞控制算法[J];電子學報;2010年08期
10 劉宇蘋;;基于擁塞控制算法的研究[J];武漢船舶職業(yè)技術學院學報;2009年03期
相關博士學位論文 前10條
1 龍承念;高動態(tài)異構INTERNET擁塞控制算法研究[D];燕山大學;2004年
2 錢艷平;互聯(lián)網(wǎng)擁塞控制算法若干問題研究[D];東南大學;2006年
3 楊洪勇;Internet擁塞控制算法的動力學研究[D];東南大學;2005年
4 邵立松;互聯(lián)網(wǎng)端到端擁塞控制算法研究[D];國防科學技術大學;2006年
5 陳虎;互聯(lián)網(wǎng)擁塞控制算法研究[D];華中科技大學;2008年
6 胡曦;無線SDN穩(wěn)定性擁塞控制算法研究[D];電子科技大學;2017年
7 侯萍;基于控制理論的網(wǎng)絡擁塞控制算法研究[D];南京理工大學;2011年
8 楊歆豪;基于控制理論的網(wǎng)絡擁塞控制中的若干算法研究[D];南京理工大學;2010年
9 任娟;無線Mesh網(wǎng)絡的資源分配及擁塞控制算法研究[D];北京交通大學;2010年
10 何凌;TCP/IP網(wǎng)絡擁塞控制若干問題的研究[D];東北大學;2008年
相關碩士學位論文 前10條
1 張晗;基于強化學習的多路徑傳輸控制協(xié)議優(yōu)化[D];南京大學;2019年
2 李超君;面向實時音視頻流的擁塞控制算法[D];北京郵電大學;2019年
3 吳蕾蕾;數(shù)據(jù)驅動的移動視頻直播擁塞控制技術研究[D];北京郵電大學;2019年
4 李洪林;異構網(wǎng)絡中TCP擁塞控制算法的研究與改進[D];北京郵電大學;2019年
5 李少博;端到端的TCP擁塞控制算法研究[D];哈爾濱理工大學;2018年
6 劉盼;基于BBR擁塞控制算法的空間環(huán)境數(shù)據(jù)傳輸系統(tǒng)[D];中國科學院大學(中國科學院國家空間科學中心);2018年
7 潘俊臣;基于TCP協(xié)議的擁塞控制算法的研究[D];成都理工大學;2018年
8 徐磊;基于模糊神經網(wǎng)絡的無線網(wǎng)絡擁塞控制算法[D];江蘇科技大學;2018年
9 湯永鋒;基于嵌入式的TCP無線通信設計與性能研究[D];華中科技大學;2017年
10 段家琛;移動環(huán)境下MPTCP擁塞控制算法的設計與實現(xiàn)[D];北京郵電大學;2013年
本文編號:2891344
本文鏈接:http://www.wukwdryxk.cn/guanlilunwen/ydhl/2891344.html