基于強化學習的多路徑傳輸控制協議優(yōu)化
【學位單位】:南京大學
【學位級別】:碩士
【學位年份】:2019
【中圖分類】:TP393.06
【部分圖文】:
、??圖1-1:?MPTCP的協議棧??TCP/IP協議族是一組不同層次上的多個協議的組合,如圖1-1左側所示,??TCP/IP通常被表示為一個四層協議系統(tǒng),每層負責不同的功能,層與層之間分??工合作[I]。鏈路層通常包括操作系統(tǒng)中的設備驅動程序和計算機中對應的網??絡接口卡,處理物理接口的細節(jié);網絡層負責處理分組選路等分組在網絡中的??活動;傳輸層負責為兩臺主機上的應用程序提供端到端的通信。傳輸控制協議??TCP屬于傳輸層的協議,可以提供高可靠性的數據通信;應用層負責處理特定??的應用程序細節(jié)[1]。??如圖1-1右側所示,MPTCP也屬于傳輸層的協議,可以看作是單路徑TCP??擴展到多路徑的多路傳輸協議。MPTCP使得多網卡、多鏈路的資源得以充分利??用,同時提高傳輸的效率和魯棒性。MPTCP使用與單路徑TCP?—樣的socket??接口,使得能夠兼容現有的TCP應用。同時MPTCP的每個子流和單路徑TCP??流類似,使用相同的TCP首部數據格式和數據封裝過程,這使得MPTCP能夠??兼容其下的網絡層協議。??圖1-2展示了使用MPTCP進行數據傳輸時
?、、、、?TCP!?TCP2?…TCPn??、??圖1-1:?MPTCP的協議棧??TCP/IP協議族是一組不同層次上的多個協議的組合,如圖1-1左側所示,??TCP/IP通常被表示為一個四層協議系統(tǒng),每層負責不同的功能,層與層之間分??工合作[I]。鏈路層通常包括操作系統(tǒng)中的設備驅動程序和計算機中對應的網??絡接口卡,處理物理接口的細節(jié);網絡層負責處理分組選路等分組在網絡中的??活動;傳輸層負責為兩臺主機上的應用程序提供端到端的通信。傳輸控制協議??TCP屬于傳輸層的協議,可以提供高可靠性的數據通信;應用層負責處理特定??的應用程序細節(jié)[1]。??如圖1-1右側所示,MPTCP也屬于傳輸層的協議,可以看作是單路徑TCP??擴展到多路徑的多路傳輸協議。MPTCP使得多網卡、多鏈路的資源得以充分利??用,同時提高傳輸的效率和魯棒性。MPTCP使用與單路徑TCP?—樣的socket??接口,使得能夠兼容現有的TCP應用。同時MPTCP的每個子流和單路徑TCP??流類似
圖3-3:基于強化學習的MPTCP擁塞控制SmartCC的框架??態(tài)映射到離散的狀態(tài)區(qū)域塊。所以每個狀態(tài)s可以由一個狀態(tài)區(qū)域塊t?=?iA〇)??表示,該等式表示狀態(tài)區(qū)域塊T包含狀態(tài)s或者狀態(tài)區(qū)域塊T被狀態(tài)s激活。??因此,2函數(動作值函數)可以表示為:2(r,a)?=?2(少⑷,a)=E[2:yV,],??其含義為從狀態(tài)s出發(fā),執(zhí)行動作《后,機器能得到的累積折扣獎賞的期望。??本文采用基于表格形式的Q-leaming算法[37],來學出一個貪婪的確定性??策略?7r(a,)?=?argmaxa?2(少(\),^〇。舉例,當?A?=?argmaxa?2(0(4),^,那么如果??機器從狀態(tài)^出發(fā),執(zhí)行動作并一直根據該策略選擇執(zhí)行動作,機器將??會得到最大化的累積折扣獎賞。訓練器的規(guī)則表也會根據策略7T添加或更新規(guī)??則—個基于貪婪確定性策略的規(guī)則表如表3-3所示,它指定了不同狀??態(tài)下最大化累積折扣獎賞的動作。例如表3-3的第一行規(guī)則<Tl5?A?>,第一項??被狀態(tài)h激活的狀態(tài)區(qū)域塊n?=?(Ahi),第二項是基于2函數最大化的動作??ax?=?argmaxa?Q(i//(si),a)〇??
【相似文獻】
相關期刊論文 前10條
1 哈渭濤;;一種新的反饋式流媒體擁塞控制算法[J];科學技術與工程;2010年05期
2 韓燮;安愛芬;;一種網絡擁塞控制算法的研究[J];太原大學學報;2008年03期
3 王滿喜;胡向暉;馬刈非;;混合式的網絡擁塞控制算法[J];電子科技大學學報;2007年03期
4 常可沛;李紹滋;;一種基于反饋的流媒體擁塞控制算法的改進[J];計算機應用;2007年10期
5 楊新宇,曾明,江曉,趙瑞,吳航;一種新的自適應網絡擁塞控制算法[J];計算機工程;2004年08期
6 蔣學勤,楊麗芳;網絡中兩類擁塞控制算法比較[J];貴州大學學報(自然科學版);2003年04期
7 熊曉將;;基于探測機制的衛(wèi)星鏈路擁塞控制算法研究[J];航天器工程;2012年05期
8 黨美瑩;歐陽;孫元姝;甄長飛;;一種新的流媒體擁塞控制算法[J];小型微型計算機系統(tǒng);2011年08期
9 彭立宏;張鶴穎;姜新文;竇文華;;一種快速公平收斂的擁塞控制算法[J];電子學報;2010年08期
10 劉宇蘋;;基于擁塞控制算法的研究[J];武漢船舶職業(yè)技術學院學報;2009年03期
相關博士學位論文 前10條
1 龍承念;高動態(tài)異構INTERNET擁塞控制算法研究[D];燕山大學;2004年
2 錢艷平;互聯網擁塞控制算法若干問題研究[D];東南大學;2006年
3 楊洪勇;Internet擁塞控制算法的動力學研究[D];東南大學;2005年
4 邵立松;互聯網端到端擁塞控制算法研究[D];國防科學技術大學;2006年
5 陳虎;互聯網擁塞控制算法研究[D];華中科技大學;2008年
6 胡曦;無線SDN穩(wěn)定性擁塞控制算法研究[D];電子科技大學;2017年
7 侯萍;基于控制理論的網絡擁塞控制算法研究[D];南京理工大學;2011年
8 楊歆豪;基于控制理論的網絡擁塞控制中的若干算法研究[D];南京理工大學;2010年
9 任娟;無線Mesh網絡的資源分配及擁塞控制算法研究[D];北京交通大學;2010年
10 何凌;TCP/IP網絡擁塞控制若干問題的研究[D];東北大學;2008年
相關碩士學位論文 前10條
1 張晗;基于強化學習的多路徑傳輸控制協議優(yōu)化[D];南京大學;2019年
2 李超君;面向實時音視頻流的擁塞控制算法[D];北京郵電大學;2019年
3 吳蕾蕾;數據驅動的移動視頻直播擁塞控制技術研究[D];北京郵電大學;2019年
4 李洪林;異構網絡中TCP擁塞控制算法的研究與改進[D];北京郵電大學;2019年
5 李少博;端到端的TCP擁塞控制算法研究[D];哈爾濱理工大學;2018年
6 劉盼;基于BBR擁塞控制算法的空間環(huán)境數據傳輸系統(tǒng)[D];中國科學院大學(中國科學院國家空間科學中心);2018年
7 潘俊臣;基于TCP協議的擁塞控制算法的研究[D];成都理工大學;2018年
8 徐磊;基于模糊神經網絡的無線網絡擁塞控制算法[D];江蘇科技大學;2018年
9 湯永鋒;基于嵌入式的TCP無線通信設計與性能研究[D];華中科技大學;2017年
10 段家琛;移動環(huán)境下MPTCP擁塞控制算法的設計與實現[D];北京郵電大學;2013年
本文編號:2891344
本文鏈接:http://www.lk138.cn/guanlilunwen/ydhl/2891344.html