虛擬人足球比賽決策系統的開發應用
虛擬人足球比賽模擬就是主要依據現實足球比賽的場景進行的模擬活動,下面是小編搜集整理的一篇探究虛擬人足球比賽決策系統開發的論文范文,供大家閱讀參考。
引言
虛擬人足球比賽模擬就是主要依據現實足球比賽的場景進行的模擬活動,需要考慮的就是整個球隊的戰略思想和球員個體的思想活動。作為虛擬人足球比賽的“大腦”的決策系統的根本任務就是根據比賽場上的實際情況,對虛擬人的下一步的行為作出決策,而虛擬人就是按照該決策作出動作,以此達到最終的防守或者進攻得分的目的,進而實現對真實球員活動的模擬和仿真。很大程度上決定了對現實足球比賽所進行的模擬和仿真的可靠程度。國內外對虛擬人足球比賽的研究相對較少,對虛擬人足球比賽決策系統研究更是少之又少,而與此對比的就是對機器人足球比賽仿真的研究相對較多,可以通過借鑒對機器人足球比賽研究中比較成熟的經驗,設計出較為成熟的模型。
為了解決機器人足球比賽中決策系統在虛擬人足球比賽決策系統中所存在的缺陷,本文提出了一系列的全新決策的生產方法,通過該決策最終指導虛擬人的動作。
為了簡化決策系統的設計,以此降低球員之間的耦合度,本文中的決策系統不考慮守門員的角色,只對其他的10名球員做出決策,并且這10名球員的角色都是固定不變的,每名球員擁有三種任意的角色供自己選擇,即后衛、中場、前鋒三種角色,而且對于確定陣型下的球員之間所形成的協作關系也是固定不變的。
1策略庫
虛擬人足球比賽決策系統的決策庫主要包括兩種,即全局策略庫和個體策略庫。
1.1全局策略庫
全局策略作為球隊的“大腦”,對整個球隊的陣型和戰略戰術能夠起到協調的作用。在全局策略庫中所存在的一些信息,都可以成為決策系統做出決策時所參考的依據。其中,防守本位點主要是在某一陣型下每個球員的防守區域的重心下進行。
1.2個體策略庫
個體決策庫是根據角色制定的,不同的角色應該有著不同的個體策略庫。因為各個角色之間的戰術分配對象也是不一樣的,例如在4-4-2陣型中,球員之間的協作關系如圖1所示。
根據上述分析,不難看出,對不同的球員采取不同的個體策略庫是很有必要的。每個個體決策庫中存儲了與球員角色相關的個體信息。本文中的決策系統對球隊的10明球員(不包括守門員),分別有10個不同的個體策略庫。
由于每個球員都是一個獨立的智能體(Agent),具有自主學習能力,其個體決策庫是隨著時間的推移而變化的。球員個體的學習過程如圖2所示。
虛擬人足球比賽如同現實足球比賽一樣,場上的情況瞬息萬變,錯綜復雜。為了能在這種復雜環境中做出對虛擬人球員的動作決策,可以結合虛擬人足球比賽的特點加以改進,如圖3所示。
在該決策系統分層結構模型中,整個決策過程分為兩層,分別是推理層和動作層。在做出決策之前,先獲取比賽場上的態勢數據。其中,在選擇攻防的時候,要根據全局策略庫和態勢數據的實際情況對防守或者進攻做出選擇。
2虛擬人足球比賽決策系統的設計
基于以上所提出的分層結構模型,對該決策系統的設計如下:
2.1攻防選擇
攻防選擇主要是為了確定球隊的整體策略是進攻還是防守。每一位球員個體都是球隊整體中的一份子,他們必須遵守球隊的整體戰略,因為每一個球隊中所有球員的進攻策略都是相同的。因此,在選擇攻防的時候,要根據全局策略庫進行當前形式的分析,是易守還是易攻,進而產生出后續的指導決策。
攻防選擇的過程設計如下:IF己方控球THEN選擇進攻策略ELSEIF對方控球THEN選擇防守策略ELSE球處于無人運動狀態IF最近一次的控球方是己方THEN選擇進攻策略ELSE最近一次的控球方是對方THEN選擇防守策略
2.2行為選擇
在攻防選擇確定了防守進攻策略之后,可以根據具體的攻防策略選擇具體的行為。首先說明一下區域劃分的概念。
在全局策略庫中存儲有某一陣型下的區域劃分圖,如圖4所示為4-4-2陣型下的區域劃分圖。通過這種分區的方法,可以確定每個球員負責的區域范圍(稱為自治域),自治域有重疊(重疊部分區域稱為協防區域)的兩個球員之間存在合作關系,防守的時候他們可以根據場上態勢進行協防,進攻的時候他們可以根據場上態勢進行傳接球配合。
2.2.1防守策略
對于防守策略,主要的目的就是阻擋和斷球。因此選擇跑位目標,即策略點和跑位速度,就顯得尤為重要了。
根據場上態勢數據和全局策略庫中的區域劃分,并根據球員的具體角色,從其中個體策略庫中計算出球員的防守跑位決策。該計算過程設計如下:IF球在個體的自治域中IF對方球員帶球THEN局部跑位盯人防守ELSE對方球員傳球或者射門THEN向著球的運動軌跡跑位斷球ELSE球不在個體的自治域中IF個體的自治域中無對方球員IF相鄰隊友需要協防THEN選擇一個相鄰隊友進行協防跑位(向他們共同的協防區域跑位)ELSE相鄰隊友不需要協防THEN防守策略跑位(向自治域中防守本位點跑位)ELSEIF個體自治域中有1個對方球員THEN局部跑位盯人防守ELSE個體自治域中有多個對方球員THEN選擇威脅度最大(離己方球門最近)的對方球員做局部。
2.2.2進攻策略
對于進攻策略而言,其主要的目的就是球員如何帶球到對方門下進行射門得分,因此選擇帶球的方向和速度是十分有必要的。還可以根據場上的具體形式和全局的策略庫數據中的區域劃分,對場上每位球員的.具體角色進行進攻決策分析。例如個體的角色是前鋒,則該計算過程設計如下:IF個體不是持球球員THEN進攻策略跑位(向自治域中離對方球門近、球員分布稀疏位置跑位)LESE個體是持球球員IF射門系數等于或大于閾值(閾值作為判斷是否進行射門的標準)THEN選擇射門ELSE射門系數小于閾值IF丟球危險程度高(危險程度由球員個體周圍某一范圍的對方球員數量決定)THEN選擇一個相鄰隊友傳球ELSE丟球危險程度低THEN向進攻本位點帶球
2.3動作規劃
為了確定球員之間的具體行為,就主要根據球員的角色從其中對應的個體策略庫中選擇合適的策略,在動作規劃階段為球員的具體行為選擇合適的行為規范。對于防守策略中的跑位,就需要先確定跑位方向、跑位速度;對于進攻策略中的射門,則需要確定射門方向、踢出球的初速度;對于進攻中的帶球,則需要確定跑位目標(策略點)、到達策略點時的速度等等。而對于進攻中的傳球,需要確定傳球方向、傳球初速度,因為需要與隊友共同配合以完成傳接球的目的,因此確定傳球方向和傳球初速度比較復雜。在這里使用一種較為簡潔的傳球動作規劃策略,對于如圖5所示的一種的典型的傳球場景,計算過程如下:
2.4路徑規劃
基于弗格森參數三次曲線[5]的計算量較小的特性,這里所使用的是弗格森參數三次曲線作為路徑曲線的,其中計算弗格森參數三次曲線所需的參數(兩個端點及其切矢,分別用p(0),p(1),-p(0),-p(1)表示)。這種避障路徑分割方法如圖6所示。
3結束語
為了滿足虛擬人足球比賽特殊性的要求,本文在機器人足球決策系統的基礎上,提出了全局策略庫與個體策略庫相結合使用的決策生成方法,以此建立虛擬人足球比賽的決策系統的分層結構模型,并根據4-4-2陣型給出了各層次的設計過程。決策系統的個體自主學習的過程設計還有待完善,這將是下一步的工作重點。
參考文獻:
[1]趙逢達,孔令富,李賢善.基于分層結構模型的機器人足球決策系統設計[J].哈爾濱工業大學學報,2005,37(7):933-935.
[2]潘凌寒,楚威,程顯毅.基于角色的RoboCup足球策略[J].計算機工程與應用,2004,26:66-67.
[3]QiZhang,YimingYang,YingLi.AMulti-agentCooperativeSystemofSoccerRobot[C].Proceedingsofthe4thWorldCongressonIntelligentControlandAutomation.Shanghai,P.R.China:June10-14,2002:510-514.
[4]董青.現代足球比賽身形探析[J].遼寧體育科技,2004,26(4).
[5]李建偉,洪炳镕,郝宗波,高全勝,郭崎.機器人足球仿真比賽平臺的改進[J].哈爾濱工業大學學報,2003(09).
[6]秦雙,張番,陳穎,馮秀娟,鄭國磊,溫文彪,孫紅三.虛擬人行為仿真智能化探討[J].系統仿真學報,2002(09).
[7]曹成才.機器人足球仿真系統的研究[D].四川大學,2005.
[8]余斌,李龍澍,李學俊.多智能體的角色與結構設計分析[J].計算機技術與發展,2006,07:73-75.
[9]施法中.計算機輔助幾何設計與非均勻有理B樣條(CAGD&NURBS)[M].北京:北京航空航天大學出版社,1994:56-65.
[10]馬軍,閆琪,毛新軍,王戟,齊治昌.基于角色的多Agent系統軟件設計方法[J].計算機工程與應用,2004,06:118-120.
【虛擬人足球比賽決策系統的開發應用】相關文章:
3.企業資源決策系統