高男

摘要:目前5G时代已经到来,终端直通通信技术(D2D,Device-to-Device)逐渐引起人们的广泛注意,在下一代的蜂窝移动通信系统中它也是关键技术之一。而非合作博弈论以其能够最大化频谱资源利用率的优点成为研究热点。首先对博弈论进行简介;其次重点介绍了几种非合作博弈论与资源分配相结合的研究现状;最后总结了D2D频谱资源分配仍然存在的问题以及未来的研究方向。

关键词:5G;D2D;博弈论;资源分配

中图分类号:TN914        文献标识码:A

文章编号:1009-3044(2019)19-0233-02

Abstract: At present, the 5G era has come, and the device-to-device (D2D) has gradually attracted widespread attention and is considered to be one of the key technologies in the next generation of cellular mobile communication systems. Non-cooperative game theory has become a research hotspot because of its advantages of maximizing spectrum resource utilization. Firstly, the game theory is introduced. Secondly, the research status of several non-cooperative game theory and resource allocation is introduced. Finally, the problems still existing in D2D spectrum resource allocation and future research directions are summarized.

Key words:5G; D2D; game theory; resource allocation

1 引言

随着通信系统的日益扩大与逐渐完善,通信系统内的频谱资源日渐紧张,传统的通信方式已经不能满足人们的通信需求,且随着在网设备的指数级增加,通信方式以及资源利用亟需变革。博弈论作为经济领域经典的理论系统,其经典的非合作博弈模型及囚徒困境等理论能够较好地应用于D2D通信中的频谱资源分配中,以达到频谱资源被最大化、最高质量利用的目的,这样的结合也逐渐成了频谱资源分配的主流方式。

2 博弈论简介

博弈论,也叫作对策论。它的几个相关元素为:(1)参与人:参与人作为博弈过程中博弈双方的行为选择的主体,至少需要有2个及以上,才能形成博弈环境。(2)行动:所谓的行动,就是指参与人在博弈环境中需要以及自身条件采取一些动作的集合。(3)信息:参与人需要有博弈过程中其他参与人的一些包括行动,策略等方面的信息。(4)策略:即参与人要有对应的措施来完成方案的贯彻执行。(5)效用:即参与人需要执行策略的过程中获得对应的收益。(6)结果:在博弈过程结束后所有参与人在过程中的策略执行的集合。(7)均衡:即所有参与者在博弈过程中选择最佳策略的集合。

博弈理论可以依据不同的标准来进行不同的分类。例如,根据参与人之间的依赖关系,可以将博弈论分为合作博弈和非合作博弈,这其中的非合作博弈,也就是参与人之间没有约束力的锲约。由于非合作博弈理论考虑更多的是博弈个体之间的利益相关事件。因此更加符合面向D2D通信技术的蜂窝网络系统的资源分配问题。当前的博弈理论研究也基本集中在非合作博弈理论的基础之上。而作为非合作博弈最基本的解,纳什均衡(Nash Equilibrium,NE)可以作为解决非合作博弈的均衡问题的唯一性标准。下面是对纳什均衡的相关定义表述:

在一个N人博弈中,策略组合S = (S1,S2,…,SN)构成一个纳什均衡,当且仅当:对于每一个博弈者i,i = 1,2,…,N,其策略Si是对策略组合S中的其他所有博弈者策略S?i的最优回应,即对任意Si′∈Si,Ui(Si,S?i) ≥ Ui(Si′,S?i)。同时,纳什均衡实现的前提条件必须满足:每个参与人不仅可以很清楚地知道其他参与人的均衡策略,也很清楚地了解对手很清楚地知道自己的均衡策略。也就是说,所有参与人的均衡策略是共同认知。只有这样,纳什均衡才可以实现。

3 非合作博弈在D2D通信资源分配中的研究现状

D2D通信网络结构示意图如图1所示。传统的移动通信网络中,通信终端的信息一般是交由基站来转发。即使两个移动终端之间的距离很近,而距离基站很远的时候,或移动通信设备再蜂窝小区边缘地带时,信息从一个移动终端发送到另一个移动终端时,仍然是先发送到距离很远的基站,然后再由基站转发回来送达另一个移动终端。这种情况就会造成系统过多的消耗功耗,增加了通信系统的时延,进而降低了数据的传输效率。而如果采用D2D通信技术,就省去了将信息交由基站来转发的环节,而是直接时移动设备端对端之间的直通通信。这样从D2D通信的技术层面来看,D2D通信过程对于用户就是完全透明的状态。通信的过程就需要交由蜂窝通信系统来管理,而移动设备终端只需要实时的呼叫,发送信息。

目前非合作博弈论已经成功应用在了多种D2D通信的资源分配场景中,例如蜂窝系统内多D2D对用户间的频谱资源分配以及跨小区的D2D用户资源分配。下文主要对非合作博弈在D2D通信资源分配中的发展现状进行阐述。

文献[1]提出将非合作博弈论应用于D2D通信系统频谱资源分配中,大大提高了频谱资源利用率。文献[2]提出了一种SPS(Semi-PersistentScheduling)资源分配算法,在考虑频谱资源利用率的基础上又考虑到了同系统中D2D用户之间的互相干扰,并将系统抗干扰性提高了13%。文献[3]提出可以对D2D资源分配问题进行转化,变成研究混合整数的非线性规划问题,并设计出一种基于非合作博弈的可供选择的启发式资源分配方案,通过信道增益的变化来降低D2D设备对蜂窝通信系统的干扰。文献[4]将连续二价拍卖理论引入蜂窝通信系统作为D2D通信资源分配算法。作者提出的方案是将信道资源分成一个一个连续的单元模块,并设定成商品用来拍卖,接着将D2D移动用户设定成竞拍者来竞争设定的资源模块,通过这种方式来获取D2D通信模式下的最佳传输链路。文献[5]结合Stackelberg博弈模型提出两个算法,并利用基站与D2D用户终端的层次交互再以D2D发射功率为基准对用户实行收费机制,以达到综合考虑频谱资源复用率与用户间干扰的最优解。文献[6]提出一种时隙分享策略,使互为中继的D2D用户通过分享时隙的方式建立合作,并通过拉格朗日乘数法求解出了D2D用户以多大时隙中继复用彼此数据,解决了D2D用户如何合作的问题。文献[7]基于D2D通信系统中传统能效函数仅能捕获瞬时数据流量,而无法获取特定时间段内数据流量的能效,将吞吐量和终端使用时间之积作为效用函数,以终端使用时间内的吞吐量最大化为目标,并将其建模为非合作功率控制博弈(non-conperative power control game,NPG)问题并得到其纳什均衡解,不仅提升系统效用值和终端使用时间,还可以保持系统公平性。文献[8]针对混合通信网络中蜂窝用户与D2D用户同频干扰问题,提出基于竞价的D2D频谱资源分配算法。创新地使用了注水算法并通过拉格朗日条件来优化价格。

以上大量杰出的研究工作表明,为了能够更加合理、高效的复用有限的频谱资源,同时尽量减少D2D用户间干扰及用户与基站间的上下行信道干扰,引入非合作博弈论作为研究工具是非常可取的,效果也是非常成功的。

4 结束语

目前基于非合作博弈的D2D资源分配研究已经可以说是较为全面了,无论是在用户间的信息传输速率还是在用户与用户或基站间的干扰方面都有了长足的考虑与深入研究。但若用户处于高速移动中等情况下,这种资源分配的有效率便无法保证,目前还没有一个有效的解决方法能够应用于这种复杂的场景中。而且随着现代通信技术的飞速发展以及5G下一步的全面铺开,入网用户势必会越来越多,用户们对于Qos也一定会有更高的要求。

对于未来的D2D资源分配研究方向,研究者应该关注于如何能在更高速或者更极端的情况下能够尽快完成D2D用户的身份识别、信息传递以及资源的分配,尤其是在5G全面铺开后,面对越来越大比特的信息的用户间的传输,如何能够让用户更快地收到自己想要的信息,又如何能保证整个系统中的所有用户的Qos,甚至在这种高速的发展状态下,如何能时刻保持着频谱资源的高效利用,这都是亟需我们解决的问题,所以基于非合作博弈的D2D资源分配技术在未来将越来越是一个值得研究的方向。

参考文献:

[1] 荣涛. D2D通信技术研究[D].南京邮电大学,2013.

[2] 刘佳. LTE系统下D2D通信的干扰控制与资源分配[D].西安电子科技大学,2014.

[3] Akkarajitsakul K, Phunchongharn P, Hossain E, et al. Mode selection for energy-efficient D2D communications in LTE-advanced networks: A coalitional game approach[C]//2012 IEEE international conference on communication systems (ICCS). IEEE, 2012: 488-492.

[4] Gao C, Li Y, Zhao Y, et al. A two-level game theory approach for joint relay selection and resource allocation in network coding assisted D2D communications[J]. IEEE Transactions on Mobile Computing, 2017, 16(10): 2697-2711.

[5] Chu Z, Nguyen H X, Le T A, et al. Game theory based secure wireless powered D2D communications with cooperative jamming[C]//2017 Wireless Days. IEEE, 2017: 95-98.

[6] 张闯,邵坦,王慧武.D2D网络中基于博弈论的时隙分享合作策略研究[J].电子技术应用,2018,44(06):80-84.

[7] 李民政,苗春伟.D2D通信中基于帕累托占优的非合作博弈功率控制算法[J/OL].系统工程与电子技术:1-8[2019-03-05].http://kns.cnki.net/kcms/detail/11.2422.tn.20190124.1746.030.html.

[8] 薛建彬,李俞虹.一种基于价格竞争的D2D通信资源分配算法[J].测控技术,2018,37(07):14-18.

【通联编辑:代影】