kaiyun官方注册
您所在的位置: 首页> 通信与网络> 设计应用> 基于有限记忆、概率学习的双时间尺度切片资源分配方法
基于有限记忆、概率学习的双时间尺度切片资源分配方法
电子技术应用
邵锋1,孙君1,2
1.南京邮电大学 通信与信息工程学院;2.江苏省无线通信重点实验室
摘要:网络切片是使网络能够满足不同垂直领域的不同服务需求的关键要素,为解决网络中切片类型动态变化的问题,提出了一种联邦-多智能体强化学习双时间尺度资源分配(F-MALML)算法。大时间尺度下,通过有限记忆学习算法为每个基站分配资源;小时间尺度内各基站使用F-MALML算法进一步为切片中的用户动态分配资源。引入了一种概率学习机制,根据前一时隙的分配结果和网络实际状态,动态调整每个时间尺度的分配策略。仿真结果表明,所提算法相比于其他两种基准算法在新增切片的切片满意度及系统频谱效率方面都有较大提升,且表现出更好的稳定性。
中图分类号:TN929.5 文献标志码:A DOI: 10.16157/j.issn.0258-7998.246123
中文引用格式:邵锋,孙君. 基于有限记忆、概率学习的双时间尺度切片资源分配方法[J]. 电子技术应用,2025,51(3):17-24.
英文引用格式:Shao Feng,Sun Jun. Dual time scale network slice resource allocation method based on limited memory and probability learning[J]. Application of Electronic Technique,2025,51(3):17-24.
Dual time scale network slice resource allocation method based on limited memory and probability learning
Shao Feng1,Sun Jun1,2
1.College of Telecommunications & Information Engineering, Nanjing University of Posts and Telecommunications; 2.Jiangsu Key Laboratory of Wireless Communications
Abstract:Network slicing is crucial for enabling networks to meet the diverse service demands of various verticals. To address the issue of dynamic changes in slice types, a Federated Multi-Agent Reinforcement Learning (F-MALML) algorithm with dualtime scale resource allocation is proposed. At the large time scale, a finite memory learning algorithm allocates resources to each base station. At the small time scale, each base station uses F-MALML to dynamically allocate resources to users. A probabilistic learning mechanism is introduced to adjust the allocation strategy based on previous results and the current network state. Simulation results show that the proposed algorithm achieves significant improvements in slice satisfaction for newly added slices and system spectral efficiency compared to the two benchmark algorithms, while demonstrating better stability.
Key words :network slicing;resource allocation;dual time scale;deep reinforcement learning;slicing satisfaction

引言

5G-A和6G移动网络将带来增强的网络能力和性能,为不同的行业和个人提供各种用例[1]。不同的应用程序在带宽、时延、能源效率、移动性等方面有不同甚至相互矛盾的要求,而网络切片技术可以有效地解决这一需求。网络切片通常包括接入网切片和核心网切片,对无线接入网(Radio Access Network,RAN)来说,向用户分配无线电资源是一项极其复杂的操作,通常面临着资源稀缺和异构服务质量(QoS)的问题[2]。因此,如何将通信资源以最佳方式分配到切片和用户成为关键问题。Zangooei 等人比较综合地调研了在RAN切片中处理资源分配问题最先进的强化学习(Reinforcement Learning,RL)方法,并且给出了RL方法在网络切片中可能存在的问题以及解决方案[3]。Hua等人针对最大化网络切片中的系统频谱效率(Spectral Efficiency,SE)、系统效用等参数做出了研究[4-7]。Filali等人针对服务水平协议(Service Level Agreement,SLA)满意度以及资源块(Resource Block,RB)分配效率、寻求最优的RB分配策略问题做出了研究[8-11]。新兴的6G网络预计将为异构需求提供更多的服务,这是由许多垂直行业创建的[12],因此网络切片的类型更加多样,粒度需要更加精细,且可能发生动态变化。基于上述挑战,本文针对多基站多切片、切片类型动态变化场景下的资源分配问题做出了研究,提出了一种更加智能化的算法,并通过仿真验证了算法的性能。


本文详细内容请下载:

https://www.chinaaet.com/resource/share/2000006353


作者信息:

邵锋1,孙君1,2

(1.南京邮电大学 通信与信息工程学院,江苏 南京 210003;

2.江苏省无线通信重点实验室,江苏 南京 210003)


Magazine.Subscription.jpg

此内容为AET网站原创,未经授权禁止转载。
Baidu
map