大规模的PTN网络建设之后,如何高效维护成为摆在各分公司眼前的主要问题之一。中国移动海南分公司在PTN网络的维护领域深入挖掘,通过对业务配置及调整、告警抑制及各类故障情况下业务快速恢复等不同场景的深入分析,和PTN厂商一起运维创新,独辟蹊径,在LTE时代到来之前率先走出了一条PTN高效简单运维的道路。
一、PTN运维难点分析
PTN作为IP化的传输设备,具有IP网络固有的运维复杂性,随着PTN网络规模的激增及承载业务的多样化,网络运维人员的维护工作量大幅度增加,“如何简化运维?”成为PTN维护人员的关注重点。从中国移动海南公司(以下简称海南移动)PTN运维经验来看,主要存在如下图所示的三大难点:
第一、告警多,故障定位定界困难;
第二、基站业务调整场景多,调整过程要求快速可靠;
第三、业务种类多,参数多,需要简化管理;
分组传送网)的简单高效运维之道" src="//www.ninimall.com/files/images/2013/06/17/3613483295163.jpeg" style="margin: 0px; padding: 0px; border: 0px; width: 558px; height: 319px; " />
二、运维创新,实现运维高效简单
为了有效的应对PTN网络带来的运维复杂度,海南移动通过和华为等主要设备厂商定期进行PTN运维专项需求讨论等措施,聚焦PTN的运维难点,确保更好的提升运维效率,主要聚焦在以下几个方面:
1、业务可视化管理
电信级的IP网络运维需要可视化的维护方式,将“软”管道和维护指标图形化呈现出来,有预见性地维护承载网络:
1)业务及其关联的主备Tunnel路径通过层次化路径拓扑关联呈现;
2)以业务为中心的告警监控。当网络出现故障,影响到业务开通的时候,相关告警会直接反应到端到端业务管理界面;
3)以业务为中心的性能监控。通过基于不同场景的模板化指标采集,满足不同场景的管理需求;
4)全网时钟可视化展现,清晰时钟信令方向,清晰时钟跟踪关系;
2、智能电路割接
随着PTN业务数量的增长,频繁的网络业务调整不可避免,需要通过系统化的管理流程和专业的割接工具实现高效、准确、安全的业务调整,并参考如下的操作步骤:
1)对单条电路和批量电路提前制定割接方案,割接前进行割接演习,校验资源是否冲突;
2)执行人工方式和自动方式的割接计划,将割接设置和管理的时间从晚上调整到白天,释放夜晚加班人力;
3)割接后可保留原有工作电路资源,以便返回割接后的业务;
3、工程告警抑制
为抑制PTN网络日常单板拔插、网元调测等工程施工产生的大量工程告警,与正常网络告警有效区分,需要在EMS实现对工程告警的有效过滤:
1)网元、单板、端口等多粒度工程告警标识批量化配置;
2)自动过滤工程告警不上报上层综合网管;
3)依据告警工程态标识过滤,分开浏览常态告警和工程告警;
4)工程告警自动结束机制:自由定义工程告警状态标识的开始、结束时间;
4、离线网元快速隔离
PTN扩容部署阶段,接入侧设备机房环境复杂,经常出现机房掉电导致网元离线的情况,此时业务得不到及时的修复,维护人员需要通过EMS隔离离线网元后再进行业务发放:
1)对故障网元快速隔离,不影响网络业务正常发放;
2)离线网元上线后,EMS提供离线网元恢复功能,重新入环/链,且离线网元的业务自动恢复无需在离线网元上线后手工配置业务。
5、端口批量业务迁移
在PTN网络的日常运维中,某个RNC突然宕机的紧急情况下,如何快速把业务迁移到备份的RNC上,快速解决网络隐患,是运维人员最关心的场景。EMS需要提供端口级的批量业务迁移解决方案:
整端口的业务批量快速迁移功能;
1)业务迁移过程中如果出现故障失败,提供失败回滚机制,
2)确保业务配置无损;
3)提供业务、Tunnel标签等资源冲突自动检测机制,确保迁移过程顺利安全。
通过解决一个个运维难点,海南移动PTN运维能力得到较大水平的提高,迈向更高的集约化、精细化管理,使得海南移动的PTN运维效益和网络的盈利能力得到不断的提高,并提升了用户的感知。
三、LTE时代PTN运维思考
在LTE承载中,由于存在基站到基站的切换需求,需要支持基站到基站的逻辑连接,具有MESH互连的承载需求,PTN支持静态三层,可以满足LTE业务承载的诉求。在当前的PTN网络中,核心层PTN引入静态三层,整体的业务模型是L2+L3,即基站侧接入L2,在核心汇聚层终结L2后上L3,业务在核心边缘设备落地接入SGW和MME设备。
静态三层就是把原来需要协议完成的业务路由计算等工作,移到网管上来完成。下图是GSM/TD-SCDMA/LTE统一承载组网典型模型。
另外,LTE时代,基站的工作频率提高了,意味着每个基站覆盖的范围减小了,同样的覆盖需要更多的基站,特别是小基站,相应的需要更多的PTN设备。综上,LTE时代PTN的运维重点关注下面几点:
第一、增加一个网络层次,E2E业务发放复杂性成倍增加,需要网管简化业务发放过程,尽量做到自动化;
第二、增加一个网络层次后,出现故障,E2E故障定位更加复杂,需要具备丰富的故障定位、定界手段;
第三、当前阶段如果要达到GSM/TD-SCDMA的广覆盖不太现实,即使解决热点覆盖,需要部署更多的小基站,就要求有更多的小规格PTN盒式设备来承担,需要厂家网管解决小规格PTN盒式设备的运维简化,比如简化开局、简化业务配置及高效升级等;
第四、移动互联网流量会大幅增加,为了保证高优先级业务的SLA,对流量的管控会愈加迫切;
四、结束语
PTN网络目前还持续处在规模建设期,同时面临在LTE时代的运维挑战,所以要求运维人员在深入掌握IP知识的基础上,对比传统的SDH网络运维流程,采用类比的思维,逐步摸索出具有PTN特点的运维方式和经验。
另外还需充分利用和设备厂家的经验共享,共同发现、分析和解决运维过程中的问题和需求,逐步建立面向终端客户感知的指标体系,落实网络运维的可视、可控、可分析、可回溯,体现出PTN技术可维可控的优势,推动PTN网络的进一步发展。