发 帖  
原厂入驻New
[经验]

移动网络感知波动监控新体系分析

2020-12-3 14:48:03  243 移动网络 中国联通
分享
0
  传统的室分主要面向设备,可以通过网管告警、室分巡检、用户投诉三类监控手段对室分小区做静态评估和周期性巡检测试,但网管告警缺失对天馈系统、无源器件的性能监控,与用户感知合度低;室分巡检需要对所有场景进行现场校验,无针对性,其成本高,效能低;用户感知恶化早于网络性能定位,网络可恢复,口碑难恢复。
  中国联通天津市分公司探索研究在降本增效的同时保障网络的健康运行,在不新建系统的基础上,运用大数据分析深度挖掘现有KPI指标与用户感知波动关联性,逐步解决感知波动弱、用户潮汐现象、周期断电的影响,锁定感知强相关性能指标加权形成移动网络感知波动监控新体系,同时避免网管显性故障二次检出,定位网管不可见的网络性能下降现象。
  
  难点
  (1)在现场校验中,由于部分楼宇局部无法测试,只能在楼道里进行测试,无法进入屋内,导致排查不全;
  (2)由于需要无死角测试,工作量大,有的室分覆盖面积较大,比如光分布室分,是人员无法满足工作要求;
  (3)排除网管可见告警强关联的KPI指标;
  (4)优化隐性故障强关联性KPI指标的算法;
  (5)新增隐性故障强关联指标;
  (6)优化体系派发条件。
  过程
  自2018年11月起,提出运用现有KPI组合的方式监控室分小区,根据其波动情况排查存在隐性故障小区的新思想并开始研究。
  运用现有隐性故障案例为基础,与KPI关联指标。
  第一阶段,定位13项KPI指标,排查118个小区,发现29个问题, 定位了关键点,隐性故障检出率24.58%;
  问题:波动小区中大部分存在告警,查告警耗时长,隐性检出率较低,且存在大型场馆等波动较大的小区干扰。
  第二阶段,定位8项KPI指标,排查173个小区,发现45个问题,隐性故障检出率26.01%;
  问题:排除优化问题强关联性指标,维护问题检出率上升,但仍未排除显性故障关联性指标和大型场馆等波动较大室分。
  第三阶段,定位8项KPI指标,排查224个小区,发现92个问题,隐性故障检出率41.07%;
  问题:限定RSRP采样点范围》4000,排除大型场馆、人员波动较大小区干扰,但未排除存在告警的显性故障小区。
  第四阶段,定位4项KPI指标,排查150个小区,发现54个问题,检出率36%;
  问题:排除显性故障,强关联KPI,但隐性故障检出率较低。
  第五阶段,定位4项KPI指标,排查397个小区,发现178个问题,检出率44.84%;
  问题:新增限定条件:得分波动后连续两天未恢复小区派单校验,检出率提升,但未考虑RSRP采样点比例的阀值。
  第六阶段,定位4项KPI指标,排查148个小区,发现71个问题,检出率47.9%;
  问题:观察连续三天指标持续降低的小区,所有场景取“RSRP优秀覆盖比例”作为强关联性指标,检出率提升,但未考虑不同场景与RSRP采样点比例的阀值关系。
  第七阶段,定位4项KPI指标,采用RSRP覆盖比例(住宅场景取“良好比例+优秀比例”,其他场景皆取优秀比例)RSRP采样点、上午9点底噪、回落率共4项指标,综合考虑四项指标判断隐性故障的程度高低,确定指标权重,检出率49%。其指标如下表3.1所示:
  表3.1
  
  3.1隐性故障强关联性指标:RSRP采样点
  LTE系统中,RSRP做为衡量小区信号能量的重要参考因素,是小区切换和交接的标准和依据[1]。RSRP采样点的波动体现覆盖区域下用户无线信号的采集情况。这里以小区为单位,将采样点作为“移动网络感知波动监控新体系”的一项指标,根据采样点的变化观察小区波动状态[2]。
  例如:“某局BBUXXF英郡名邸RRUXXXX”小区23日维护分数波动较大,给分公司派单,26日反馈“业主线路整改时将馈线接头碰松,已修复”,维护分数恢复正常,RSRP采样点与隐性故障具有强关联性,如图3.2所示:
  
  图3.2
  3.2隐性故障强关联性指标:回落率
  回落率指4G回3G的比例,小区的性能恶化伴随回落率增长。例如:“某局BBUXXF水利大厦XXXX”小区,15日维护分数波动(下降),回落率剧增,自有人员现场测试发现6、7层无4G信号,回落率与隐性故障有强关联性,如下图3.3所示:
  
  图3.3
  3.3隐性故障强关联性指标:RSRP覆盖比例
  根据室分小区特点,住宅小区取RSRP(优秀+良好)覆盖比例,即RSRP≥-100的采样点数/RSRP总采样点总数;其他小区取RSRP优秀覆盖比例,即RSRP≥-85的采样点数/RSRP总采样点总数。
  例如:住宅场景小区良好覆盖比例下降导致健康度波动。6日,初测反馈:覆盖9号楼1门,更换耦合器;初测后健康度缓升,但未恢复至波动前水平;10日,实地复测:覆盖7号楼1门和2门,其中7号楼1门一楼和地下室分天线下信号-90至-100dBm,派故障单修复后,健康度恢复,如下图3.4所示:
  
  图3.4
  3.4隐性故障强关联性指标:底噪
  一个无线接收是否能完成正常接收, 不仅与其接收信号的大小和质量相关, 也与其接收机的内部噪声、外部噪声及干扰的大小有关。接收机的内部噪声也称为热噪声[3], 它是由电子运动所产生的,为当温度为293°K (20℃) , 由接收机通带所截获的热噪声功率电平为当温度为293°K (20℃) ,这个热噪声功率电平也称为接收机的底噪 [4]。
  四项指标中,底噪与与用户感知强相关,加速问题定位,若出现底噪抬升,可直接处理。
  结论
  此项目技术已经在天津联通全网进行推广应用,替代原有周期巡检,提升员工工作效能。2018年11月至19年5月,共完成91轮次检测,算法迭代更新7轮次,累计校验2093小区次,累积检出问题小区872个,检出覆盖率6.5%;日波动小区比例由1.5%降低至0.33%,问题检出率由24.58%提升至49%。
  移动网络感知波动监控新体系可检出网络质量波动情况,在用户感知恶化前及时恢复网络性能,提升用户感知,做到网络可恢复 ,口碑不下滑。作为传统监控手段的补充,贴近用户感知,全方位监控网络性能波动,为市场发展保驾护航。
  (1)此项目主要创新成果如下:
  a)创新锁定与用户感知强关联KPI组,形成小区健康度体系;
  b)创新设计“双波动筛选”策略,排除正常周期性波动情况;
  c)引入分场景评价方案,对不同场景设定不同评价阈值,保障体系监控范围覆盖有效用户;
  (2)经济效益:
  室分隐性故障自动定位,单场景可节约周期测试人工1748人日,约84万元/年。
  按重点口碑场景季度测试计算,一个场景一年需测试4次,每次6小时计算,一个场景全年测试时长24小时,按每次测试2人计算,需要24*2/8=6人日;目前口碑场景874个,年测试人日5244人日。
  体系运行后,单场景首次进行遍历测试,出现健康波动时针对波动范围局部测试,无需每次均进行场景遍历测试。折算后单场景每年遍历2次,每次8小时,每次测试2人计算,年测试量约2*8*2/8*874=3496人日,预计节省人工1748人日;按12万元/人计算,年度节省人工成本84万元/年。
  (3)社会效益:
  健康度体系可检出网络质量波动情况,在用户感知恶化前及时恢复网络性能,提升用户感知,做到网络可恢复 ,口碑不下滑。作为传统监控手段的补充,贴近用户感知,全方位监控网络性能波动,为联通移动网品牌宣传,市场发展保驾护航。

评论

高级模式
您需要登录后才可以回帖 登录 | 注册

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容图片侵权或者其他问题,请联系本站作侵删。 侵权投诉
发经验
快速回复 返回顶部 返回列表