第122章 创新方案第一次汇报(2/2)
周峰调出一个曲线图,“这是三号基站过去一小时的掉话率变化,可以看到在上午九点有一个明显峰值。”
李一男身体前倾,盯着屏幕:“数据从哪里来的?”
“基站内部的性能计数器和测量报告,”周峰说,“以前这些数据只用于基站内部算法,不上报。我们改了软件配置,让它们上报到中心服务器。”
“改了哪些配置?”
“主要在基站控制器的omc-r模块上,”周峰调出代码片段,“增加了三十七个测量项的上报功能,优化了上报频率和压缩算法,保证不影响基站正常业务。”
李一男点点头,示意继续。 “接下来是分析层演示,”张涛接过话头,他有点紧张,推了三次眼镜,“我们设计了一个简化的诊断算法,基于规则引擎和统计分析。”
他在键盘上敲入一行命令,屏幕切换,显示出一个诊断报告: 基站gz-th-003诊断结果
· 问题类型:覆盖漏洞导致掉话
· 根因分析:天线倾角过大(当前15度,建议12度)
· 影响范围:低层用户(3-8层)
· 预估改善:掉话率下降12-18%
“这个诊断怎么来的?”李一男问。
“分三步,”张涛调出算法流程图,“第一步,数据预处理,清洗异常值,归一化;第二步,特征提取,从原始数据中提取四十八个关键特征;第三步,规则匹配,用一百二十七条预设规则进行诊断。” “规则从哪里来?”
“部分来自gsm规范,部分来自我们调研中总结的经验,部分来自历史优化案例。”张涛说,“但这只是初级版本,最终我们会引入机器学习,让系统自己从数据中学习规则。”
李一男没评价,只是说:“继续。” “最后是执行层,”刘博走到电脑前——他操作键盘的方式很特别,只用两个手指,但速度极快,“我们已经实现了对测试基站的远程配置管理。”
屏幕上出现一个命令行界面,刘博输入一串指令:
set bts gz-th-003 tilt_angle = 12
回车。屏幕显示:
mand sent. waiting for acknowledgement...
三秒后:
bts gz-th-003 acknowledged.
new tilt angle: 12 degrees.
“这就改完了?”李一男问。
“改完了,”刘博调出基站实时监控页面,“可以看到天线倾角参数已经更新。但实际物理调整需要维护人员去现场——我们目前只改了软件参数,天线马达的远程控制还在开发中。”
“安全机制呢?”
“三重保障,”刘博调出另一个界面,
“第一,所有指令在模拟环境预执行,验证安全;
第二,指令下发需要二级审批——现在是测试模式,只有一级;
第三,系统保留最近十次参数修改记录,支持一键回滚。”
演示结束,办公室里安静下来。投影仪的风扇嗡嗡作响,墙上的时钟指向九点二十。
李一男掐灭烟,又点了一支——这是今天上午的第四支。他靠在椅背上,看着屏幕上的界面,又看看站在面前的五个人,最后目光落在林辰身上。
“演示我看了,”他说,“技术上是可行的。但我要问几个问题。”
李一男站起身,走到白板前,拿起笔。他写了五个数字,每个数字后面画了个问号:
1. 规模问题? 十个基站能跑,一万个基站呢?
2. 厂商问题? 华为设备可以,爱立信、诺基亚呢?
3. 算法问题? 规则引擎太简单,机器学习太遥远,中间的路怎么走?
4. 风险问题? 自动执行出错怎么办?谁负责?
5. 价值问题? 投入这么大,产出值得吗?
写完,他转身看着林辰:“一个一个答。”
林辰深吸一口气。这些问题他预想过,但没想到李一男问得这么直接、这么尖锐。
“第一个问题,规模。”他走到白板前,在“1”后面画箭头,“我们的架构设计就是为大规模部署准备的。数据采集用分布式代理,每台基站一个轻量级代理程序,只负责采集和压缩,不处理。数据传回中心后,用服务器集群并行处理。我们估算过,三十台服务器集群可以处理全省一万两千个基站的数据。”
“服务器哪里来?”
“李总您已经批了二十台,”林辰说,“广东办事处协调十台,总共三十台。如果不够,我们可以用夜间闲置的计算资源——基站数据在夜里三点到五点处理压力最小,那时候服务器负载也最低。” 李一男点头,没说话。
“第二个问题,厂商。”林辰在“2”后面写方案,“分两步走。第一步,华为设备全面支持,这是我们能控制的。第二步,通过移动集团协调爱立信和诺基亚,要求他们开放北向接口。如果厂商不配合,我们开发适配层——截获网管系统的操作,转译成厂商接口能识别的指令。效率低一点,但能用。”
“移动会配合吗?”
“会,”林辰很肯定,“因为这套系统最终受益最大的是移动。我们已经和广东移动的张志强工程师达成共识,他会推动这件事。” 李一男在笔记本上记了一笔。
“第三个问题,算法。”林辰在“3”后面画了三个阶段,“短期用规则引擎,解决80%的常见问题;中期引入统计模型和专家系统,解决15%的复杂问题;长期探索机器学习,解决剩下5%的疑难杂症。我们不追求一步到位,而是迭代演进。”
“时间表?” “规则引擎一个月内上线,统计模型三个月,机器学习半年到一年。”林辰说,“但即使只有规则引擎,也能比现有的人工优化提升三倍效率。” 李一男继续记笔记。
“第四个问题,风险。”林辰在“4”后面写了几行字,“第一,所有指令必须模拟验证;第二,所有执行必须人工审核——初期是全审核,后期是抽检;第三,建立安全边界,关键参数不允许自动修改;第四,购买保险,真出事了有兜底。”
“保险?”
“我们测算过,全省推广后,每年能为移动节省运维成本三千万以上。拿出10%买保险,还有两千七百万净收益。”林辰给出具体数字,“而且前期只在小范围试点,风险可控。”
“第五个问题,价值。”林辰在“5”后面画了个表格,列出入和产出:
投入:平台开发(500万)+硬件采购(300万)+ 人力成本(200万)= 1000万
产出:运维成本节约(3000万\/年)+投诉减少(间接收益500万\/年)+ 网络质量提升(品牌价值无法估量)
投资回收期:4个月
五年净收益:1.2亿
数字清晰,逻辑严密。林辰讲完,办公室里再次安静下来。