⚡ 电网 📡 信息通信部 🔍 智能问数

通信运维问数

某电网信息通信部基于UINO数据智能引擎的智能问数案例

💡 案例价值

信息通信部的运维专责刘工每周要向部门领导汇报一次光缆故障运维情况。以前,他需要从通信监控系统导出故障工单,再手动计算本周故障次数和平均恢复时长,拼凑一份简单的周报——往往花上半小时。

现在,刘工在汇报前问了一句:"本周光缆故障的平均恢复时长是多少?" 系统在30秒内返回:本周共发生光缆故障12起,平均恢复时长4.2小时,环比上周缩短0.8小时。与此同时,系统还自动标注了恢复时长超过8小时的重点故障。拿着这个结果,刘工10分钟就整理好了周报。

通信运维SLA(服务水平协议)的可视化,从过去的"人工统计月底看"升级为"随时可问实时查"。周报数据准备时间从30分钟压缩到10分钟故障恢复时长的跟踪频率从月度提升为周级甚至日级,管理颗粒度大幅细化。

30秒
周均恢复时长查询
-20分钟
周报数据准备节省
周→日
SLA跟踪频率提升

🔧 技术路径

第一步:双系统数据对接。 UINO同时对接通信监控系统(光缆状态、告警数据)和工单系统(故障处理记录)。通信监控系统提供故障发生时间和告警等级,工单系统提供故障修复时间和处理过程信息。两个系统的数据通过"工单编号"进行关联。

第二步:本体建模——光缆与故障时长语义。 "光缆故障"在本体中被定义为光缆段上发生的非计划中断事件,区别于"光缆割接"(计划性施工)。"恢复时长"定义为从故障发生时间到故障修复确认时间的时间差(小时)。本体层还建立了"光缆-纤芯-业务"三层拓扑关系,可以按业务重要度对故障进行加权。

第三步:均值语义聚合计算。 当用户问"平均恢复时长"时,本体引擎识别这是一个AVG聚合计算,并结合时间范围(本周)和故障类型(光缆故障)两个过滤条件生成查询计划。结果返回均值、最小值、最大值和中位数四个指标,全面反映分布特征。

第四步:专业维度权限过滤。 信息通信部下设光缆、传输、网络多个专业,不同专业的运维人员只能看到所负责专业的故障数据。权限语义注入后,查询结果自动按专业维度过滤,保证数据隔离。


⚠️ 过程难点

难点一:故障起止时间记录方式不统一。 通信监控系统和工单系统对故障时间的记录逻辑不同:监控系统以告警触发时间作为"故障发生时间",工单系统以运维人员确认工单的时间作为"故障开始时间"。两者有时差可达5-30分钟。此外,部分光缆故障在监控系统中存在"重复告警"(同一故障触发多次告警),导致故障次数被重复统计。UINO通过"告警去重+时间口径统一"策略解决:以监控系统的首次有效告警时间为准,工单系统时间作为校核参考。

难点二:光缆与业务关联关系复杂。 一条光缆上承载了多条业务纤芯,不同纤芯承载不同优先级的业务。当某条光缆发生故障,影响的不只是单条业务,而是该光缆上承载的所有业务。业务影响范围的信息需要通过"光缆-纤芯-业务"拓扑链反向查找。UINO在本体层预先构建了三层拓扑图,查询时系统自动关联展示受影响的业务清单,为故障抢修优先级决策提供数据支持。


💬 典型问数示例
用户原声(自然语言提问)
"本周光缆故障的平均恢复时长是多少?"
"本月恢复时长超过8小时的光缆故障有哪些?"
"本周哪条光缆故障次数最多?"
"承载XX业务的光缆当前有没有告警?"
返回电网案例