⚡ 发电公司 💻 信息化中心 📡 智能问数案例

系统可用率问数

某发电公司信息化中心基于UINO数据智能引擎的智能问数案例


一、案例价值

该发电企业信息化中心承担着全场IT系统的运维管理职责。每月向管理层汇报各系统可用率是信息主任的核心工作之一,过去需要从IT监控系统导出数据,再手工汇总到Excel中,人工核对每个系统的故障时间、可用率计算结果,整个过程需要大半天。

引入UINO数据智能引擎后,信息主任只需问一句"各系统本周可用率达标天数",系统即在30秒内返回各核心系统(DCS接口、SCADA系统、营销系统等)的本周可用率数据,按照"达标/未达标"自动分类标注,并标注各系统的SLA约定值与实际达成值。这份数据过去需要大半天准备,现在实时可问。

同时,信息化中心主动将问数能力推广至全厂各部门——各业务部门可以直接查询与其业务相关的系统健康状态,IT运维团队收到的问题报告因此减少了约45%,团队能将更多精力投入系统建设而非被动响应。

30秒
可用率查询响应
8h→0
月度汇报准备时间归零
45%
问题报告减少
100%
SLA自动判定覆盖率

二、技术路径

第一步:多源数据对接。信息化中心的数据来源于两类系统:一是IT监控系统,实时采集各IT系统的运行状态、心跳、故障事件等数据;二是工单系统,记录IT故障工单的创建时间、解决时间、工单分类等数据。UINO通过API接口同时对接两套系统,实时同步运行状态与工单数据。

第二步:本体语义建模。UINO对"系统""可用率""工单""SLA""达标"五个核心概念进行本体建模。"可用率"的语义定义在本体层中最为关键:系统支持两种主流可用率计算口径——按时间口径(系统总运行时长/总观测时长)和按次数口径(可用次数/总触发次数)。两种口径的计算结果可能差异显著,本体层将此差异显式化,用户在问法中指定"按时间算可用率"或"按次数算可用率",系统调用对应口径的计算规则。"达标"语义对应"可用率≥SLA阈值"的判定规则,由SLA本体关联各系统的SLA约定值自动计算。

第三步:系统与业务系统关联映射。多数IT系统服务于特定业务系统(如DCS接口服务于生产运行部、SCADA系统服务于设备管理部),本体层建立了IT系统到业务系统的一对多映射关系。查询"各系统本周可用率"时,系统自动关联业务负责人信息,并在结果中标注该系统关联的业务部门,实现IT数据与业务数据的对齐。

IT监控系统对接 工单系统对接 本体语义建模 可用率双口径计算 SLA达标语义判定 系统-业务关联映射


三、过程难点与解决方案
难点1:可用率计算口径各系统不统一
这是IT运维领域最经典的口径冲突。以"可用率"为例,DCS接口系统按时间口径计算(全年停机时长不超过8小时),SCADA系统按次数口径计算(每月可用次数不低于28天),营销系统则按交易窗口口径计算(交易时段不可中断)。同一"可用率"概念在不同系统语境下含义截然不同,数据直接对比毫无意义。
解决方案:口径显性化与语义路由
UINO在本体层将每套系统的可用率计算口径显式建模,在元数据中为每个系统标注其可用率的计算口径类型。当用户问"各系统本周可用率"时,系统默认返回各系统按其自身口径计算的可用率,同时在结果中以小字标注"计算口径:时间/次数/交易窗口",确保用户理解数字背后的定义。若需跨系统统一口径对比,用户可显式指定"全部按时间口径折算",系统自动进行口径转换后呈现对比结果。
难点2:系统与业务系统关联关系复杂
该发电企业的IT系统与业务系统并非简单的一一对应关系,而是网状关联——一个SCADA系统同时服务于设备管理部和生产运行部,DCS接口系统服务于全部生产类业务系统。传统的"按系统查"模式无法回答"哪些系统影响了生产运行部的业务"这类从业务视角出发的问题。
解决方案:业务-系统双向关联图谱
UINO构建了业务系统与IT系统双向关联图谱,以"业务部门"为节点关联其依赖的IT系统,以"IT系统"为节点关联其服务的业务部门。查询时支持双向路由:既可以从IT系统视角查询"各系统可用率",也可以从业务部门视角查询"影响生产运行部的系统有哪些、状态如何"。问法"哪些系统影响了生产运行部的业务"被语义引擎解析为:从生产运行部节点出发,沿关联边遍历所有直接关联IT系统,收集其当前可用率状态后返回。
难点3:工单系统与监控系统数据需要关联分析
单纯看可用率数字无法判断系统的健康趋势。例如某系统可用率达标,但工单系统显示本周产生了3次故障工单,每次故障虽然快速恢复但累计影响了2小时运行时间。仅仅返回"达标/未达标"无法支撑精细化运维决策。
解决方案:可用率与工单联合语义分析
UINO在语义层引入"可用率+工单"联合分析模式。当系统检测到某IT系统本周可用率虽达标但工单数量或工单累计时长超过阈值时,自动在结果中标注为"关注"状态,并附加工单摘要(故障次数、累计时长、影响时段分布)。信息主任不仅能一眼看到"谁达标了",还能快速定位"谁虽然达标但有隐患"。这一联合分析能力将IT汇报从事后的数字汇总升级为主动的健康度评估。
🔍 典型问数示例
各系统本周可用率达标天数
返回各核心系统本周可用率,含SLA达标状态标注与实际达成值对比。
影响设备管理部的IT系统有哪些、状态如何
从业务部门视角返回关联IT系统列表,含实时运行状态与本周可用率。
本周故障工单最多的系统
按工单数量排序返回TOP系统,含工单详情摘要与可用率关联分析。
返回发电公司案例列表