企业实训|AI大模型在运维领域的应用——某金融科技集团
11月27日和28日深圳,TsingtaoAI研发团队为某金融科技集团的研发团队交付AI大模型在运维领域的应用主题实训。本实训专为运维专业人士设计,旨在深入探讨大模型技术在现代IT运维管理中的应用与实践。本实训从大模型技术的基础知识出发,逐步引导学员了解其在自动化运维、智能监控、日志分析、性能优化和故障排错等方面的具体应用。

实训内容丰富,结合理论与实践案例,详细解析大模型技术如何解决运维中的高并发、海量数据处理和复杂故障诊断等挑战。通过案例分析,学员将学习到如何在实际工作中部署和利用大模型,提升运维效率,保障系统稳定性,并为企业节省成本。

实训不仅涵盖了技术层面的深入讲解,还包括团队技能培养、项目管理策略和未来趋势的前瞻性讨论。通过互动环节,学员将有机会与同行交流心得,共同探讨大模型在各自领域的应用潜力。本课程适合希望在运维领域保持竞争力的资深工程师和团队领导者,帮助他们在大模型时代中把握先机,引领变革。


-
理解大模型技术及其在运维中的应用价值
-
掌握大模型在不同运维场景下的具体实施方法
-
学习如何通过大模型提升运维效率和系统稳定性

-
企业对象
互联网企业基础设施、IT部门、运维团队,传统企业的IT部门、运维部门
-
学员对象
业务运维工程师、资源管理工程师、IDC运维工程师、开发工程师、研发架构师、基础架构师、技术管理者

第一天上午:
大模型及智能运维AIOps技术通用认知
-
AIOps的演进过程:从规则到统计算法、到大模型赋能智能化运维
-
大模型的在运维领域的阶段应用及案例
-
RAG相关技术和知识库基础,及快速演示,及初步优化
-
智能体技术入门、Agent/A2A/MCP协议初步讲解
-
运维专家的隐性知识转化为可执行的推理流程
第一天下午:
构建运维知识库
基于大模型的知识库工作原理及多模态信息转化为知识信息的方法
企业的运维知识库构建
-
企业运维知识分类、及采集整理成为知识库
-
CMDB元数据及配置项信息整理成为知识库的方法及案例
-
运维文档/架构图等文档转为知识库
-
预案SOP文档知识如何有效转为知识库
-
运维元数据转化为知识库
-
基于运维故障报告的根因推荐
-
工程师运维经验如何转化为运维知识并入库的方法
-
案例:基于Deepseek构建企业运维知识库及智能问答
动态知识库:大模型使用动态变化的运维数据知识
-
把变更记录转化为知识库
-
组织整理监控指标成为知识库
-
运维日志转为知识,并在故障定位中应用
-
故障处理讨论记录、操作日志导入大模型知识库
-
知识迭代:知识库的应用与反馈、产生新知识入库
构建运维知识库的难点与挑战问题
第二天上午:
通过DeepSeek 进行故障智能诊断与根因定位
-
SRE进行故障定位的方法和实践
-
大模型 如何协助 RCA 推理,多轮推理与工具调用的协同
-
基于大模型构建关联多源数据的知识图谱
-
在故障定位时如何利用运维知识库,及基于置信度的异常判断
-
案例:诊断某系统中断,定位到数据库配置错误。
-
实践:对模拟事件进行 RCA,生成分析报告。
运维的应用场景案例-复杂问题排查:
-
Java故障诊断案例,MCP结合日志分析进行故障诊断
-
操作系统OS:系统内核故障深度根因分析
第二天下午:
大模型在运维中的应用场景和案例
-
大模型在日常问题分析应用
-
运维管理:运维日常工作报告、运维故障报告整理
-
大模型 for 运维专业岗位赋能,DBA、系统专家、网络专家
-
大模型在运维开发中的应用
从0到1设计和实现RAG智能体应用
-
需求分析与边界定义
-
技术栈选型
-
数据采集(覆盖运维核心场景)
-
数据预处理
-
知识库部署
运维如何用好大模型提示词
-
运维领域的Prompt工程及实操
-
Prompt工程及调优技巧
-
IT 运维任务的提示示例:日志分析、故障排查,常见错误及避免方法
-
实践 设计并优化提示,用于分析样本日志文件,验证输出准确性。









