【企业内训】LLM大模型理论及实践-某央企数据中心授课课件
TsingtaoAI为某央企数据中心开展的关于LLM大模型理论及实践的专题培训。本次培训深入探讨大模型技术在企业数据中心的应用,包括数据准备、模型训练及微调、模型部署和实际应用场景。详细介绍如何通过预训练与微调方法有效提升模型性能,并探讨传统NLP与LLM的结合方式,以解决实时动态知识库的挑战。此外,本课程还分享了在资源受限条件下如何优化模型配置,确保技术的最佳实施。
讲师介绍
|
教育经历 |
北京邮电大学 硕士研究生 北京邮电大学 本 科 |
简介 |
北京邮电大学本硕连读,拥有扎实的人工智能理论知识和丰富的项目实践经验。曾在字节跳动和中国银行担任算法工程师,现在在AI科技公司负责大语言模型(LLM)落地项目。 已构建自研训练框架,可适配ChatGLM1&2、Baichuan1&2、Qwen14B等主流开源模型的全参/lora/Qlora微调,支持各种训练指标可视化,方便对比实验; 已构建训练数据生成流程,可基于不同业务需求进行训练数据处理; 已构建推理服务,已基于自训模型及推理服务成功在APP上线与用户交互。 |
精通课程 |
Python编程与大数据应用 ChatGLM与其他LLM的部署、训练与微调 LangChain框架深度解析与实践 多模态处理与多模态大语言模型实践 知识图谱技术在大数据中的应用 大模型(LLM)数据预处理与特征工程 |
项目经验<部分> |
1. 使用Python&Go语言进行后端开发,涉及数据库、kafka、高并发处理等; 2. 语音测评(gop)服务,基于kaldi框架训练语音测评模型,同时实现服务端推理及手机侧本地化推理,落地场景为用户在app进行中英文口语练习,该服务可实现自动化打分评价; 3. 语音识别(asr)服务,基于conformer+transformer框架训练的端到端模型,实现服务端离线识别和流式识别,落地场景为客服系统及语音审核场景; |
大客户培训经验<部分> |
中信银行:LLM Driving课程,讲解LLM的基础原理、部署策略以及微调技巧,培训学生在实际项目中应用LLM。 一汽集团AIGC技能培训:为技术团队提供LLM模型与多模态AIGC联合应用,使用LLM能力助力多模态生成。 |
|