人工智能训练师(五级/初级工)课程方案

 

 

课程概述

本课程是根据人社部关于人工智能训练师(五级/初级工)国家职业技能标准,研发的精品录制课程,涵盖人工智能训练师(五级/初级工)的所有职业技术标准要求,包括基本要求、技能要求和相关知识。通过本课程的学习,学员可以全面掌握人工智能训练师(五级/初级工)的几乎所有相关知识和技能,更好的用于工作或备考。

 

面向职业

人工智能训练师 五级/初级工

 

课程形式

精品录制课,一共60课时,每课时30-40分钟左右,每课时配有3个练习题及答案,课程视频含有字幕。

 

职业技术标准要求

一、基本要求

1.1 职业道德

1.1.1 职业道德基本知识

1.1.2 职业守则

(1) 诚实公正,严谨求是。

(2) 遵章守法,恪尽职守。

(3) 勤勉好学,追求卓越。

1.2 基础知识

1.2.1 通用知识

(1)计算机操作知识。

(2)常用办公软件使用知识。

1.2.2 相关法律、法规知识

(1)《中华人民共和国劳动法》相关知识。

(2)《中华人民共和国劳动合同法》相关知识。

(3)《中华人民共和国网络安全法》相关知识。

(4)《中华人民共和国知识产权法》相关知识

二、技能要求和相关知识

课程大纲

课程分为四个部分,第一部分是基本要求,8课时;第二部分是数据采集和处理,13课时;第三部分是数据标注,31课时;第四部分是智能系统运维,8课时。

一、基本要求

第1课时:职业道德基本知识

职业道德概述:定义及重要性;职业道德的基本内容。

伦理和责任:诚实公正的内涵;严谨求是的精神。

第2课时:职业守则

诚实公正,严谨求是:案例分析;实践中的应用。

遵章守法,恪尽职守:职场法律法规;职业责任与义务。

勤勉好学,追求卓越:职业发展和学习路径;自我提升的方法。

第3课时:计算机操作知识

计算机基础知识:计算机硬件和软件概述;操作系统基本操作。

文件管理:文件和文件夹的创建、修改与删除;文件备份与恢复。

第4课时:常用办公软件使用知识1

文档处理软件(如Word):文档的创建与编辑;格式设置和排版技巧。

电子表格软件(如Excel):基本操作和常用函数;数据分析与图表制作。

第5课时:常用办公软件使用知识2

演示文稿软件(如PowerPoint):演示文稿的设计与制作;动画与过渡效果的应用;

办公协作工具:邮件和日程管理;在线协作平台的使用。

第6课时:《中华人民共和国劳动法》和《劳动合同法》相关知识

劳动法概述:劳动法的定义和作用;劳动关系的基本原则。

劳动者的权利和义务:工作时间与休息休假;工资和福利待遇。

劳动合同的基本概念:劳动合同的类型和内容;劳动合同的订立、变更与解除。

用人单位和劳动者的责任:合同履行中的权利和义务;争议解决和法律救济。

第7课时:《中华人民共和国网络安全法》相关知识

网络安全法概述:网络安全法的立法背景和意义;网络安全的基本要求。

个人信息保护:个人信息收集和使用规范;数据安全和隐私保护。

第8课时:《中华人民共和国知识产权法》相关知识

知识产权法概述:知识产权的定义和种类;知识产权保护的重要性。

版权和专利:版权的基本内容和保护;专利申请和保护流程。

商标和商业秘密:商标注册和保护;商业秘密的保护措施。

二、采集和处理

第1课时:业务数据采集基础

数据采集设备和工具介绍

业务背景知识和数据采集方法

第2课时:业务数据采集实操

设备和工具的使用方法

数据库内业务数据采集实例

第3课时:数据整理与归类

数据整理规范和方法

数据处理要求解析

第4课时:数据汇总技巧

数据汇总的规范和方法

实例讲解业务数据汇总过程

第5课时:数据清洗基础

数据清洗工具介绍

文本、视觉、语言数据清洗概述

第6课时:数据清洗实操

实操数据清洗:文本数据

实操数据清洗:视觉和语言数据

第7课时:数据分类基础

分类工具介绍

数据分类的基本原则和方法

第8课时:数据分类实操

实操数据分类:文本数据

实操数据分类:视觉和语言数据

第9课时:数据统计基础

数据统计工具介绍

数据统计的基本原则和方法

第10课时:数据统计实操

实操数据统计:文本数据

实操数据统计:视觉和语言数据

第11课时:数据处理综合

综合数据处理案例分析

数据处理常见问题与解决方案

第12课时:数据处理实操

实操数据处理:综合数据

业务数据的整理和汇总

第13课时:数据采集和清洗复习

重点知识回顾与练习

数据采集和清洗疑难点讲解

三、数据标注

第1课时:数据标注基础

数据标注的基本概念和原则

文本、视觉、语言数据标注简介

第2课时:文本数据标注

文本数据标注工具介绍

文本数据标注实操演示

第3课时:视觉数据标注

视觉数据标注工具介绍

视觉数据标注实操演示

第4课时:语言数据标注

语言数据标注工具介绍

语言数据标注实操演示

第5课时:数据标注规范

数据标注的详细规范

各类数据标注的标准要求

第6课时:文本数据标注实操

文本数据标注的详细操作

文本数据标注实例分析

第7课时:视觉数据标注实操

视觉数据标注的详细操作

视觉数据标注实例分析

第8课时:语言数据标注实操

语言数据标注的详细操作

语言数据标注实例分析

第9课时:数据标注质量控制

数据标注质量控制方法

标注数据的审核与修正

第10课时:标注数据分类基础

数据分类工具和方法介绍

分类的基本原则和技巧

第11课时:文本数据分类

文本数据分类工具介绍

文本数据分类实操演示

第12课时:视觉数据分类

视觉数据分类工具介绍

视觉数据分类实操演示

第13课时:语言数据分类

语言数据分类工具介绍

语言数据分类实操演示

第14课时:标注数据分类实操

实操数据分类:文本数据

实操数据分类:视觉和语言数据

第15课时:数据分类质量控制

数据分类质量控制方法

分类数据的审核与修正

第16课时:标注数据统计基础

数据统计工具和方法介绍

统计的基本原则和技巧

第17课时:文本数据统计

文本数据统计工具介绍

文本数据统计实操演示

第18课时:视觉数据统计

视觉数据统计工具介绍

视觉数据统计实操演示

第19课时:语言数据统计

语言数据统计工具介绍

语言数据统计实操演示

第20课时:标注数据统计实操

实操数据统计:文本数据

实操数据统计:视觉和语言数据

第21课时:数据统计质量控制

数据统计质量控制方法

统计数据的审核与修正

第22课时:综合标注和分类

综合数据标注与分类实例

标注和分类常见问题分析

第23课时:标注数据复习

标注数据重点知识回顾与练习

标注技能疑难点讲解

第24课时:分类数据复习

分类数据重点知识回顾与练习

分类技能疑难点讲解

第25课时:数据统计复习

数据统计重点知识回顾与练习

数据统计技能疑难点讲解

第26课时:标注与分类综合

综合标注与分类案例分析

实战演练与问题解决

第27课时:数据标注质量提升

提高数据标注准确性的方法

标注数据的质量评估与提升

第28课时:数据分类质量提升

提高数据分类准确性的方法

分类数据的质量评估与提升

第29课时:数据统计质量提升

提高数据统计准确性的方法

统计数据的质量评估与提升

第30课时:标注与分类综合提升

综合提高标注与分类能力

高质量数据标注与分类实例

第31课时:数据标注和分类综合

综合标注与分类的实操演练

复杂数据标注与分类问题解析

四、智能系统运维

第1课时:智能系统基础

智能系统的基本概念

智能系统基础知识

第2课时:智能系统操作

智能系统的基本操作

智能系统的启动与使用

第3课时:智能系统应用

智能系统在实际中的应用

智能系统的常见应用实例

第4课时:智能系统维护

智能系统维护的基本方法

智能系统的定期维护

第5课时:智能系统故障排除

常见故障及其排除方法

故障排除实例分析

第6课时:智能系统数据管理

智能系统数据的记录与管理

数据管理的规范和方法

第7课时:智能系统更新

智能系统更新与升级方法

系统更新的常见问题及解决方案

第8课时:智能系统综合维护

综合智能系统的维护与管理

实例分析智能系统的综合维护

 

师资介绍

吕腾超,TsingtaoAI LLM/大模型资深讲师

北京大学本硕,NLP领域研究专家;

在微软亚洲工程院(STCA)和微软亚洲研究院(MSRA)研究员,负责开发和改进聊天机器人情感分析及自动文摘生成技术。在STCA,主导了情感分类标准及模型的设计与编码,并设计了情绪表达意愿强度曲线,以提高对话系统的情感反馈精准度。在MSRA,结合当前主流预训练技术,构建了在gigaword数据集上表现优异的抽象摘要生成模型,并成功优化了服务器单文档预测时长至50ms以内。

专注于AI训练和自然语言处理技术;

在词法分析、依存分析、分词、词性标注(POS)、命名实体识别(NER)、领域/意图分类、抽象摘要生成及标题生成等多个方面表现卓越,掌握并熟练运用Python、sklearn、TensorFlow及Pytorch等工具;

研究论文《Hierarchical Attention Prototypical Networks for Few-Shot Text Classification》,发表于顶级会议EMNLP2019;

研究论文《An Empirical Study of Pre-trained Models for Sentence-level Abstractive Summarization》;

主导并实现《统计学习方法》模型,在GitHub上获得了5.8k+的stars;

在Kaggle竞赛中担任队长,通过精细的特征提取和模型调参,带领团队在比赛中获得了前3%的优异成绩。

 

汶生 AI产品专家 讲师

TsingtaoAI、GreedyAI和AIGC-Labs业务负责人;

曾任力晟鸿吉(国高新)创始人CEO,培高商业(B轮)副总裁;

中国农业大学硕士;

青岛市人工智能专家委员会委员;

中国技术创业协会校企融合专委会常务委员。

擅长领域

AIGC、ChatGPT、AI训练及数据标注、AI垂直大模型应用、智能客服、AIGC+HR、AIGC+教育、产教融合、AIGC+营销、AI商业运营、校企合作、校园市场营销等

产品成果

基于ChatGLM的智能客服产品;

面向HR人士的AIGC应用平台;

基于MidJourney和ChatGPT的AIGC-Labs学习和应用平台;

教育领域(辅助教师备课和教学)大模型应用产品;

基于数隐产业图谱的数据流通服务平台;

AICCE算法工程师职业竞争力测评平台;

清泉测评-Meta3.0元力测评平台;

昊华能源智慧党建学习平台;

校咖邦校园自媒体内容分发平台;

校咖邦校园营销触控屏感应系统控制集成电路;

校咖邦校园营销触控屏主机控制集成电路;

相关研究:《基于胜任力模型的AI算法工程师的人才测评指标体系构建》

 

陈鑫 AI开发专家 资深讲师

TsingtaoAI LLM/AIGC产品研发总监;

天津大学计算机硕士;

GreedyAI实训项目负责人;

北京正己基业教育科技有限公司架构;

北京运道科技有限公司技术负责人;

掌合天下(北京)技术有限公司技术经理。

擅长领域

LLM/AIGC、AI训练及数据标注、Python,Java语言教学,机器学习,神经网络等

 

肖红正 AI研发资深讲师

世界五百强英特尔公司担任高级系统架构师,十多年算法研究实践经验;

华中科技大学 计算机应用 硕士

985高校国家重点实验室算法Leader,研究视觉机器人产品;

500强上市公司,担任算法负责人,研究人工智能相关模型产品;

创新能力强,0-1发明点对多点协议的,曾用于美国网讯公司;语音同步合成同步技术,处于世界领先地位。

擅长领域

精通C/C++,熟悉Python等编程语言;

AI训练及数据标注;

图像的降噪、增强处理、图像的还原处理、边缘提取、图像滤波;

基于深度学习对2D和3D目标的检测、分类、语义分析、多目标跟踪;

对激光雷光点云数据和相机数据的融合处理,三维计算机视觉与点云模型、SLAM建图

立体视觉、多视几何、三维重构、SFM算法;

2D和3D人脸识别成功案例,人体驾车危险动作行为识别。

Product & Case.

产品与案例