高校实训交付|文字识别教具及OCR实训课程
面向文档扫描场景,可针对各类文档票据进行识别和信息提取。对接实训平台,一键部署模型服务,满足多种文档、票据识别的实训,深度结合实际业务使用场景特性。核心功能包括:
1.支持自动扫描,自动聚焦,实时获取图像进行识别;
2.支持识别结果可视化,自动根据模型输出参数,显示每张图片的识别结果,快速呈现训练效果;
3.支持识别结果保存,生成Excel文件,方便录入和比对;
4.屏幕支持触摸控制;
5.配置双目摄像头,支持活体检测,支持红外补光
6.支持摄像头参数调节,图像控制,亮度调整、曝光长度调整、锐利度调整、色彩调整、增益控制。
规格型号:WG-BX10
主板:四核,主频1.8G
内存:2G
存储:16G
像素:800万
分辨率:最大3200*2400
拍摄范围:A4、A5、A6、A7等证件类
输出格式:JPEG\BMP等
感光元件:COMS
接口:USB2.0 网口
光源补偿:自然光+LED
屏幕:10.1寸屏 类型:IPS;比例:16:9;分辨率:1920*1080;接口:EDP
尺寸:328*345*378mm
第一部分:硬件介绍和使用 (1小时)
1.1 “识图”智能眼硬件平台模块介绍(20分钟)
规格型号、硬件参数及功能说明
介绍双目摄像头、感光元件、屏幕、接口、光源补偿等硬件部件
1.2 硬件平台使用方法(40分钟)
如何进行自动扫描,自动聚焦,实时获取图像
如何根据模型输出参数进行识别结果可视化
如何保存识别结果并生成Excel文件
如何操作触摸屏和调整摄像头参数
第二部分:理论知识讲解 (3.5小时)
2.1 OCR基本原理及应用场景介绍(60分钟)
计算机视觉基础知识
OCR概念、原理介绍
OCR主要应用场景解析
2.2 图像预处理技术(40分钟)
图像二值化、去噪声、灰度化等预处理技术讲解
针对不同环境光源进行图像预处理技术的讲解
2.3 文本定位和识别(60分钟)
文本区域定位技术讲解
文字识别技术讲解(基于深度学习的方法等)
2.4 深度学习模型应用在OCR中的实例分析(40分钟)
端到端的深度学习OCR模型介绍(如CRNN、Attention OCR等)
通过实例讲解深度学习模型在OCR中的应用
第三部分:实操训练 (4小时)
3.1 OCR项目实战环境配置(60分钟)
开发环境的配置和工具的使用
深度学习框架的介绍
如何部署和使用深度学习模型
3.2 OCR项目实战 - 图像预处理(60分钟)
根据实际图像样本进行图像预处理操作实战
针对不同环境光源进行图像预处理实战
3.3 OCR项目实战 - 文本定位和识别(60分钟)
文本区域定位操作实战
文字识别操作实战
3.4 OCR项目实战 - 结果优化(60分钟)
如何对识别结果进行后处理
如何优化模型以提升OCR效果
第四部分:总结与拓展 (1小时)
4.1 项目总结(30分钟)
总结实战中遇到的问题和解决方法
分析项目实战中的关键环节
4.2 人工智能在OCR领域的发展趋势(40分钟)
分析OCR技术的发展趋势和前沿进展
分析现有模型的缺陷以及如何结合新模型进行解决
探讨OCR技术在不同领域的应用前景
实训课程节选
分拣场景是制造生产行业中OCR的典型应用场景,通过识别物体上的文字信息,对物品进行分拣。
实训平台训练模型可直接部署在分拣机上,配置分拣参数即可进行分拣实践。可满足多种维度多种场景的分拣实践,例如基于文字信息的分拣,基于文字有无分拣,基于印刷质量分拣,二维码条形码分拣等多种分拣场景。通过将所学OCR模型训练知识与实际应用场景相结合,学习OCR的应用以及实际生产环境中的问题解决思路,比如物体运动问题、多方向问题、残缺问题、性能效率问题等。核心功能包括:
1.对接实训平台:一键部署模型服务,可自主实训多种分拣场景。
2.手动配置分拣参数:根据模型输出灵活配置分拣格口
3.灵活调整相机参数以匹配多种分拣场景需求,根据图像特点反向优化模型参数。
4.图像采集:采集保存分拣线上的图像,用于模型训练和效果分析。
5.速率参数手动/自动设置:根据分拣物体特点,模型效果和识别速率,手动配置变速履带,还原实际分拣问题。也可以自动调节速率。
6.物体称重:通过称重对物体进行感知和分拣。
规格型号:NC-41B 一分四
主机:处理器:I5 ;内存:4G ;硬盘:128GSSD固态硬盘1T+机械硬盘
显示器:15英寸/19英寸
分拣等级:一分四
相机:600W工业相机配12mm高清镜头
扫描速率:2100+/h
景深:500mm/10mil
视野范围:400mm*500mm
称重:最大量程 45kg ;重量精度± 20g ;称重台面4 00*5 0 0
传送带 耐磨工业级皮带
尺寸:1660mm*590mm*1940mm
第一部分:硬件介绍和使用 (1小时)
1.1 分拣实训机器人硬件平台模块介绍(20分钟)
规格型号、硬件参数及功能说明
介绍分拣等级、相机、扫描速率、景深、视野范围等硬件部件和自动对焦等基础概念。
1.2 硬件平台使用方法(40分钟)
如何进行图像采集,手动配置分拣参数,根据图像特点反向优化模型参数
如何手动/自动设置速率参数,进行物体称重
第二部分:理论知识讲解 (3小时)
2.1 OCR基本原理及应用场景介绍(60分钟)
计算机视觉基础知识
OCR概念、原理介绍
OCR在分拣场景中的主要应用和价值
2.2 图像预处理技术(40分钟)
图像二值化、去噪声、灰度化等预处理技术讲解
针对不同环境光源进行图像预处理技术的讲解
2.3 文本定位和识别(60分钟)
文本区域定位技术讲解
文字识别技术讲解(基于深度学习的方法等)
2.4 深度学习模型应用在OCR中的实例分析(40分钟)
端到端的深度学习OCR模型介绍(如CRNN、Attention OCR等)
通过实例讲解深度学习模型在OCR中的应用
第三部分:实操训练 (4小时)
3.1 OCR项目实战环境配置(60分钟)
开发环境的配置和工具的使用
如何部署和使用深度学习模型
3.2 OCR项目实战 - 图像预处理(60分钟)
根据实际图像样本进行图像预处理操作实战
针对不同环境光源进行图像预处理实战
3.3 OCR项目实战 - 文本定位和识别(60分钟)
文本区域定位操作实战
文字识别操作实战
3.4 OCR项目实战 - 结果优化和应用到实际分拣场景(60分钟)
如何对识别结果进行后处理
如何优化模型以提升OCR效果
如何将识别结果应用到分拣机器人中进行实际物品分拣
第四部分:总结与拓展 (1小时)
4.1 项目总结(30分钟)
总结实战中遇到的问题和解决方法
分析项目实战中的关键环节
4.2 人工智能在OCR领域的发展趋势(40分钟)
分析OCR技术的发展趋势和前沿进展
分析现有模型的缺陷以及如何结合新模型进行解决
探讨OCR技术在分拣机器人等不同领域的应用前景
实训课程节选
TsingtaoAI拥有一支高水平的产学研一体的AI产品开发团队,核心团队主要来自清华大学、北京大学、中科院、北京邮电大学、复旦大学、中国农业大学、美团、京东、百度、中国技术创业协会和三一重工等产研组织。TsingtaoAI核心团队专长于算力、行业LLM/AIGC应用的产品研发,面向企业的大语言模型应用落地等业务,如面向智能客服、教育、人力资源、电商和轨道交通等行业领域的LLM和AIGC应用开发。公司拥有近10项LLM/AIGC相关的知识产权。
TsingtaoAI自研基于LLM大模型代码能力的AIGC应用开发实训平台、面向CS专业的AI训练实训平台和基于大语言模型的AIGC案例学习平台,聚焦虚拟现实、金融科技、医药健康、高端装备、新能源、新材料、节能环保、文化创意、农业科技和食品科技等关键行业,通过链接全球数以千计的关键领域的AI科学家和工程师,为央国企、上市公司、外资企业、政府部门和高校提供AI企业内训和高校实训服务。