高校实训交付|文字识别教具及OCR实训课程

 
 
近日,TsingtaoAI为云南某重点本科高校交付文字识别教具及OCR实训课程各2套。该课程配套识图智能眼和分拣实训机器人两个硬件教具,我司在硬件教具基础上开发运行软件及相关OCR算法,实现目标功能,并制作出来符合学校学生实训需求的项目式课程(27课时精品视频课程)。
 
 
 
 
 
 
 
 
 
 
 
 
一、“识图” 智能眼
 

 

 
(一)产品功能
 
 

面向文档扫描场景,可针对各类文档票据进行识别和信息提取。对接实训平台,一键部署模型服务,满足多种文档、票据识别的实训,深度结合实际业务使用场景特性。核心功能包括:

1.支持自动扫描,自动聚焦,实时获取图像进行识别;

2.支持识别结果可视化,自动根据模型输出参数,显示每张图片的识别结果,快速呈现训练效果;

3.支持识别结果保存,生成Excel文件,方便录入和比对;

4.屏幕支持触摸控制;

5.配置双目摄像头,支持活体检测,支持红外补光

6.支持摄像头参数调节,图像控制,亮度调整、曝光长度调整、锐利度调整、色彩调整、增益控制。

 
(二)参数
 
 

规格型号:WG-BX10

主板:四核,主频1.8G

内存:2G

存储:16G

像素:800万                     

分辨率:最大3200*2400                                          

拍摄范围:A4、A5、A6、A7等证件类                              

输出格式:JPEG\BMP等                                                      

感光元件:COMS                                           

接口:USB2.0  网口                                            

光源补偿:自然光+LED  

屏幕:10.1寸屏  类型:IPS;比例:16:9;分辨率:1920*1080;接口:EDP

尺寸:328*345*378mm

 
 
 
(三)实训项目介绍
 
 

第一部分:硬件介绍和使用 (1小时)

1.1 “识图”智能眼硬件平台模块介绍(20分钟)

规格型号、硬件参数及功能说明

介绍双目摄像头、感光元件、屏幕、接口、光源补偿等硬件部件

1.2 硬件平台使用方法(40分钟)

如何进行自动扫描,自动聚焦,实时获取图像

如何根据模型输出参数进行识别结果可视化

如何保存识别结果并生成Excel文件

如何操作触摸屏和调整摄像头参数

第二部分:理论知识讲解 (3.5小时)

2.1 OCR基本原理及应用场景介绍(60分钟)

计算机视觉基础知识

OCR概念、原理介绍

OCR主要应用场景解析

2.2 图像预处理技术(40分钟)

图像二值化、去噪声、灰度化等预处理技术讲解

针对不同环境光源进行图像预处理技术的讲解

2.3 文本定位和识别(60分钟)

文本区域定位技术讲解

文字识别技术讲解(基于深度学习的方法等)

2.4 深度学习模型应用在OCR中的实例分析(40分钟)

端到端的深度学习OCR模型介绍(如CRNN、Attention OCR等)

通过实例讲解深度学习模型在OCR中的应用

第三部分:实操训练 (4小时)

3.1 OCR项目实战环境配置(60分钟)

开发环境的配置和工具的使用

深度学习框架的介绍

如何部署和使用深度学习模型

3.2 OCR项目实战 - 图像预处理(60分钟)

根据实际图像样本进行图像预处理操作实战

针对不同环境光源进行图像预处理实战

3.3 OCR项目实战 - 文本定位和识别(60分钟)

文本区域定位操作实战

文字识别操作实战

3.4 OCR项目实战 - 结果优化(60分钟)

如何对识别结果进行后处理

如何优化模型以提升OCR效果

第四部分:总结与拓展 (1小时)

4.1 项目总结(30分钟)

总结实战中遇到的问题和解决方法

分析项目实战中的关键环节

4.2 人工智能在OCR领域的发展趋势(40分钟)

分析OCR技术的发展趋势和前沿进展

分析现有模型的缺陷以及如何结合新模型进行解决

探讨OCR技术在不同领域的应用前景

实训课程节选

 

 
 
 
 
 
 
 
 
 
 
 
 
二、分拣实训机器人
 
 
(一)产品功能
 
 

分拣场景是制造生产行业中OCR的典型应用场景,通过识别物体上的文字信息,对物品进行分拣。

 

实训平台训练模型可直接部署在分拣机上,配置分拣参数即可进行分拣实践。可满足多种维度多种场景的分拣实践,例如基于文字信息的分拣,基于文字有无分拣,基于印刷质量分拣,二维码条形码分拣等多种分拣场景。通过将所学OCR模型训练知识与实际应用场景相结合,学习OCR的应用以及实际生产环境中的问题解决思路,比如物体运动问题、多方向问题、残缺问题、性能效率问题等。核心功能包括:

1.对接实训平台:一键部署模型服务,可自主实训多种分拣场景。

2.手动配置分拣参数:根据模型输出灵活配置分拣格口

3.灵活调整相机参数以匹配多种分拣场景需求,根据图像特点反向优化模型参数。

4.图像采集:采集保存分拣线上的图像,用于模型训练和效果分析。

5.速率参数手动/自动设置:根据分拣物体特点,模型效果和识别速率,手动配置变速履带,还原实际分拣问题。也可以自动调节速率。

6.物体称重:通过称重对物体进行感知和分拣。

 
(二)参数
 
 

规格型号:NC-41B 一分四

主机:处理器:I5 ;内存:4G ;硬盘:128GSSD固态硬盘1T+机械硬盘 

显示器:15英寸/19英寸

分拣等级:一分四

相机:600W工业相机配12mm高清镜头

扫描速率:2100+/h

景深:500mm/10mil

视野范围:400mm*500mm

称重:最大量程 45kg ;重量精度± 20g ;称重台面4 00*5 0 0

传送带 耐磨工业级皮带

尺寸:1660mm*590mm*1940mm

 

 
(三)实训项目介绍
 
 

第一部分:硬件介绍和使用 (1小时)

1.1 分拣实训机器人硬件平台模块介绍(20分钟)

规格型号、硬件参数及功能说明

介绍分拣等级、相机、扫描速率、景深、视野范围等硬件部件和自动对焦等基础概念。

1.2 硬件平台使用方法(40分钟)

如何进行图像采集,手动配置分拣参数,根据图像特点反向优化模型参数

如何手动/自动设置速率参数,进行物体称重

第二部分:理论知识讲解 (3小时)

2.1 OCR基本原理及应用场景介绍(60分钟)

计算机视觉基础知识

OCR概念、原理介绍

OCR在分拣场景中的主要应用和价值

2.2 图像预处理技术(40分钟)

图像二值化、去噪声、灰度化等预处理技术讲解

针对不同环境光源进行图像预处理技术的讲解

2.3 文本定位和识别(60分钟)

文本区域定位技术讲解

文字识别技术讲解(基于深度学习的方法等)

2.4 深度学习模型应用在OCR中的实例分析(40分钟)

端到端的深度学习OCR模型介绍(如CRNN、Attention OCR等)

通过实例讲解深度学习模型在OCR中的应用

第三部分:实操训练 (4小时)

3.1 OCR项目实战环境配置(60分钟)

开发环境的配置和工具的使用

如何部署和使用深度学习模型

3.2 OCR项目实战 - 图像预处理(60分钟)

根据实际图像样本进行图像预处理操作实战

针对不同环境光源进行图像预处理实战

3.3 OCR项目实战 - 文本定位和识别(60分钟)

文本区域定位操作实战

文字识别操作实战

3.4 OCR项目实战 - 结果优化和应用到实际分拣场景(60分钟)

如何对识别结果进行后处理

如何优化模型以提升OCR效果

如何将识别结果应用到分拣机器人中进行实际物品分拣

第四部分:总结与拓展 (1小时)

4.1 项目总结(30分钟)

总结实战中遇到的问题和解决方法

分析项目实战中的关键环节

4.2 人工智能在OCR领域的发展趋势(40分钟)

分析OCR技术的发展趋势和前沿进展

分析现有模型的缺陷以及如何结合新模型进行解决

探讨OCR技术在分拣机器人等不同领域的应用前景

实训课程节选

 

关于TsingtaoAI
 
 
 
 
 

TsingtaoAI拥有一支高水平的产学研一体的AI产品开发团队,核心团队主要来自清华大学、北京大学、中科院、北京邮电大学、复旦大学、中国农业大学、美团、京东、百度、中国技术创业协会和三一重工等产研组织。TsingtaoAI核心团队专长于算力、行业LLM/AIGC应用的产品研发,面向企业的大语言模型应用落地等业务,如面向智能客服、教育、人力资源、电商和轨道交通等行业领域的LLM和AIGC应用开发。公司拥有近10项LLM/AIGC相关的知识产权。

 

TsingtaoAI自研基于LLM大模型代码能力的AIGC应用开发实训平台、面向CS专业的AI训练实训平台和基于大语言模型的AIGC案例学习平台,聚焦虚拟现实、金融科技、医药健康、高端装备、新能源、新材料、节能环保、文化创意、农业科技和食品科技等关键行业,通过链接全球数以千计的关键领域的AI科学家和工程师,为央国企、上市公司、外资企业、政府部门和高校提供AI企业内训和高校实训服务。

 

 

Product & Case.

产品与案例