借助jTessBoxEditor软件可以提高Tesseract-OCR字符识别的准确率,通过jTessBoxEditor的不断训练,可以大大提高Tesseract-OCR字符识别的准确率。
施用方式
jTessBoxEditor的运行环境是JAVA虚拟机,这是teesseract智能图片识别软件的训练框架。不需要直接安装和解压,但需要提前安装一个jar包jdk-8u101-windows-x64虚拟机。
用jTessBoxEditor自动训练3500个常用汉字
打开jTessBoxEditor图形界面。
单击TIFF/BoxGenerator按钮。
(2)将3500个汉字复制到空白区域。
(3)选择一个文件夹:(用任何名称创建您自己的文件夹,我的文件夹创建在磁盘F上)
(4)命名(随意命名自己,比如我的是哈哈)
(5)选择自己医学培训的字体(例如我的是宋体9pt)
(6)然后单击生成按钮生成tif和box文件。
点击教练按钮。
8 .打开先前创建的文件夹。
(9)语言需要改名(改成和第四步一样的名字,我的是哈哈)
(10)用现有的箱子选择列车。
11)然后单击运行。
(十二)成功后:
jTessBoxEditor(配套训练工具)相关下载
- 查看详情JUDE(JAVA建模软件)简体2024-03-10
- 查看详情mysql-jdbc.jar简体2024-02-29
- 查看详情Junit简体2024-02-09
- 查看详情正规表达式 PCRE简体2024-01-10
- 查看详情HGBase(Java开发框架)简体2024-01-10
- 查看详情 JUDE(JAVA建模软件) 英文 2024-03-10
- 查看详情 mysql-jdbc.jar 简体 2024-02-29
- 查看详情 Junit 多国语言[中文] 2024-02-09
- 查看详情 正规表达式 PCRE 简体 2024-01-10
- 查看详情 HGBase(Java开发框架) 英文 2024-01-10
- 查看详情 mongodb(开源数据库软件) 英文 2024-04-14
- 查看详情 MetInfo企业建站系统 简体 2024-04-14
- 查看详情 数据比对工具 简体 2024-04-14