河东软件园:绿色免费的软件下载站! 最新软件|软件分类|软件专题|软件发布

所在位置:首页 > 应用软件 > 其它应用 > jTessBoxEditor(配套训练工具) 1.5 免费版

jTessBoxEditor(配套训练工具)

 1.5 免费版
  • 软件大小:4 KB
  • 更新日期:2019-02-20
  • 软件语言:英文
  • 软件类别:其它应用
  • 软件授权:免费软件
  • 软件官网:
  • 适用平台:WinXP, Win7, Win8, Win10, WinAll
  • 软件厂商:

9.0
软件评分

本地下载文件大小:4 KB 高速下载需下载高速下载器,提速50%

软件介绍人气软件相关文章网友评论下载地址

为您推荐:其它应用

  jTessBoxEditor是一个Tesseract OCR的Box编辑器,软件提供简单的编辑方式,将文字内容加载到软件就可以配置相关的输出方案,软件提供字体设置功能,可以在软件编辑当前转换的字体类型,也支持两个工具,点击tool就可以找到 Merge TIFF以及Split TIFF工具,方便用户对添加的tiff文件分割合并;jTessBoxEditor使用简单,软件界面功能不多,内置多种参数可以直接使用,需要的朋友可以到河东下载!

jTessBoxEditor(配套训练工具) 1.5 免费版

软件功能

  双击JAR文件以启动程序,或执行以下命令:

  java -Xms128m -Xmx1024m -jar jTessBoxEditor.jar

  您需要提供TIFF / Box文件作为编辑器的输入。在训练中使用的图像应为300 DPI和1 bpp(每像素位数)黑白或8 bpp灰度,未压缩的TIFF格式; 以UTF-8格式编码的box文件由具有适当命令行选项的Tesseract可执行文件生成(请参阅 Tesseract Training Wiki)。或者它们都可以使用内置的TIFF / Box生成器创建。

  Box View中提供了以下热键,以便于编辑:

  W / S - 向上/向下移动盒子; A / D - 左/右移动框

  Q / E - 减小/增加箱宽; R / F - 减小/增加箱子高度

  - 上一个/下一个框

  X - 在框中编辑字符

  使用热键时按住Shift可将移动速度乘以10.编辑字符时按Enter或ESC可对框编辑器进行聚焦。

  请注意,框文件中使用的坐标系在左下角有(0,0); 但是,在计算机图形设备上,(0,0)被定义为左上角。jTessBoxEditor使用并显示在图形设备坐标中。编辑的盒子文件仍以适当的格式读取和写入。

  对于给定输入UTF-8文本文件,生成器生成适合使用Tesseract进行训练的TIFF / Box文件对。根据启用的抗锯齿模式,生成的图像是具有300 DPI分辨率的二进制或灰度,未压缩的多页TIFF。可以调整字母跟踪或字符间距,以消除边界框重叠问题。请注意,某些框的坐标可能与Tesseract本身生成的坐标略有不同(1或2个像素); 尽管如此,生成的box文件可用于验证Tesseract使用与Unicode兼容的文件比较工具(如 WinMerge)创建的文件。

  提示:实验表明,TIFF / Box Generator创建的图像训练质量较高,字体大小为24pt或更大,并且添加了一些噪音。

  用户可以在UTF-8文本文件中指定符号或变音符号(如在梵文或印度语脚本中找到的符号或变音符号,需要与主要基本字符组合),具体而言data/combiningsymbols.txt,由生成器读取。此设置使用户可以灵活地为其语言脚本定义组合符号/变音符号。

  最新版本提供自动培训。Tesseract Windows培训可执行文件与程序捆绑在一起; 对于其他平台,您需要 构建它们。将所有必需的源训练数据文件(以适当的语言代码为前缀)放在指定的目录中(检查samples 文件夹中的示例)。还可以使用随附的train.ps1Windows PowerShell脚本自动执行培训操作 。

  该合并TIFF功能可以节省用于培训包含相同字体的文本转换成一个单一的多页TIFF文件的多张图片。包含转换函数,用于将字符文本字段中的数字字符引用(NCR)和转义序列转换为Unicode字符。

软件特色

  - 支持Tesseract 2.0x和3.0x格式的编辑框数据

  - 实现框选择和合并/拆分/插入/删除操作

  - 通过微调器实现盒子尺寸更改功能

  - 支持文本字段的Unicode转换

  - 包括框搜索功能

使用方法

  1、下载软件以后直接打开jTessBoxEditor.jar就可以使用,也可以打开train.bat进入软件主界面

jTessBoxEditor(配套训练工具) 1.5 免费版

  2、用户需要安装jdk才能打开jar文件,可以在河东下载jdk

jTessBoxEditor(配套训练工具) 1.5 免费版

  3、用户将下方的软件安装到电脑,随后双击jar就可以打开了,选择 Java(TM) Platform SE binary

  

jdk1.8 64位官方版

大小:196 MB版本:环境:WinXP, Win7, Win8, Win10, WinAll

进入下载

  4、软件主界面就是这样的,界面是英文,很明显小编不会使用

jTessBoxEditor(配套训练工具) 1.5 免费版

  5、在软件添加Tesseract可执行文件,点击...就可以进入添加界面

jTessBoxEditor(配套训练工具) 1.5 免费版

  6、这里是官方提供的程序界面,可以选择wordlist2dawg.exe,可以选择wordlist2dawg.exe

jTessBoxEditor(配套训练工具) 1.5 免费版

  7、 Training Data数据添加界面,可以选择vie.words_list、vie.arial.exp0.tif

jTessBoxEditor(配套训练工具) 1.5 免费版

  8、也支持 Bootstrap Language设置,也支持RTL内容设置,点击run就可以运行

jTessBoxEditor(配套训练工具) 1.5 免费版

  9、也支持 Make Box File Only或者是Train with Existing Box选择,选择完毕就可以run

jTessBoxEditor(配套训练工具) 1.5 免费版

  10、执行的界面就是这样的, 如果你会使用这款软件就下载吧!

jTessBoxEditor(配套训练工具) 1.5 免费版

更新日志

  版本0.2(2011年4月14日):

  - 添加一个设置以设置Box Coordinates表的字体

  - 设置表格行高度以匹配字体

  - 将pangram合并到Font对话框中

  版本0.3(2011年4月25日):

  - 提供当前框的特写视图

  版本0.4(2011年5月28日):

  - 添加实用程序功能,将图像合并为多页TIFF

  0.5版(2011年9月5日)

  - 显示图像窗格中已装箱字符的信息工具提示

  版本0.5.1(2011年9月12日)

  - 纠正图像窗格中垂直居中的(小)图像问题;将其对齐到窗格顶部

  版本0.6(2011年10月18日)

  - 添加一个实用程序功能,创建适合使用Tesseract进行训练的TIFF / Box对

  - 修复了在加载其他图像时可能清除修改后的文件夹的错误

  - 增强盒子搜索操作

  - 修复各种可视组件中的字体问题

  - 合并框将具有由合并框的所有字符组成的字符值

  版本0.7(2012年6月16日)

  - 修复了在OS X上打开帮助文件的问题

  - 对于TIFF / Box生成:

  *增加行间距

  *缩写粗体/斜体字体样式到b / i用于文件名

  *添加前缀(语言代码)文本框

  *添加对文本消除锯齿的支持

  版本0。0(2013年4月16日)

  - 添加行号标题

  - Char cell现在可以编辑

  - 尽可能转换Unicode转义序列

  - 查找框现在显示Unicode字符,并允许使用Unicode转义序列进行搜索

  - 改进生成TIFF / Box功能:

  *自动组合具有相同坐标或完全相互包围的盒子

  *自动组合将外部文件中指定的符号与主基本字符组合在一起的框

  *在Generate TIFF / Box窗口中保留最后修改的exp编号

  版本0.9(2013年4月30日)

  - 增强生成TIFF / Box功能,除了附加外,还允许组合前置符号

  - 修复了在编辑模式下无法持续更改表的错误

  - 查找功能现在支持部分匹配

  - 修复了当行标题具有焦点和滚动时表格不滚动的问题

  版本1。0(2013年11月16日)

  - 集成对Tesseract培训全自动化的支持

  - Bundle Tesseract Windows培训可执行文件(r866),英文数据和配置文件

  - 修复生成的TIFF丢失元数据的问题

  - 可选择为生成的图像添加噪声

  - 错误修复和改进

  1.1版(2014年10月15日)

  - 添加从右到左(RTL)文本的培训支持

  - 使用修改键添加水平框分割

  - 添加拆分多页TIFF功能

  1.2版(2014年11月7日)

  - 分解培训流程,以实现灵活的增量培训

  - 合并日志记录

  版本1。2。1(2014年11月19日)

  - 仅在选择RTL时应用修复unicharset的Unicode字符方向性

  1.3版(2015年1月4日)

  - 实现功能以验证生成的训练数据

  1.4版(2015年5月2日)

  - 结合A2K的改进,在箱子视图中使用热键进行箱子移动控制,以及Box View的可调节箱子缩放和边距

  1.5版(2016年3月8日)

  - 改进:仅训练带有文件夹的图像

  - 创建或更新font_properties文件

下载地址

  • jTessBoxEditor(配套训练工具) 1.5 免费版

    本地高速下载

查看所有评论>>网友评论0

发表评论

您的评论需要经过审核才能显示

精彩评论

最新评论

盖楼回复X

(您的评论需要经过审核才能显示)