OCR文字识别

一、功能

1. 文本识别能力

支持识别中文简体、英文印刷文本内容进行识别,支持图像的纠偏和翻转。支持TIFFBMPJPGPNGPDF多种格式图像文件的文字识别。识别结果可保存成TXTPDF等格式文本文件,PDF支持对图像原版面格式的还原。支持对识别内容进行结构化提取,并且展示提取内容。可对识别的文字进行复制引用,并保持原格式。

2. 表格识别能力

支持对表格类材料的分析提取,自动识别并定位表格线及表格内容,结构化输出表头、表尾及每个单元格的文字内容,并对提取后的独立字段进行语义分析后的智能整合,生成可以使用的数据

3. 图像优化能力

支持对识别材料中黑边严重、空白页、图片歪斜、像素低下、图片模糊不聚焦、图片效果不好等有问题的材料,进行图像预处理,提高材料识别准确率。

4. 线程控制

支持高中低不同优先级线程控制处理,可以即时查看每个优先级下的任务队列情况

5. 优化学习

支持不断优化识别效果,针对不能识别、识别错误、识别错位等问题,通过人工智能自我学习,不断提升识别效果。

6. 批量识别

支持把图片格式的文件打包压缩成zip后上传系统,系统识别后生成一个zip格式文件,下载到本地解压后包含jsonpngtxtxml格式文件。Txt文件展示具体识别内容。

7. 集群扩容

支持集群部署,可实现热备,负载均衡,可通过集群扩大并发能力。

8. 运维管理

支持OCR服务的分时段调用情况统计,可以查看访问的高峰和低估,并进行图表可视化展示。

支持对当前系统的服务资源利用情况、OCR队列、线程使用情况进行监控,并进行图表可视化展示。

支持对pdf识别、剪裁识别、图像转pdf,图像转文本调用类型和请求次数进行统计分析,展示页面支持下钻功能,可下钻至按天,小时,分钟进行详细查看。