百度文本识别服务提供定制模板识别功能,现在想要实现,可能是什么技术解决方案。如何根据模板参考点调整图片
看看百度自定义模板的指南,至少需要定义四个参考点。我猜应该是基于N根据每张新图片,至少可以检测到四个参考点来校正视角到统一坐标。
自定义模板文字识别指南
从左到右点击工具栏中的第三个小图标参考点框选择工具进行参考点框选择。参考点必须是模板图片上的文本段。选框时有一些注意事项:医保卡样本
同一参考点的文本必须在同一行中,尽可能相邻;参考点必须是模板图片和后来上传的图片中常见且不变的文本段;参考点应尽可能分散在图片的边缘,特别是四个角落;参考点应尽可能分散在模板图片上,多次出现在图片中的文本段效果较差;参考点应尽可能多。建议标记8个以上的参考点,至少4个。参考点越多,识别效果越分散;以下是参考点框选择的示例。橙色矩形框选择为参考点:医疗保险卡样本
我是这个产品工程部分的程序员,我想我有资格回答这个问题。
楼上@piaolin答案基本正确,但不完整。整个调整过程包括许多步骤,如医疗保险卡样本
1、参考字段的匹配。有不同的匹配策略,尽可能匹配图片上的参考字段和模板上选择的参考字段
2、参考字段过滤。虽然在制作模板时需要尽可能选择唯一的参考字段,但实际上很难满足这一条件,因此也需要一定的过滤算法来消除错误的参考字段
3、计算透视投影矩阵。从过滤后的参考字段中选择合适的点坐标,将待识别图转换为模板底图的统一坐标系
4、结构化识别结果。根据识别区域的矩形框组合和拼接识别结果。这里更麻烦的是表列划分、行划分和折叠问题。由于表区域不需要水平划分,因此在非刚性变形的情况下,很容易出现错误的行。折叠问题更为明显,因为我不知道哪些行可能是一个字段,所以这一点也结合了一些图片信息来帮助处理。幸运的是,这些问题目前并不明显。可以在后续使用EM算法来解决
除上述四个步骤外,还有许多其他细节,如计算匹配程度、待识别图像预处理、透视投影与仿射转换、蒙板处理等
基于行业领先的图像处理和文本识别技术,提供模板识别和图像分类器的自定义功能,整合各种预设能力,提供多场景解决方案,自动分类固定版本的高效、低成本的卡票和全场景结构化识别
1.卡证、文件电子化
对未提供特殊界面但布局相对统一的各种卡、文件,如海外身份证(英文)、结婚证、产权证书、房地产证书、门票实现各种卡、文件的电子化,可应用于纸质文件分类归档、信息统计分析、关键内容提取等场景,有效降低劳动力输入成本,大大提高信息管理效率
2.财务票据识别
模板制作各种发票、收据、银行对账单、承兑汇票等常用财务账单,实现自动分类和结构化识别。并预常用发票模板可直接使用,可应用于企业财务报销、会计、记录等场景,有效降低企业劳动力成本,控制业务风险
3.医疗票据识别
模板制作检验报告、门诊收费、住院收费等常用医疗票据,实现自动分类和结构化识别,可应用于医疗数据分析、医疗费用报销、医疗账单电子场景,实现相关账单信息的自动识别和输入,有效降低劳动力成本,大大提高医疗信息化程度
1.云端服务
云端提供各种文本识别Paas用户可以直接调用服务接口API或使用SDK识别图片中的文本
2.私有化部署
部署到客户本地服务器,实现客户内网的文本识别功能,保证数据隐私,提供两种私有化方案:一体机和软件部署包
1.全场景适配
支持制作任何固定版卡证、票据的模板,实现结构化识别,广泛的应用场景
2.操作简单
1张模板图片,5分钟即可完成模板定制,结合自定义分类器一步实现图片的自动分类及结构化识别
3.服务稳定
依托百度云技术实力,提供高可靠性、灵活性、高并发性的文本识别服务,服务可用性高达99.99%
毕业证样本网创作《医保卡样本(如何实现百度文字识别服务中的自定义模板识别)》发布不易,请尊重! 转转请注明出处:https://www.czyyhgd.com/177707.html