表格、表单、名片数据采集
时间:2009-8-11 16:27:13 人气指数: 【 大 中 小 】
上海欧博代理平台罗索西丝智力采用先进的数据处理技术,对各类调查问卷、表格数据进行数字化处理,尤其擅长处理以下类型的调查数据:
·固定表格:税务报表、保险单、调查问卷、试卷等。 ·半结构化文档:发票、订购单、支付票据、装箱单、名片等。 ·非结构化文档:合同、条款、信函、租借协议和其它纯文本文档等。根据客户数据的具体格式和需求,对表格数据进行初步整理,设置好数据库字段,并搭建数据采集局域网,实现网络化数据采集。
(1)管理员端:用来控制整体表格处理过程, 通过文件模板编辑准备表格模板,并且对预期结果进行测试,统一表格模式。
(2)操作员端:录入/扫描表格,文字识别,对识别结果进行检验和存储。
1、对于手写文字、非结构化表格,采用双录软件进行两遍录入,人工核对数据;
2、对于结构化表格,采用“批量扫描 + OCR识别 + 文字校对”的模式进行处理。
技术人员采用OCR功能模块成功的识别技术基础上提供当前最高的精确度和稳定性。
·图象增强处理,提高识别效果,如纠偏、去噪。 ·数据文字提取,借助OCR识别技术精确提取相应的数据和文字信息。 ·自动数据校验,内置检验准则,在自动识别期间用来增加识别精确度。软件提供校对界面,将识别结果和原始图像进行对照,人工校对和录入,包括纵向校对和横向校对两个模式。
图像文件直接存放到对应目录下,便于客户存放;数据文件存放到Excel表格或Access数据库中,可以进行查询、统计等操作