使用ABBYY FlexiCapture来分析和提取工程计划书中的数据
挑战
从中文工程设计方案中
提取数据
解决方案
ABBYY FlexiCapture
结果
- 从工程技术文件中自动提取数据
- 1天组建方案
- 1年完成项目
成为世界顶级的清洁能源生产商是中国广核集团(中广核,前身为中国广东核电集团有限公司)的宏伟目标。中广核成立于1994年,注册资金为102亿元,目前已经发展成为一个受国务院国有资产监督管理委员会(SASAC)监管的主要工业集团。
CGN下辖30多家子公司和研发中心,其中,负责核电工程、施工和管理的中国核电工程有限公司(CNPEC)是其核心机构。自2004年成立以来,它已经成长为行业的中坚力量,其项目包括核电与常规电厂建设、供排水及民用工程承包。
查看如何ABBYY会帮助您
纸质文件限制业务发展
和其他纸张密集型企业一样,CGN的业务也开始受到堆积如山的文件的限制。公司每年都有大量的计划书、工程图纸和建筑设计文件,而且这个数量就像滚雪球一样越滚越大。管理这样大量的纸质文件自然会引起诸多问题:
- 文件查找速度慢,而且需要大量人力和资金;
- 文件存储需要大量资金和空间;
- 可能会由于文件打印稿受损或毁坏导致数据丢失。
CGN自然想到有必要将纸质文件数字化;这样的解决方案在市场上已经存在。最初,工作人员想到了一种最简单的方法:手工录入。但这种方法速度慢,容易出错,而且需要耗费大量人力。
OCR是一种自动化数据输入方法,但它不适用于手写文档,而且不能选择性地提取有用数据。 最终,公司找到了基于内置OCR和ICR数据采集技术的智能文档处理解决方案。这是一种顶尖的现代数据处理解决方案,可以避免全文识别,仅仅提取必要的印刷和手写数据,也可以给文件分类,并从最复杂的文件布局中极其准确地提取信息。
通过为期四个月的艰苦研究,公司测试和检测了目前市场上所有厂商提供的技术,并最终选择了上海泰彼信息技术有限公司提供的基于数据采集技术的战略性长期解决方案,这种方案兼具大量必要功能,并具备高度的可扩展性和灵活性。
上海泰彼信息技术有限公司专门提供成像、扫描、项目咨询与发展端到端解决方案,并使用ABBYY技术作为解决方案的核心要素。此外,作为ABBYY的中国合作伙伴,公司长期拥有基于ABBYY技术成功实施项目的专业技能,在中国,这比任何广告宣传活动都更有用。
使用ABBYY FlexiCapture来分析和提取工程计划书中的数据
CGN需要通过一个输入口来输入各种类型的大量文件,这些文件大多布局松散,包括含有打印和手写数据的工程图纸、计划书、表格等。通过使用灵活的模板,ABBYY FlexiCapture确保能够正确地采集这些数据;为此,CGN专门接受了相关培训。
此外,ABBYY数据采集技术是能够准确识别汉字的少数技术之一。
整个项目包括以下几个步骤:
- 用一天时间安装和设置ABBYY FlexiCapture;对CGN专业人士提供为期三天的培训,指导他们学会如何创建灵活的模板。
- 对所有计划书、图纸等文件进行扫描,并导入到系统之中,这个过程可以全天候无间断地自动进行,不需要人员值守。
- 系统根据创建的各种模板分析文件自动查找表格,定位所需字段并从中提取数据。
- 为了确保数据100%准确,受过专业培训的操作员团队会验证可疑的识别数据以及原文中的印刷错误。
- 最后,将经过提取和验证以后的数据(文本、表格、工程图表等)导出至SAP ERP系统,以便进行后续处理和分析。
结果
中国广核集团是一家大型国有企业。自成立以来,它已积累了数吨纸质文件资料,包括工程设计、图纸等技术资料。ABBYY的中国合作伙伴是端到端数字化及数据采集解决方案领域的专家,采用ABBYY FlexiCapture来提取文件中的有用信息和可视内容。由于工程计划书和图纸通常都布局松散,而且种类各异,这项任务非常艰巨。ABBYY FlexiCapture不仅能很好地支持中文脚本,而且可以根据项目需求轻松地进行定制(包括设计灵活的模板、设置工作流等),因此是理想之选。
项目仅用1年时间,就利用ABBYY FlexiCapture对多年积累下来的全部工程文件进行了数字化处理和加工。公司节省了查阅信息所需的时间,手工录入和验证所需的劳力,以及此前物理存储所浪费的资源。