AWS推出Textract工具能够在几小时内读取数百万个文件

释放双眼,带上耳机,听听看~!

AWS表示,其Textract工具,旨在提取和翻译文件之间的数据,现在通常可供所有客户使用。该工具是其云平台的机器学习驱动功能,允许客户自主从文档中提取数据并将其准确转换为可用格式,例如将合同数据导出到数据库表单中。

完全托管的工具不需要使用机器学习知识,几乎可以在任何文档中使用。使用特定文件类型(如金融服务,保险和医疗保健)的行业也可以将这些文件插入到工具中。

Textract旨在加快繁琐的数据输入过程,这在使用其他第三方软件时通常也是不准确的。亚马逊声称它可以在“短短几个小时”内准确分析数百万份文档。

“许多公司通过手动数据输入或简单的OCR软件从合同,费用报告,抵押担保,基金招股说明书,税务文件,医院索赔和患者表格等文件中提取文本和数据,”该公司表示。

“这是一个耗时且往往不准确的过程,它产生的输出需要进行大量的后期处理才能以其他应用程序可用的格式进行,”它补充道。

Textract从存储在Amazon S3存储桶中的扫描文件中获取数据,读取它们并返回带有页码,节,表单标签和数据类型的JSON文本中的数据。

普华永道已经在为其制药客户使用该工具,该行业通常使用涉及食品和药品管理局(FDA)形式的流程,否则需要数小时才能完成,普华永道医疗保健AI负责人Siddhartha Bhattacharya表示。

“以前,人们会手动审查,编辑和处理这些表格,每个表格花费数小时,”他说。“Amazon Textract已被证明是这些表格中最有效和最准确的OCR解决方案,它可以提取所有相关信息以供审查和处理,并将花费的时间从几小时减少到几分钟。”

气象局是另一个计划实施Textract的组织,利用旧的天气记录。

“我们希望使用AmazonTextract将文档档案中的数百万历史天气观测数字化,”气象局气候科学家Philip Brohan说。“将这些观察结果用于科学将提高我们对气候变化和变化的理解。”

人已赞赏
安全新闻

企业警告员工主体访问请求的成本飙升

2019-11-15 0:58:38

安全新闻

微软暗示了5G时代的现代操作系统

2019-11-15 0:58:42

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索