第四范式发布全新一代文档数字化管理平台Smart Archive 2.0

第四范式
2024-10-09

今日,第四范式正式推出全新一代文档数字化管理平台——Smart Archive 2.0。该产品基于第四范式自研的文档处理大模型,实现零样本下对企业文档的精准识别及信息提取。文档处理大模型利用二十多个行业,上百种场景下的企业文档、表格、合同、票据、卡证、印章等海量数据训练而成,并融合了深度学习、迁移学习、多模态学习等先进技术,实现了对各类通用版式、自定义版式及复杂长文本的信息识别及提取,大幅提升企业的文档处理效率。

购房合同识别(长文本、不定版式)

智能识别房本(套打错位、多版式)

运管纸质对账单识别

Smart Archive 2.0 的其他特性:

- 能力全面:版式分析、文字识别、表格识别、印章识别、标准证照、自定义版式信息提取等全面功能

- 零样本学习:依托于第四范式自研的大模型技术,Smart Archive 2.0无需样本训练即可直接识别各类文档,显著降低了数据标注和训练建模工作量

- 长文本理解:在处理复杂长文档如合同、财报、审计底稿时,提供出色的信息提取能力

- RAG场景优化:针对RAG文档处理场景进行了重点优化,实现文档高质量切分与预处理解析

- 顶尖的表格识别能力:能够针对有线表、无线表、少线表和跨页表格准确解析还原

在数据安全方面,第四范式 Smart Archive 提供了多种数据安全机制,并支持本地化部署,确保了数据处理的安全性和私密性。

修改于:2024-10-09
免责声明:上述内容仅代表发帖人个人观点,不构成本平台的任何投资建议。

精彩评论

我们需要你的真知灼见来填补这片空白
发表看法