财务数智化进程中,票据的处理效率与准确性直接关系到财务全链路的数据流转与合规风控水平。尽管OCR技术已经普及,但财务团队在实际操作中仍存在着诸多卡点。

  • 版式多样化问题。从国内各地发票到全球各类单据,版式没有上限,更不要说各种个性化附件,且过程中往往还伴随着拍摄模糊、单据混贴、多语言混排等图像质量问题,让传统识别提取技术的准确率受限。长此以往,企业部署的系统难以持续适应新样本。

  • 复杂审核依赖人工。涉及多单据关联核对,或需要从合同等长文本中提取关键条款进行判断时,需要配置大量词库与规则,由于系统不够智能,财务人员仍需投入大量时间人工判断。

  • 规则配置与系统集成。在繁多的审核规则下,更是规则系统配置与维护的耗时耗力。另外,企业内部往往存在多套系统,票据自动化处理作为一个重要节点,需要与OA、ERP、费控等系统无缝衔接,才能打破“数据孤岛”。

从人工审核迈向智能审核,大模型技术的应用已成必然。

但对于企业和财务人员而言,比起“AI能否理解”,大家更关注的或许是“AI能否被信任”——我们能否真的将判断权交给它?

01 可信任的智审,如何做到?

将文档“扔”给大模型,任何人都能做到,但这一定不是企业级应用的场景。

要准确、高效、可信,合合信息 INTSIG DocFlow(下文简称“DocFlow”)通过六个关键步骤构成系统化的处理流程。

点此在线体验 Docflow 的高效审核 https://cc.co/16YSc8

01 预处理

针对财务文件因扫描、拍摄问题出现的倾斜、卷曲、模糊等情况,DocFlow 会先通过图像处理技术进行切边与矫正。这一步能有效提升后续信息提取的准确性。

图片

02 文档解析

对文档/票据进行内容解析与还原。这一步不仅限于提取文字,更能精准还原标题、段落、层级、结构等完整信息,从而为大模型的信息提取和智能审核提供结构化数据。

03 文档分类

面对报销、采购、税务等场景下海量不同版式的文档和票据,DocFlow 依托 Embedding 向量模型(开源社区中文榜单第一),可以结合票据特征实现全自动分类。即便遇到历史未录入过的全新版式,在经过少样本学习后也能自动化处理。

04 信息抽取

DocFlow 的信息抽取采用了合合自研的垂类文档抽取大模型,相较于传统开源大模型来说,对文档中KV对关系的理解更精准。同时,该模型参数量更低,在资源消耗控制及抽取速度上也更具优势。

05 智能审核

突破传统规则引擎的局限,DocFlow 引入大模型逻辑推理能力,支持以自然语言配置审核规则。无论是简单的一致性校验、逻辑计算,还是复杂的语义理解,大模型都能按设置的规则自动执行,规则越具体,输出的审核结论精准度就越高。

06 增强验证

DocFlow 支持溯源定位,可以将每一项审核结论、信息提取结果都精准对应到原始票据/合同的具体位置,确保所有提取数据均源自原始文档,解决大模型的“幻觉”问题,也能助力财务人员快速完成人工复核。

02 场景落地:高频场景的效率革命

下面让我们看看 DocFlow 在具体财务场景中的应用成效。

场景一:费用报销类业务智能审核

费用报销是财务工作中最常见也最繁琐的场景之一,单据类型多、审核规则杂。使用 DocFlow 处理的步骤如下。

1. 自动识别不同费用单据及附件并分类

无论是差旅费发票、会议招待费票据,还是订单截图、支付凭证等,上传/接入后系统都能精准识别并进行自动拆分和归类。

2. 提取单据附件的关键字段

针对常见票据,系统将自动从识别后的单据中提取信息,比如发票号码、开票公司名称、金额、开票日期、费用明细等;而针对企业内部单据,在定义好需要抽取的字段后同样可以自动化抽取。

3. 灵活定义审核规则及字段

财务人员可以结合不同费用类型的审核要求,用自然语言灵活设置审核规则,如:金额一致性审核、逻辑计算审核、语义理解审核等,全方位覆盖报销审核要点。

基于大模型的DocFlow能实现复杂的审核规则和智能预审。比如在审核会议招待费报销时,大模型能自动从水单附件中识别出哪些是酒类消费(看到某白酒品牌能识别是酒),同时自动加总计算酒类费用金额,进而判断出酒类费用占总招待费的比例是否超过 40%。

审核时,DocFlow 可以把每一项审核结论、提取结果,都精准溯源定位到原始文档的对应位置,让审核依据一目了然,帮助人工进行高效快速的复核确认,筑牢财务数据可靠性防线。

场景二:合同智能提取及审核

合同审核也是财务工作中的高频场景,尤其在采购付款环节,常常需要核对合同付款要件与实际支付款项是否一致。DocFlow 同样能实现快速精准的信息提取与审核辅助,流程分为三个步骤。

1. 合同信息快速结构化

首先,DocFlow可以快速将合同中的关键信息转化为结构化数据,比如精准提取甲乙方名称、支付金额、支付条款、付款周期、履约节点等核心内容,打破合同长文本的信息壁垒,无需人工逐页筛选。

在此基础上,系统将智能分析合同内容及条款信息,比如当设定规则为“合同支付条款数量不得超过5笔且预付款比例需低于30%”时,大模型能自主识别条款内容、计算比例、统计笔数,快速输出是否符合规则的审核意见,降低人工解读成本。

2. 溯源定位消除大模型幻觉

与费用报销场景一致,合同审核也支持高效的人机交互复审机制,将大模型的审核依据、信息提取来源精准定位到合同原文位置,财务人员便可以在长合同中快速定位到对应条款。

3. 支持信息导出用于台账管理

并非所有合同信息提取都服务于审核工作,部分场景下需用于台账登记、管理分析、数据统计等用途。DocFlow 可以根据需求定向输出提取的合同信息,适配多样化管理需求。

03 总结

  • 多票据解析:可对财务场景中产生的海量非结构化文档进行解析,不受版式限制,适配多样化票据类型。

  • 支持合同长文本:能精准提取合同等长文档中的条款信息,为业务审计、合规审核提供有力支撑。

  • 支持多系统对接:可无缝对接 OA 系统、费控系统、ERP 系统、财务共享系统等各类业务及财务系统,实现数据互联互通。

  • 适配个性化财务附件:能自动提取各类申请单、支付截图等审核所需附件中的关键字段,满足多样化审核场景需求。

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐