表单识别准确率超过 99%,员工生产力提升 30%,生成式 AI 驱动沃行提速国际物流云服务

2024-10-28 11:08:33 8

概述

上海沃行信息技术有限公司(以下简称“沃行”)创立于 2011 年,是业界领先的国际物流SaaS云服务平台研发和运营服务商, 面向国际物流服务商如传统货代/跨境电商物流商、跨境电商卖家和出海制造/零售企业构建端到端的智能物流管理系统,拥有国际货代物流云服务 CargoWare 和跨境电商物流协同云服务 eTower 两款产品。为了解决国际物流业务中的问题,超大规模表单识别和内部生产力提升,沃行基于亚马逊云科技构建智能表单识别应用,利用 LLM 的多模态能力,提升表单识别准确率,加快新表单识别;同时还构建了企业知识库,提升内部人效,并对外简化物流服务应用。目前,沃行采用的亚马逊云科技主要服务包括:Amazon Bedrock、AWS Lambda、Amazon Aurora、Amazon SageMaker、Amazon OpenSearch Service、Amazon Elastic MapReduce(Amazon EMR)、Amazon Redshift、Amazon Relational Database Service (Amazon RDS)、Amazon Simple Storage Service(Amazon S3)、Amazon Elastic Compute Cloud(Amazon EC2)等等。


机会 | OCR 表单识别准确率低、成本高,沃行瞄准生成式 AI 以提升生产力

数字化时代,智能化正成为物流服务商脱颖而出的关键力量,生成式 AI 更是构筑竞争优势的新利器。借助生成式 AI 和 LLM (Large Language Model,大语言模型),国际物流服务商不仅轻松消除语言壁垒,简化物流服务用户交互,将海量业务数据与生成式 AI 深度结合,赋能并开发创新业务如自动对账等;还能通过构建内部知识库,大大提升企业生产力。


作为国际物流 SaaS 系统服务商,沃行连接了物流链条中众多相关方包括外贸公司、工厂、电商平台、卖家买家、货运代理企业、船司、清关行、海外仓、尾程服务等,其智能物流管控平台已接入包括亚马逊在内的主流跨境平台,对接超过 98 家船司、70 多家邮政和快递尾程商,汇聚逾万家电商卖家,日均处理各类表单超过 200 万件。随着业务的壮大,沃行面临着一些亟待解决的挑战:


传统 OCR 技术对表单识别率低:未达到超过 99% 都需要二次确认,导致表单识别耗时耗力;

新表单识别成本高:沃行链接的物流链相关方众多,各方单据模板种类繁多,而新单据的识别需要经过数千份的样本数据训练,成本高昂;

转变业务响应模式和提升人效:沃行期望从 “人找事” 转变为 “事找人”,针对内部 12 万篇文档,高效运用生成式 AI 结合历史数据和客户经验等,对内全面提升效率,对外简化物流管理服务应用。

自 2015 年 10 月开始,沃行将业务规模化部署在亚马逊云科技上,从最初采用北京 1 个区域逐步扩展到全球 6 个区域。2018 年,沃行的客户数量和云上负载急剧扩张,亚马逊云科技在上云服务架构、专家资源、市场拓展等方面不遗余力地提供了深度支持;2023 年,基于亚马逊全球业务体系和海外客户群合作资源,沃行在推动海外业务拓展及与跨境电商卖家联动,让其国际物流服务拓展更顺畅;近期,沃行通过了亚马逊云科技供应链能力合作伙伴专业认证,是亚马逊云科技在国内该领域的首家认证合作伙伴,反映了双方共同为国际物流行业客户提供卓越供应链专业服务的追求和践行。大模型问世以来,如何利用生成式 AI 解决上述挑战,成为双方关注的重心。


解决方案 | 基于亚马逊云科技打造智能表单识别和企业知识库,提升物流表单识别准确率

通过 Amazon Bedrock 构建智能表单识别,利用 LLM 多模态能力提升表单识别效率和准确率,并实现信息增强

以前,沃行通过传统 OCR(Optical Character Recognition,光学字符识别)技术识别大规模表单,实际应用中,会有两个问题:一是,OCR 通过一维图像识别并提取文字信息,若识别准确率达不到 99% 以上,往往需要进行二次确认以保证识别信息准确;二是,OCR 识别规则和模板设定较为刻板,较难适应表单变化,若物流链条上任意一方新增表单样式,沃行需要采用数千份的样本数据进行训练,并进行适配后才能利用 OCR 识别新的表单模板。


现在,沃行针对其国际物流业务,基于亚马逊云科技 Amazon Bedrock 调用业界领先 LLM,利用 LLM 的多模态能力自动识别表单,还可以灵活通过 Prompt 将非结构化表单数据转换成结构化数据,最终实现表单识别准确率超过 99%,远高于 OCR 的识别率。针对新增的表单格式,一样可高效、准确识别表单内容,并提取信息,沃行无需再额外训练数据或适配开发,极大提升大规模表单识别效率和准确率,同时优化了表单识别和新表单模板识别流程,显著节省了沃行的适配开发和物流操作资源投入。


不仅如此,沃行基于亚马逊云科技利用 LLM 还可以针对表单属性和内容实现信息增强:


表单信息补充和纠错:采用智能表单识别应用识别托书时,不仅能准确识别出托书上记录的内容,还可以根据上面的运输条款推导相应的贸易条款,最后可能提取出超出托书承载的更丰富内容,甚至能发现托书上记录的错误并自动纠错;

专业知识识别:物流表单中涉及大量专业领域知识如箱型箱量等,实际应用较复杂,但智能表单识别均可以完美识别,人工只需指定规则即可;

业务视角:针对货代的底单,从国际货代的视角来识别

从业务角色的视角结合表单提取信息及业界、客户数据等进行综合分析,提供更多增强信息。

沃行智能表单识别应用基于亚马逊云科技的产品架构示意图

沃行智能表单识别应用基于亚马逊云科技的产品架构示意图


基于 Amazon Bedrock 知识库打造沃行企业知识库问答系统,更高效检索 12 万篇文档,大大提升员工生产力

经过近 13 年运营,沃行积累了大量的物流领域专业知识和数据,在公司内以多种形式包括文档、Wiki 和 Jira Ticket 跟踪系统等分散存放,知识文档规模达到 12 万篇以上。采用传统的方式在分散于各个系统中查找想要的知识,效率低下,检索结果不准确,严重影响内部员工生产力。


沃行基于亚马逊云科技为其国际物流业务打造的企业知识库,采用 Amazon SageMaker 托管的第三方 Embeddings 模型、Amazon OpenSearch  Service、AWS Lambda,并结合 Amazon Bedrock 托管的 LLM ,基于 RAG(Retrieval-Augmented Generation,检索增强生成)框架实现了高质量的智能精准问答系统。该智能问答系统在处理用户检索时,首先判断提问者的角色,并根据角色识别提问意图,再提供精准的、符合角色需要的答案。


沃行的企业知识库显著提高公司内部人员的知识检索效率,为业务决策提供高效、专业的知识支持。目前,企业知识库已经应用于沃行的开发、测试、产品经理、项目经理、客服等各类业务角色的日常工作中,并即将在全公司范围内全面推广。

沃行企业知识库应用基于亚马逊云科技的产品架构示意图

沃行企业知识库应用基于亚马逊云科技的产品架构示意图


业务成果 | 大规模表单识别准确率超过 99%,员工整体效率提升 30%,客户满意度明显增强

大规模表单识别更准、更快,表单识别准确率超过 99%,灵活支持新表单识别

沃行在亚马逊云科技的助力下,构建智能表单识别应用后,表单识别的准确率超过 99%, 远高于 OCR 识别,无需人工介入进行二次确认;同时,对新表单样式的支持也更为灵活,无需再采用样本数据进行训练和适配,即可高效自动识别,极大提升大规模表单识别效率。


企业知识库应用于客户界面,客户满意度提升到 93%,客户体验明显增强

基于亚马逊云科技构建沃行生成式AI应用后,将知识库应用于客户服务场景,如智能客服、个性化推荐等。客服人员可从沃行的 12 万篇文档中高效检索,更可有效利用历史记录、客户背景等信息,更快、更精准地回答用户咨询,大幅增强了客户体验。客户满意度从 85% 提高到 93%,客户流失率降低 1.5%。


员工整体效率提升 30%,预计每年可节省人力成本约 15 万美元

在亚马逊云科技的支持下,生成式 AI 广泛应用于沃行内部运营。借助企业知识库,沃行内部检索效率大幅提升,而且以前需要数十名专业人员开发和维护知识库内容,现在仅需几名运维工程师管理训练数据,即可通过企业知识库自动生成高质量内容,预计每年可节省人力成本约 15 万美元。 针对大规模表单,除了智能识别表单内容外,还在亚马逊云科技的支持下,利用生成式 AI 自动总结撰写报告、进行文档智能处理等。生成式 AI 应用上线后,沃行员工效率整体提升 30%,重复性工作可减少 60%。


除了企业知识库和智能表单识别两个已上线的应用外,沃行和亚马逊云科技对于生成式 AI 驱动生产力和业务成效提升的探索还在持续。部分场景的应用已经启动开发并在推进中,如自动对账、自动运价导入等等。随着 LLM 的应用普及和单位 Token 成本的下降,沃行与亚马逊云科技的生成式 AI 合作必将更深入,开发更多生成式 AI 应用赋能客户,重塑国际物流软件云服务。

电话咨询
产品服务
客户专区
QQ客服