理房通:人工智能提升业务真实性审核能力
近年来随着人工智能技术的飞速发展,支付行业也在不断探索和应用人工智能技术,助力支付行业高效、稳健发展。理房通利用“OCR+人工智能”技术在业务真实性审核领域实现了突破,降低了人为因素对业务真实性审核的影响,增强风险管控能力,为行业在防控风险及提升数字化水平等方面提供了可参考的案例。
一、背景
(一)电信网络诈骗形势严峻,业务真实性审核的必要性和高时效要求日益显著。
据公安部2024年有关通报数据显示,近5年来,全国公安机关共破获电信网络诈骗犯罪案件194.5万起。刷单返利、虚假网络投资理财、虚假购物服务、冒充电商物流客服、虚假征信等10种常见的电信网络诈骗类型发案占比近88.4%,其中刷单返利类、虚假网络投资理财类及虚假购物服务类诈骗位居前三位。
对支付机构来讲,如何以及时、高效且精准的方式识别并防控电信网络诈骗风险,保护客户权益,同时保障正常、真实业务的效率,也成了各机构面临的一项紧迫挑战。而业务真实性审核是机构防范电信网络诈骗风险的必要手段之一,为满足风险防控需要,支付机构必须提升业务真实性审核效率。
(二)非数字化影印件仍需要人工审核,不仅效率低,也存在潜在人为风险
当前,支付机构仍需要收集和审核各种不同类型的影印件作为开展业务真实性审核的一项重要举措。由于影像材料的多样性和复杂性,只能由人工核实其真实性和有效性。而人工审核不仅面临耗时长、效率低的问题,同时也存在潜在的人为操作风险和道德风险。
(三)“传统OCR+人工审核”无法同时满足业务开展及风险防控的需要
支付机构在审核业务真实性方面主要采用的是传统OCR和人工审核相结合的技术手段,然而传统OCR在处理非制式图像和执行语义分析方面存在明显的局限性,它仅能识别单一制式图像,无法处理多样化的图像。
此外,人工审核在处理时效上难以满足支付机构业务开展和风险防控的迫切需要。如果在业务开展前进行业务真实性审核,可能会影响业务的正常进行;而如果将审核置于支付业务完成后,又无法有效实现风险防控的目的。因此,支付机构亟需采用更为先进的技术手段,以提高业务真实性审核的效率和准确性。
二、“OCR+人工智能”技术在业务真实性审核领域的应用方案概述
(一)传统OCR技术面临的挑战
1、受限于图像质量
传统OCR技术对图像的质量要求较高,如像素、对比度、噪音、特殊字符等都可以影响OCR的识别结果。
2、难于识别和处理非制式、多样化图像
传统OCR技术无法对支付机构在开展业务真实性审核时收集的非制式、多样化材料,如业务凭证、合同等进行数字化识别,只能依赖于人工进行审核。而人工审核存在耗时长、效率低的问题,同时也无法满足风险防控的迫切需要。
3、无法实现人工智能辅助决策
传统OCR技术往往停留在文字识别层面,缺乏对文字内容语义的理解和分析能力,无法将图像内容数字化,无法对人工审核提供智能辅助决策。
(二)理房通“OCR+人工智能”技术应用方案
理房通在传统OCR的基础上,结合人工智能技术通过图像质量优化(包含图像增强处理、图像去斜摆正)、图像数据结构化识别、人工智能辅助决策三个关键步骤提升了业务真实性审核效率和图像数字化水平,同时也提升了风险防控效果。具体技术应用方案如下:
1、人工智能图像质量优化
理房通通过人工智能技术对图像质量进行优化,主要包含图像增强处理及图像去斜摆正。
(1)图像增强处理
为解决传统OCR受限于图像质量的问题,提升OCR识别准确率,理房通采用了深度学习算法,在客户上传图像文件时检测图像清晰度,并进行图像增强处理,剔除对比度、光照、噪音等影响图像质量的因素,具体处理流程如下:
①图像预处理:包括图像去噪、滤波等操作,以消除图像中的噪声和干扰因素。
②对比度增强:通过直方图均衡化等方法增强图像的对比度。
③细节增强:利用锐化技术增强图像的细节信息。
④亮度调整:通过伽马变换等方法调整图像的亮度范围。
(2)图像去斜摆正
理房通由于房产交易领域业务特殊,在开展业务真实性审核时,需要审核的图像少则几张,多则十几二十张,甚至更多。如图像是倾斜状态,则人工在核实时需要逐一旋转摆正,旋转摆正过程中将耗费大量时间。针对此问题,使用了图像分割技术检测备件区域,将备件区域作为前景,其他为背景,构建语义分割模型,并利用大量样本数据进行训练,实现高准确率的备件区域检测。具体处理流程如下:
①通过YOLOv8模型先做区域检测和图像裁剪,提取其外接矩形并计算旋转角度,将图像旋转到水平方向。
②旋转后的图像仅可能存在四个角度,分别是0度、90度、180度和270度。
③通过合成大量数据,再通过EfficientNetV2模型按训练一个角度分类模型,实现对摆正角度的分类。
④最终对图像实现摆正。
2、人工智能图像数据结构化识别
为解决传统OCR无法对非制式、多样化图像的识别和处理能力,理房通利用OCR、排序算法和大语言模型的技术能力实现对图像数据的结构化识别。
具体识别的流程如下:
①利用深度学习算法识别图像中的文字。
②将识别出来的结果进行排序。
③结合图像格式,从排序完成的结果中提取对应的字段和值。
④依据各种图像格式过滤识别结果,降低大模型幻觉问题、提升识别速度。
⑥对于复杂业务场景,通过大模型的语义理解和分析能力,识别关键信息并输出结构化数据。
3、人工智能辅助决策
获取结构化数据信息后,系统通过业务规则进行核验,在核验的过程中,对于需要强一致性的内容进行100%准确性比对;对仅需语义一致的内容,理房通采取特殊文字提取+相似度计算的方式,相似度采用余弦距离算法,余弦距离值的大小代表相似程度,介于0-1之间,0表示完全不同,1表示完全一致。根据实际业务场景需要,对相似度设定一个阈值并进行应用。
对于风险较低领域且不涉及资金风险的情形,可以执行全自动化的审核流程,从而提高效率并减少人为干预的潜在风险;对于风险较高领域,则将自动化识别结果反馈给审核人员作为辅助决策参考,确保审核的精确性和安全性。
三、应用成果
(一)通过人工智能图像质量优化,业务真实性审核效率明显提升
1、通过图像增强处理,因为影像质量原因造成的退回率明显降低
理房通在该功能应用前,传统OCR技术因影像质量差而被退回的业务单占比7%,该功能上线后退回率已降至3%。
2、通过图像的去斜摆正能力,业务真实性审核效率明显提升
理房通在此功能应用前,客户上传的图像材料中约有70%的图像为倾斜状态,每张图像旋转摆正耗时至少1秒,每审核一业务单,按照每单需要上传的最小图像数8张为例,则至少有5张图像需要人工摆正,随着该功能的实际应用,全部图像可实现摆正状态,每单审核时间至少可以减少5秒。
(二)通过人工智能图像数据结构化识别及数字化处理,提升了业务真实性审核数字化水平
通过对图像数据的结构化识别,能够准确提取所需信息,并对识别出的信息进行数字化处理,它不仅提升了业务真实性审核的数字化水平,也为人工审核提供了智能辅助决策,降低人工审核错误的风险。
以理房通房产类支付业务为例,通过图像数据的结构化识别,不同类型的图像自动化识别准确率对比如下:

(三)人工智能辅助决策,提升业务真实性审核的效率和风险防控效果
以理房通的房产类支付业务为例,通过人工智能辅助决策,大模型将判断结果同过可视化的方式展示给业务审核人员,业务审核人员只需判断人工智能的判断是否准确,业务真实性审核审核时效(自提交审核到审核完成)已由原来的10min/业务单,提升至7min/业务单。同时,由于人工智能判断结果在系统中留痕,审核人员如果要给出不同的结论需要有充分的理由,降低了人工操作的失误风险和道德风险。
四、相较于传统OCR技术的优势
(一)更好的抗干扰能力,解决了图像质量差的备件必须依赖于人工进行业务真实性审核的问题
“OCR+人工智能”技术在处理图像中的噪声、模糊、光照变化等干扰因素方面有明显优势,解决了传统OCR技术因图像质量差必须依赖于人工进行业务真实性审核的问题。
(二)支持处理不同类型图像且识别准确率高,解决了非制式、复杂多样备件必须依赖于人工进行业务真实性审核的问题
“OCR+人工智能”技术利用大模型算法,能够更准确地识别非制式、复杂多样的备件图像中的信息,并通过对图像处理后的数据的应用,实现自动化核验,解决了传统OCR必须依赖于人工进行业务真实性审核的问题。
(三)人工智能辅助决策,解决了人为干预的潜在风险
“OCR+人工智能”技术不仅能够识别文本信息,还能够通过训练理解文本的含义,在处理复杂图像或复杂业务场景中能够为人工审核提供智能辅助决策,一定程度上降低了人为操作风险和道德风险等问题。同时通过内部一系列的针对人为风险的控制措施,如系统操作日志留存、内部审计及内部组织管理等方式,降低人为干预的潜在剩余风险。
五、展望
(一)未来有可能逐步实现业务真实性审核的完全智能化,进一步降低人为风险
随着人工智能技术的不断发展,未来有可能逐步实现业务真实性审核的完全智能化。完全智能化审核不仅可以提升业务真实性审核审核效率及审核的精准性,同时也可以完全解决人为干预的潜在风险。
(二)在支付和金融行业的业务真实性审核、数字化转型等方面具有借鉴价值
支付和金融行业在业务真实性审核方面需要人工审核大量非制式影印件,本案例所应用的技术方案同样适用于这两个行业的业务真实性审核领域,它不仅可以提升审核的效率,还能增强风险防控效果。
另外,当前支付和金融行业在业务真实性审核方面,仍然是以影印件的方式进行留存,尚未实现数字化管理。本案例所应用的技术方案可以将图像影印件进行数字化处理,不仅能够形成宝贵的数据资产,而且为行业的数字化转型提供了坚实的数据基础。随着数字化的不断应用,不仅能够提高业务真实性审核的效率,还能够通过数据分析和智能预测,增强对潜在风险的识别和防控能力。
来源:理房通

