意昂体育

基层实践|以人民银行张家界市分行为例

文/中国人民银行张家界市分行 毕宇

东北大学秦皇岛分校 褚希

近年来,随着张家界市汇兑支付环境持续优化,被列为全国17个优化支付服务重点城市之一。作为举世闻名的世界地质公园和世界自然遗产,常年有大量外籍游客持外币入境旅游,现依然存在一定规模以倒卖外汇非法盈利的“外汇黄牛”。“外汇黄牛”利用个人外汇交易隐蔽性强和便利化程度高的特点设法规避监管,在外汇便利化额度内,以频繁更换网点、小额多次实行本外币兑换,规避了单家银行的异常交易监测体系,造成了传统外汇非现场监测手段难以发现和锁定的局面,导致张家界市近13年无“外汇黄牛”查办案例,个人外汇非现场检查手段亟需升级突破。

为此,张家界市分行践行“业技融合”工作机制,将业务经验和历史沉淀数据融入机器学习算法模型,在业务人员研判打标和科技人员分析建模的协同工作模式下,建立“外汇黄牛”专项模型,引入外汇非现场检查工作,开展个人外汇业务异常交易记录学习和预测。科技人员与业务人员共同分析数据,并开展特征提取和特征构造,将历史数据投喂给机器学习算法模型,预测出近期异常交易数据。外汇部门根据模型预测的异常交易记录对相关主体开展进一步核查,发现其确实存在外汇违法违规行为并对之立案查处,总体工作框架如图1所示。

图1 机器学习算法在外汇检查业务实践全流程图

前期准备

1. 数据收集和负面数据标记

此次机器学习算法实践,以个人外汇交易数据为基础,涉及数据共计30021条,其中训练集24147条(历史数据),测试集5874条(近期数据)。业务人员融合所有外汇指定银行报告的异常个人外汇交易记录,对交易数据逐项研判打标,标记负面样本记录28条,负面交易共涉及甲、乙、丙3人。

2. 机器学习模型

选择按照模型类型,机器学习主要分为监督学习模型、半监督学习和无监督学习模型三大类。该批数据的负面标记,主要依据银行报送异常记录,结合外汇业务系统筛查后人为标记,因此是有监督学习模型。在大量的正常个人外汇交易数据中,寻找少量异常数据,明显属于样本不平衡。该类案件真实案例较少,容易出现模型过拟合,需要泛化能力更强的算法。基于以上三点综合考虑,选择xgBoost模型开展机器学习。

3. 数据预处理

一是特征体系构建。“业技融合”专班通过联合分析,对可能判定异常交易的特征都予以保留,并构造了地域特征、近三个月结汇次数、近三个月结汇金额、近三个月结汇业务办理不同网点数等多个特征。

二是业务数据转换。科技部门结合本批数据实际开展数据转换,主要采用标签编码(Label Encoding)和对数变换(Log Transformation)等方法进行数据转换。至此,机器学习前期准备完成。

开展机器学习实践

1. 机器学习模型训练

科技部门将预处理好的数据输入机器学习模型xgBoost,开展训练和预测,为避免影响训练和预测效果,排除两类特征不纳入数据训练范围:第一类是身份证号、标签列等不影响训练预测结果的特征;第二类是交易日期、金融机构标识码等在构造特征中已体现其作用的特征。

在数据训练环节,由xgBoost模型自动生成的特征重要性示意图,与“业技融合”专班研判大致相同,特别是在数据预处理环节构建的数据特征在训练中起到了重要作用。前期业务部门调研发现,疑似“外汇黄牛”个人客户频繁在不同银行网点兑换外币现钞,因此构建了“近三个月结汇业务办理不同网点数”特征,该特征也确被机器学习模型判定为特别重要,具体如图2所示。

图2 各特征重要性评估

2. 机器学习模型预测

开展模型训练效果评估,经过xgBoost模型多轮调参,F1得分为0.9,准确率较高,说明该机器学习模型已具备较好性能。本模型预测产生10条异常交易记录,共涉及丁、戊2人,其中9条异常交易记录指向丁,1条异常交易记录指向戊。

3. 查实模型预测违规主体

根据模型预测结果,张家界市分行外汇部门对丁开展深入调查,发现其有少量多次、多网点跨行办理、兑换总额接近但不超过个人外汇便利化额度等兑换特征,隐蔽性极强,深挖查实其确是“外汇黄牛”。随即对丁立案查处,目前该案已完成行政处罚和罚款收缴。该模型预测的另一个异常交易主体戊,曾在2010年因非法外汇交易被张家界市分行行政处罚,现已纳入持续监测和关注名单。

综上,该机器学习模型预测丁外汇交易异常查证属实,案件的成功办理,也结束了13年来张家界市分行“外汇黄牛”方面0案件的历史,对当地长期以来实行“外汇黄牛”违法行为的隐性群体形成强烈震慑,为进一步推进优化支付服务工作、打造世界一流旅游景点提供了外汇监管保障。

下一步工作计划与建议

1. 推广以人工智能研判外汇交易异常数据的成功经验

随着优化支付服务工作的深入推进和过境免签政策再升级,全省各市州地区不同程度地存在外籍游客入境旅游的情况,其他地区可归纳、构造、共享适合当地实情的业务数据集和规则特征,依托湖南省金融大数据中心的数据能力,形成覆盖全省范围的“外汇黄牛”智能模型,为全省优化支付服务试点推广、持续净化汇兑环境提供有力支撑。

2. 深化数字技术应用

将外汇交易数据分析的模式和经验扩展至其他非现场监管的工作中,发挥湖南省金融大数据中心海量金融数据的优势,在反洗钱、金融稳定、反电诈等领域多头发力,强调数据要素价值的挖掘,推进全省业务履职模式向“数智化”转型。

3. 三是用好“业技融合”工作模式

针对重点、难点履职领域,适时组建相关工作专班,以业务需求驱动体系建设,利用培训交流、联合公关等方式不断壮大人才队伍,形成业务人员知道科技“能做什么”和科技人员知道业务“要做什么”的思维共识,将新兴技术有机融合进日常履职,不断拓展工作方式方法,为建设强大的中央银行提供机制保障。

(此文刊发于《金融电子化》2025年4月下半月刊)

意昂体育