3

从一个案例,谈数据分析项目优化

 1 year ago
source link: https://www.woshipm.com/data-analysis/5760796.html
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client

一个数据分析项目,需要怎么搭建、包含哪些内容,才有可能得出有用的结果和建议?在本篇文章里,作者就结合了一个实际案例,对数据分析项目如何做、如何优化等问题分享了他的经验解答,不妨一起来看一下。

Znl5zjdj49okTqBuqFe5.jpg

前言:任何一个数据分析项目,如果想要有所产出,必然要有目标、结论和建议,不然就会流于形式,为分析而分析,久而久之,业务方也不会采用数据分析的建议。

一、分析背景

分析背景应该阐述的是为什么要做这次分析,业务上有哪些问题,本次分析的重点是为了解决这些问题而生的。

比如:本次项目中业务方描述,发现业务在套现方面违规交易频繁,且该风险在A地区发生率尤为严重。因此本次分析着重针对A地址所暴露的问题,结合商户信息和流水情况进行风险分析,给出最终的解决方案或在原来规则基础上的提升方案。并力求能映射到全量数据的防空方案。

二、业务范围与目标

主要说明业务上涵盖哪些业务线,涉及哪些后台业务表,分析涉及的软硬件资源。目标是否有分析报告产出,是否提供新的规则方案,规则上线部署安排等。

如:本次分享涵盖XX公司XX业务渠道的所有数据,涉及业务表XX,数据量XX,时间跨度等(用表格说明)。分析过程在XX平台编写SQL代码完成,针对特征黑样本抽样数据使用EXCEL导出单机完成。产出分析报告。对新的规则进行评估,根据业务沟通安排上线。

三、数据质量情况

描述数据分析过程中数据质量情况已经该质量情况可能造成的影响。

比如:本项目中核查发现交易流水表中的商户未全部包含在商户表中。交易流水表无借贷标识字段,只能通过付款银行字段中credit 标记为信用支付,debit 标记为借记卡支付,但支付卡和微信支付是,有一些字数产品的字符方式,所有并不是所有流水都有借贷标记分类,会对后续借贷规则相关分析产生影响。

四、已有风险规则及评估情况

1)已有规则明细列表,规则运行特定数据的表现情况(命中风险商户数)。

2)第三方黑样本抽样分析情况:抽取样本商户的流水情况,分析流水的金额分布、交易发生时间分布、商户地址信息核实、客户经理发展商户频率等情况。

常见的科工分析的样本主要有三类:

  1. 上游渠道端提供(支付宝、微信等提供的样本);
  2. 规则命中稽核后的样本;
  3. 经验样本(通过sql跑出来的样本)。

3)已有规则命中商户抽样分析:抽取命中商户的一部分,检查其流水情况,根据流水中的付款人、付款金额、借贷支付比例进行分析。

注意流水情况与实际的风险类型对应起来,商户收单业务场景的风险一般有以下5类:

  1. 疑似赌博、色情等非法交易(如非法异地直播也属于这类);
  2. 各类刷单;
  3. 疑似反洗钱相关(平日无流水,突然进行5W以上不合业态的交易);
  4. 交易欺诈(C端单笔交易,如诱导买家支付从中获取,赌博输了以被骗进行投诉)。

从当前整体风险形式来看,“套现”具有一定规模,其他风险相对可控。同时如果有商户门店照片,可重门店照哦片分析。

五、新增规则

说明新增规则的制定一列,逻辑结构,同时可疑阐述规则特征。

如:此次项目根据黑样本的特征情况,结合过往的银行扫码业务分析经验,已经现有规则抽样分析流水情况制定新的规则。规则分为商户监控型和交易监控型两大类,分别从商户和付款人角度进行风险识别,并未每条规则预设对应风险类型。规则如下:

1. 商户监控

1)特殊金额交易连续支付

需排除商品名称为停车、棋牌、网吧,MCC码为8299学校和教育服务等,收款账户X天内1元以下交易>=X笔。对应风险为违规违禁商户/营销坐标/各类刷单等。

抽查该规则命中的商户的交易流水,根据交易流水情况综合判断是否疑似风险,给出此规则的疑似率为X%.

2)其他相似规则

相同交易金额连续支付(违规违禁商户/营销坐标/各类刷单)、特殊金额交易(违禁色情风险)、尾数含特殊金额交易(违规商户/营销坐标/刷单/套现)、大额连续交易(违规商户/套现)、资金借贷比例异常(套现)、借贷笔数比例异常(套现)、借贷金额差异异常(套现)、贷记交易连续多笔异常(套现)、超大额交易(疑似洗钱类商户)、线上异地交易(以借记卡位置,排除套现可能)。

3)其他特殊场景规则

团伙套现(主要是多商户、多人多次重复支付,且门店为统一客户经理明显商户且联号)、虚假高危商户(如同一设备指纹下登录多家商户、法人都相同)、异地交易(无直播牌照异地直播交易、线上非法投资理财公司)。

2. 交易监控型

付款人短时高频交易(违禁商户/营销作弊)、付款人短时多商户高频交易(违禁商户/营销作弊)、付款人支付宝特殊金额交易(花呗套现)、付款人短时内特殊金额交易(各类刷单)、同一商户同一渠道付款人躲避贷记支付(套现)。

3. 其他风险规则结构

当然,如果是事中识别,也可以按其他结构跳转规则,如:通过经营实际与交易流量识别异常;通过异地交易或登录异常方式识别;通过贷记交易异常识别等。结构上也比较合理。

或者整体上从目的出发架构规则,如合规类型规则(针对合规文件)、商户监控(发现可疑商户为主)、交易监控型(监控高危可疑交易)、团伙类型(监控团伙,可与商户监控合并)。

无论哪种规则结构形式,其中比较重要的是,不同业态的特殊情况一定要排除,防止误报。比如冷链生鲜批发就具有夜间高频,单人重复支付;中高端服务如培训机构贷记比例会明显偏高;某些企业实力雄厚,自身运营手段多样,所有往往后将二维码包装后线上适用,造成异地高频收款的情况。

4. 规则特征

规则特征指的是制定规则时从哪些字段维度去刻画规则。一般情况的商户风险规则可通过7大特征进行刻画。如:时间、金额、借贷、地点、C端、B端网络环境、简单关联关系。

六、规则效能对比

1. 优化前后对比

对优化前后各规则的风险覆盖率和疑似率进行对比(用日记规则检出量和抽样数据疑似率进行展示)。

2. 优化后上线主要事项

比如疑似率未经任何核实,仅作参考,实际准确率应低于疑似率。

规则验收是历史数据,上线后是实时数据,随实际变化,商户违规交易手法、商户体量、业务规则都有可能编码,会影响实际结果。

七、风险处置运营建议

一般风险规则上线后,对风险的处置方式是关键,只有形成一套预警、核查、处置、策略调整的基础风险运营体系才能使得风险规则真正发挥风控的作用。

但目前很多银行采用的方式都是刚性一刀切,即发现-处理阶段(主要是反馈问题给客户经理,客户经理说明情况辩解,避重就轻等)。

可以适当丰富管理收单,如增加“警告、限期整个、流量控制等”由轻到中的方式。如对高危交易实时阻断,对套现商户已贷记额度控制,线上核查与线下调查结合。

八、业务优化建议

在分析过程中发现的业务问题,建议优化改进:

1. 商户入网方面

1)个体商户,商户名称为人名,不好判断,建议进件是记录下商户铭牌,照片等。

如XX早餐店,以便于准确账户该商户的具体行业业态。但照片铭牌要反应实际内容,制定规范,便于核查,如“XX公馆服装店”不能为管理者办公室照片,应该是实际生产、经营场所,必须是实景照片。

2)零售MCC行业标记没有细分、不准确,如都标记为5999,零售体量不一样,行业差别大。

  1. 在实际分析中发现名称为“XX区兴国屠宰场XX肉食品经营部”,通过商户名称及内景照片,确认为5422肉类水产商量,但实际登记的类目为MCC5322“机动车、农机零配件批发”;
  2. 登记错误,比如普通百货类的超市或小超市,填写成“仓储型超市”,虽然都是“超市类”但交易实际和交易金额差别交大;
  3. 标准不统一,如XX加油站,某些归为“加油站”类目,有些归入“燃料出售”,有些还带有便利店,归为“便利店”类目。

3)门店无定位信息,无法识别异地交易行为,最好客户经理现场记录门店定位信息(可以通过门店地址识别??),如果商户仅仅只有名称记录,如“曹XX”共发现多家店,但没有照片信息辅助,实在难以判断商户的真实性。

2. 风险管理组织架构

以口碑公司商户风险管理为例,组织架构分以下:

1)管理主线

围绕“识别-决策-管理”主线展开。识别由“支付报-大安全”下的决策中心体重策略合模型支持,风险识别后通过接口形式下发给“口碑”商户风控管理后台,由口碑商户管理中心-商户风险管理部负责风险商户管理,配备各自自动、手动管控方式。

2)辅助部门

口碑商户管理中心-商户审核/服务商管理两个辅助部门,商户审核辅助商户准入的证照标准正常、类目管理运营;服务商管理管理以交易合门店风控信息为基础,管理服务商,此外还有”为业务发展部“辅助结算返佣和财务审计。

3)外部合作部门

口碑商户风险与花呗业务风控业务部门也有业务合作。

4)触达途径

除APP自动渠道外,人工一般通过客户经理连续客户,一种为”口碑客“采用佣金方式激励外部人员巡查门店(验真)。

3. 核查/处置建议

1)摆脱”问题-答复“的反馈模式

目前遇到商户问题,一般将问题反馈至客户经理处,客户经理会极力推脱、辩解、无限解释,沟通时间成本高效果部理想,建议避免”开发式“问答,采用”选择性“问答。如:凭证反馈截止XX时间,过期等同不提供”。

2)控制信息透露范围,避免根据问题造假

如果给客户提供风险特征情况,那么商户就有可能避免该风险去针对性造假,建议无论何种风险一律以”疑似虚假交易“进行沟通。

3)按照行业特征提供证照模板

不同的行业不同特征,如餐饮需要店内经照片和坐席数量。批发行业往来流水资料;泛行业(美容美发、娱乐场所)会有会员资料、充值记录等。

4)分级管理

借鉴行业先进经验,一般教育为主,限权为辅。如从警告限期整改——交易失败——限额限次——调单核查——关店等。技术商可通过灰名单有效时间控制。

5)特例白名单管理

运行特殊情况提前报备、限期白名单等方式处理,

6)关注客户经理可能存在的风险

针对团伙风险的商户,可能直接或间接与客户经理管理。尤其出现集中的照片非现场审核、集中关店等情况。

7)系统优化

建立多维度的黑/灰名单;允许规则免疫失效,防止误判。

本文由 @产品路人甲 原创发布于人人都是产品经理。未经许可,禁止转载

题图来自Unsplash,基于CC0协议

该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务。

给作者打赏,鼓励TA抓紧创作!

About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK