从英达美国洗钱说起,美国国税局是用什么模型查税的
Original 2017-02-27 王昉 数据星空
这几天都在说英达在美国洗钱被抓。英达把46万美元,分成50次,每次低于1万美元,在2011年底到2012年初,存进了好几个不同的银行里。结果呢,这都5年了,被“洗钱罪”起诉并认罪了,据说罚款32万美金,Uncle Sam好狠啊。
鉴于之前英达对宋丹丹和儿子巴图的各种mean,什么“树栽在了花盆里”,大家还是看热闹的多。之前周立波美国携带毒品枪支被捕,那据说是路上“蛇行”,被警察看到路上拦下。那英达这次被逮住,恐怕就和“高科技”,“大数据”分不开了。
在美国如果一次性存入银行1万元以上现金,银行和政府就会自动启动检察程序,防止洗钱,偷税漏税等犯罪行为。英达就是知道这种监控机制,才会这么小额存钱的。
先重复一遍英达犯了什么罪吧:
1)违规存款,存款1万元以上必须向政府填表申报,故意分批存,逃避申报。2)隐瞒收入,这46万如果是美国赚的是需要交税的。
3)未声明收入来源,是不是洗钱,钱哪赚的,干嘛要逃避监管。
英达不知道受了什么“高人”指点,小额存钱,逃避监管。从模型的角度上说就是,他知道这个“监管模型”是:大于1万 -> 监管。可他只知其意不知其二啊,国税局的具体模型当然不会对外透露,但是据说也是决策树模型。
各个金融机构的反欺诈模型基本上都差不多。首先是决策树,Logistic regression, neuron network等各种类别预测模型,根据你的收入,年龄,其他个人及家庭信息,资产,申报退税条目,所交税款等各种信息,像一棵树一样一支支分下来。
比方说收入大于20万还是小于20万,大于走一条分支,偷税可能性大,小于走另一条分支,可能性小。分完了,20万以上这条再分,交税小于3万,偷税可能性再增大,不断加入新的信息,一支支分下去。假设说你到了最大可能偷税的那条树枝上了,你基本就等着被查吧。
同时呢,像英达这样密集的存款,虽然每次小于一万,反欺诈模型一般还会监控存款间隔和一段时间内的总存款数的。这么密集的存款,不到半年时间存款数达到几十万美金,很容易触动时间间隔模型和累计存款数模型的红线的。
至于为什么5年前的事情现在才查,首先数据要积累到一定程度才能被模型探测出来,可能他这几年不止这一件事情,累计到现在才跳出来;也有可能模型每次不一定所有人都进模型,人那么多,可能每次都是抽样建模,他到现在才被抽到。