Intetix Foundation(英明泰思基金會(huì))由從事數(shù)據(jù)科學(xué)、非營(yíng)利組織和公共政策研究的中國(guó)學(xué)者發(fā)起成立,致力于通過(guò)數(shù)據(jù)科學(xué)改善人類(lèi)社會(huì)和自然環(huán)境。通過(guò)聯(lián)絡(luò)、動(dòng)員中美最頂尖的數(shù)據(jù)科學(xué)家和社會(huì)科學(xué)家,以及分布在全球的志愿者,我們創(chuàng)造性地踐行著我們的使命:為美好生活洞見(jiàn)數(shù)據(jù)價(jià)值。
當(dāng)你在家卻接到信用卡檢測(cè)中心的電話(huà)詢(xún)問(wèn)你剛剛是否在某個(gè)商場(chǎng)完成支付,而事實(shí)上這個(gè)時(shí)間段你根本沒(méi)有出門(mén),更別說(shuō)買(mǎi)什么昂貴的電器,那么銀行是怎么知道這可能是筆欺詐性交易呢?
正確分辨每筆商業(yè)交易的合法性對(duì)信用卡公司的利益影響巨大。美聯(lián)儲(chǔ)支付研究數(shù)據(jù)表明,2012年美國(guó)公民信用卡交易額達(dá)到262億美元。而同年由于未予授權(quán)的交易所產(chǎn)生的損失大約為61億美元。聯(lián)邦公平信用結(jié)賬法將持卡人的未授權(quán)交易責(zé)任限制在50美元,剩余損失由信用卡公司負(fù)責(zé)。由此可見(jiàn),欺詐性支付對(duì)信用卡公司盈虧的巨大影響。然而,盡管每年信用卡使用點(diǎn)都會(huì)接受?chē)?yán)格的安全審查,仍無(wú)法真正杜絕信用卡欺詐。
對(duì)銀行業(yè)來(lái)說(shuō),風(fēng)險(xiǎn)評(píng)估起著至關(guān)重要的作用。其總目標(biāo)是在造成巨大損失前,快速地判斷其是否為欺詐性質(zhì)。但如何做到這一點(diǎn)?銀行又如何辨別信用卡盜刷呢?
提高檢測(cè)能力
因欺詐性支付過(guò)程的瞬間性,有效的反欺詐從客戶(hù)視角看來(lái)非常神奇的。這看似簡(jiǎn)單且快速的檢測(cè)其實(shí)暗含了一系列復(fù)雜的技術(shù),涉及財(cái)經(jīng),法律及信息科學(xué)。
當(dāng)然,也有一些相對(duì)簡(jiǎn)單的檢測(cè)機(jī)制,無(wú)需太過(guò)先進(jìn)的技術(shù)。例如,當(dāng)信用卡在非常用地區(qū)使用時(shí),無(wú)法提供其正確的郵政編碼將被視為欺詐的指示之一。但得知受害人的郵編十分容易,通常詐騙犯都能夠輕易躲過(guò)這一常規(guī)檢查。
在過(guò)去,反欺詐支付所需的數(shù)據(jù)分析技術(shù)要求大量的人力投入。通過(guò)電腦算法發(fā)現(xiàn)的可疑案例,最終都需經(jīng)過(guò)人工確認(rèn)。現(xiàn)如今,過(guò)于龐大的交易數(shù)量使得信用卡公司更需依賴(lài)于大數(shù)據(jù)分析。機(jī)器學(xué)習(xí)和云計(jì)算等先進(jìn)技術(shù)將提高檢測(cè)欺詐支付的準(zhǔn)確性。
通過(guò)機(jī)器學(xué)習(xí)判斷是否為欺詐
簡(jiǎn)單來(lái)說(shuō),機(jī)器學(xué)習(xí)由計(jì)算機(jī)操控,通過(guò)符合特殊規(guī)則的預(yù)設(shè)過(guò)程且能自我完善的算法。計(jì)算機(jī)會(huì)先從一個(gè)模型開(kāi)始,然后通過(guò)實(shí)驗(yàn)和犯錯(cuò)來(lái)訓(xùn)練它。之后它就可以做出風(fēng)險(xiǎn)預(yù)測(cè),例如預(yù)測(cè)金融交易相關(guān)的風(fēng)險(xiǎn)。
檢測(cè)欺詐的機(jī)器學(xué)習(xí)算法首先需用大量持卡人的正常交易數(shù)據(jù)來(lái)訓(xùn)練。交易序列就是這種訓(xùn)練數(shù)據(jù)的一個(gè)例子,如一個(gè)人通常每周加一次油,每?jī)芍苋ヒ淮纬匈?gòu)物等等。該算法學(xué)習(xí)到這是一個(gè)正常的交易序列。
這種微調(diào)過(guò)程后,我們就可以通過(guò)運(yùn)行算法檢測(cè)信用卡交易,理想情況下能達(dá)到實(shí)時(shí)狀態(tài)。然后算出一個(gè)概率指示交易被欺詐的可能性(例如,97%)。如果將欺詐檢測(cè)系統(tǒng)設(shè)定為阻止任何欺詐概率高于95%的交易,這個(gè)評(píng)估可以在交易發(fā)生時(shí)立即引發(fā)信用卡凍結(jié)。
算法考慮了許多因素來(lái)限定欺詐交易:商家的誠(chéng)信值,持卡人的購(gòu)買(mǎi)行為(包括時(shí)間和地點(diǎn)),IP地址,等。數(shù)據(jù)點(diǎn)越多,結(jié)果越精確。
沒(méi)有人可以在分析成千上萬(wàn)的數(shù)據(jù)的同時(shí)做出判斷,但機(jī)器學(xué)習(xí)可以,它使實(shí)時(shí)檢測(cè)欺詐行為成為可能。
舉一個(gè)典型的例子,當(dāng)你在超市結(jié)賬刷卡時(shí),信用卡公司將會(huì)得到具體交易細(xì)節(jié),如時(shí)間、數(shù)額、商店名與信用卡的年限。這些數(shù)據(jù)會(huì)被提供給已學(xué)習(xí)你的采購(gòu)模式的算法,通過(guò)與許多過(guò)去的采購(gòu)數(shù)據(jù)點(diǎn)比對(duì)來(lái)分析此項(xiàng)交易是否符合你的行為習(xí)慣。
在你的信用卡被使用時(shí),無(wú)論你是身處每周六早晨都會(huì)去的餐廳,還是凌晨3點(diǎn)在兩個(gè)時(shí)區(qū)外的加油站,算法都會(huì)立即知道你在交易,并檢查你的交易行為是否正常。如果信用卡突然在同一天超額預(yù)付兩次,而在歷史數(shù)據(jù)中沒(méi)有這樣使用過(guò)的數(shù)據(jù),這種行為將提高欺詐概率的評(píng)分。如果交易欺詐分值高于某個(gè)閾值,通??焖偃斯徍撕?算法將與銷(xiāo)售點(diǎn)系統(tǒng)聯(lián)系讓它拒絕交易。網(wǎng)上購(gòu)物也會(huì)經(jīng)過(guò)相同的流程。
在這種類(lèi)型的系統(tǒng)中,大量人工干預(yù)成為過(guò)去的事。事實(shí)上,如果一個(gè)人過(guò)于參與欺詐監(jiān)測(cè)周期,那么反應(yīng)時(shí)間會(huì)變得更長(zhǎng)。然而,人工仍然可以發(fā)揮作用——驗(yàn)證欺詐或跟蹤被拒絕的交易。當(dāng)一張卡被多次拒絕交易時(shí),工作人員可以致電持卡人,以決定是否永久取消該卡。
在云端的電腦偵探
大量需處理的金融交易是一個(gè)很重的負(fù)擔(dān),特別是在大數(shù)據(jù)領(lǐng)域。但機(jī)器學(xué)習(xí)就是建立在堆積如山的數(shù)據(jù)上的,更多的信息會(huì)增加算法的準(zhǔn)確性,幫助消除誤報(bào)。合法的交易也會(huì)引發(fā)的可疑交易的誤報(bào),(例如,一個(gè)卡在一個(gè)不常使用的位置)。太多的警報(bào)和沒(méi)有警報(bào)一樣糟糕。
這樣龐大的數(shù)據(jù)需要大量的計(jì)算能力。例如,貝寶(Paypal)無(wú)時(shí)無(wú)刻都在為其1.69億的客戶(hù)處理超過(guò)1.1 pb的數(shù)據(jù)。這些大量的數(shù)據(jù)——1 pb相當(dāng)于超過(guò)20萬(wàn)張dvd的內(nèi)存——這對(duì)算法的機(jī)器學(xué)習(xí)有積極影響,但也會(huì)對(duì)一個(gè)組織的計(jì)算基礎(chǔ)設(shè)施產(chǎn)生很大負(fù)擔(dān)。
這時(shí)就需要云計(jì)算了。遠(yuǎn)程計(jì)算資源可以在這里發(fā)揮著重要的作用。云計(jì)算是可伸縮的,而不會(huì)受限于公司自己的計(jì)算能力。
欺詐檢測(cè)是“正義”與“邪惡”之間的軍備競(jìng)賽。目前,“正義”一方似乎取得很大進(jìn)展,在技術(shù)芯片等方面取得創(chuàng)新,同時(shí)還結(jié)合加密功能,機(jī)器學(xué)習(xí),大數(shù)據(jù)。當(dāng)然,還有云計(jì)算。
而騙子肯定會(huì)繼續(xù)試圖取勝和挑戰(zhàn)欺詐檢測(cè)系統(tǒng)的極限。劇烈變化的支付模式本身是另一個(gè)障礙。你的手機(jī)現(xiàn)在能夠存儲(chǔ)信用卡信息,可以用來(lái)無(wú)線(xiàn)支付,而這將會(huì)引入新的漏洞。幸運(yùn)的是,目前的欺詐檢測(cè)技術(shù)并不受制于支付系統(tǒng)技術(shù)。