《個(gè)人信息保護(hù)法》促金融機(jī)構(gòu)規(guī)范數(shù)據(jù)共享 隱私計(jì)算如何構(gòu)筑數(shù)據(jù)“合規(guī)交互”新體系
2021年11月,《個(gè)人信息保護(hù)法》(下稱《個(gè)保法》)正式施行,給銀行等金融機(jī)構(gòu)數(shù)據(jù)交流帶來(lái)了新挑戰(zhàn)。
“銀行機(jī)構(gòu)之間直接分享彼此用戶數(shù)據(jù)聯(lián)合建模,肯定是行不通的。”一位銀行IT部門負(fù)責(zé)人向記者直言。過(guò)去一年,隱私計(jì)算技術(shù)在銀行機(jī)構(gòu)之間迅速普及,金融機(jī)構(gòu)在嚴(yán)格遵守《個(gè)保法》相關(guān)規(guī)定的前提下,不斷通過(guò)脫敏數(shù)據(jù)的深度挖掘,持續(xù)完善自身的風(fēng)控體系與精準(zhǔn)營(yíng)銷模型。
所謂隱私計(jì)算,主要由差分隱私、同態(tài)加密、多方安全計(jì)算、零知識(shí)證明、可信執(zhí)行環(huán)境、聯(lián)邦學(xué)習(xí)等技術(shù)組成,即在相關(guān)個(gè)人數(shù)據(jù)不流出銀行等金融機(jī)構(gòu)端的情況下,由雙方提供大量脫敏化、結(jié)構(gòu)化數(shù)據(jù),憑借各自的大數(shù)據(jù)分析能力進(jìn)一步完善用戶畫像,從而助力彼此提升信貸風(fēng)控與精準(zhǔn)營(yíng)銷效率。
“隱私計(jì)算技術(shù)的核心,就是銀行、持牌消費(fèi)金融機(jī)構(gòu)等在不知道客戶具體敏感信息的情況下,使用大數(shù)據(jù)分析等技術(shù),對(duì)這些脫敏化、結(jié)構(gòu)化數(shù)據(jù)進(jìn)行比較驗(yàn)證,結(jié)合自身對(duì)客戶消費(fèi)行為、消費(fèi)特征的數(shù)據(jù)積累與洞察,從而判斷出脫敏化、結(jié)構(gòu)化數(shù)據(jù)背后的客戶是誰(shuí)。”上述銀行IT部門負(fù)責(zé)人告訴記者。目前,他們與某些持牌消費(fèi)金融機(jī)構(gòu)的隱私計(jì)算技術(shù)合作初見成效,盡管無(wú)法獲取某些客戶的敏感信息,但通過(guò)隱私計(jì)算技術(shù),仍能精準(zhǔn)掌握不同類型客群的消費(fèi)行為、消費(fèi)特征與風(fēng)控重點(diǎn),優(yōu)化信貸風(fēng)控模型,逾期率較去年有明顯下降。
多方安全計(jì)算緣何“受青睞”?
21世紀(jì)經(jīng)濟(jì)報(bào)道記者了解到,隨著《個(gè)保法》的實(shí)施,當(dāng)前隱私計(jì)算技術(shù)在金融機(jī)構(gòu)的主要應(yīng)用,主要體現(xiàn)在兩大場(chǎng)景:
一是聯(lián)合風(fēng)控,即銀行、持牌消費(fèi)金融機(jī)構(gòu)通過(guò)融合多個(gè)機(jī)構(gòu)數(shù)據(jù),解決單個(gè)金融機(jī)構(gòu)數(shù)據(jù)量有限,但又不能無(wú)序交換個(gè)人隱私數(shù)據(jù)等問題。此外,越來(lái)越多銀行與持牌消費(fèi)金融機(jī)構(gòu)還在積極探索整合其他行業(yè)數(shù)據(jù),在各方原始數(shù)據(jù)不出庫(kù)的前提下建立風(fēng)控模型,形成多維度的數(shù)據(jù)分析,持續(xù)提升風(fēng)控質(zhì)量。目前,隱私計(jì)算在信息核驗(yàn)環(huán)節(jié),可以實(shí)現(xiàn)多方黑名單數(shù)據(jù)共享,銀行等金融機(jī)構(gòu)可以對(duì)騙貸、詐騙等行為的黑名單用戶進(jìn)行匿蹤查詢,提升信息查詢的安全可信程度。
二是聯(lián)合營(yíng)銷。目前,銀行、持牌消費(fèi)金融機(jī)構(gòu)正積極借助政務(wù)、通信運(yùn)營(yíng)商、互聯(lián)網(wǎng)平臺(tái)等外部數(shù)據(jù),在不輸出原始數(shù)據(jù)的基礎(chǔ)上,且滿足《個(gè)保法》相關(guān)個(gè)人數(shù)據(jù)保護(hù)的要求下,實(shí)現(xiàn)更精準(zhǔn)的用戶客群分類,制定更精準(zhǔn)的營(yíng)銷策略。目前比較流行的做法,是銀行結(jié)合電商、政務(wù)等平臺(tái)提供的消費(fèi)、出行等數(shù)據(jù),更精準(zhǔn)地識(shí)別目標(biāo)客戶,拓展理財(cái)或信貸業(yè)務(wù)。
馬上消費(fèi)副總經(jīng)理兼首席信息官蔣寧告訴記者,當(dāng)前持牌消費(fèi)金融公司風(fēng)控業(yè)務(wù)主要面臨兩大痛點(diǎn):一是隨著業(yè)務(wù)條線不斷豐富,風(fēng)控部門面臨數(shù)據(jù)維度缺乏、數(shù)據(jù)量不足等問題,客戶留存的數(shù)據(jù)日益難以滿足風(fēng)控需求;二是當(dāng)借助外部數(shù)據(jù)優(yōu)化風(fēng)控模型時(shí),由于數(shù)據(jù)安全保護(hù)要求,機(jī)構(gòu)之間的數(shù)據(jù)融合壁壘較高,數(shù)據(jù)交互難度很大。
“針對(duì)上述痛點(diǎn),我們研發(fā)基于隱私計(jì)算的多方安全計(jì)算平臺(tái),在充分滿足《個(gè)保法》相關(guān)個(gè)人隱私數(shù)據(jù)保護(hù)規(guī)定的情況下,融合多方數(shù)據(jù)開展聯(lián)合分析,實(shí)現(xiàn)風(fēng)控模型性能的持續(xù)優(yōu)化提升。”蔣寧向記者透露,在具體實(shí)踐過(guò)程中,馬上消費(fèi)正積極探索聯(lián)合工商、稅務(wù)、社保、互聯(lián)網(wǎng)平臺(tái)等多維度數(shù)據(jù),優(yōu)化提升風(fēng)控模型效果,即在多方不共享數(shù)據(jù)的前提下,先確認(rèn)共有的交集用戶,再對(duì)共有樣本的原始數(shù)據(jù)進(jìn)行特征加工,進(jìn)而在滿足隱私保護(hù)的前提下融合多方特征,構(gòu)建邏輯回歸算法和XGBoost算法,最終優(yōu)化信貸用戶評(píng)分卡模型。
他指出,相比單獨(dú)建模,目前馬上消費(fèi)通過(guò)隱私計(jì)算技術(shù)構(gòu)建的風(fēng)控模型預(yù)測(cè)指標(biāo)提升了5%-10%,可以更準(zhǔn)確識(shí)別風(fēng)險(xiǎn)。
記者多方了解到,在隱私計(jì)算技術(shù)實(shí)際應(yīng)用過(guò)程中,不少銀行還面臨技術(shù)路線抉擇難題。
多位銀行IT部門人士告訴記者,目前他們主要選擇多方安全計(jì)算技術(shù),即在各方不泄露各自輸入數(shù)據(jù)的前提下,多方協(xié)同進(jìn)行數(shù)據(jù)分析處理,將數(shù)據(jù)處理結(jié)果廣泛應(yīng)用在聯(lián)合統(tǒng)計(jì)、聯(lián)合查詢、聯(lián)合建模、聯(lián)合預(yù)測(cè)等金融場(chǎng)景。
究其原因,多方安全計(jì)算技術(shù)通用性與安全性相對(duì)較高,且技術(shù)路線相對(duì)成熟,盡管這項(xiàng)技術(shù)對(duì)計(jì)算與網(wǎng)絡(luò)資源的要求也相當(dāng)高,但多數(shù)銀行認(rèn)為目前他們的IT能力與業(yè)務(wù)需求,足以應(yīng)對(duì)多方安全計(jì)算的網(wǎng)絡(luò)資源要求。
相比而言,不少銀行對(duì)聯(lián)邦學(xué)習(xí)與可信執(zhí)行環(huán)境等技術(shù)仍持觀望態(tài)度。這背后,是這兩項(xiàng)全新的隱私計(jì)算技術(shù)在通用性、硬件支持等方面未能達(dá)到銀行要求。
以聯(lián)邦學(xué)習(xí)為例,盡管聯(lián)邦學(xué)習(xí)(Federated Learning,F(xiàn)L)可以實(shí)現(xiàn)在各方機(jī)器學(xué)習(xí)原始數(shù)據(jù)不出庫(kù)的情況下,通過(guò)對(duì)數(shù)據(jù)的加密流通與處理來(lái)完成多方機(jī)器學(xué)習(xí)模型訓(xùn)練,且AI人工智能學(xué)習(xí)模型訓(xùn)練與預(yù)測(cè)效果頗佳,但由于它的通用性相對(duì)較差,目前不少銀行仍然不愿過(guò)多引入這項(xiàng)技術(shù)。
可信執(zhí)行環(huán)境(Trusted Execution Environment,TEE)則通過(guò)在中央處理器中構(gòu)建一個(gè)安全的區(qū)域,保證區(qū)域內(nèi)的程序和數(shù)據(jù)的機(jī)密性和完整性。盡管這項(xiàng)技術(shù)通用性頗高且計(jì)算性能不錯(cuò),但由于它需要高度信任的硬件廠商,且目前某些芯片硬件供應(yīng)“遇阻”,眾多銀行也不敢輕易嘗試。
蔣寧表示,基于上述考量,馬上消費(fèi)決定構(gòu)建基于開源軟件框架打造的多方安全計(jì)算平臺(tái),先確保技術(shù)相對(duì)自主可控,再根據(jù)金融行業(yè)標(biāo)準(zhǔn)進(jìn)行研發(fā),有助于金融平臺(tái)的互聯(lián)互通,進(jìn)而形成標(biāo)準(zhǔn)化的功能應(yīng)用。
“我們的做法,是讓這個(gè)多方安全計(jì)算平臺(tái)采用分布式架構(gòu),實(shí)現(xiàn)技術(shù)能力與應(yīng)用服務(wù)的解耦,支持自定義算法,既能有效滿足《個(gè)保法》對(duì)個(gè)人數(shù)據(jù)規(guī)范采集使用的要求,又能更好地滿足多元業(yè)務(wù)場(chǎng)景的需求。此外,這個(gè)多方安全計(jì)算平臺(tái)還將逐步促進(jìn)馬上消費(fèi)與眾多合作方開展安全合規(guī)的數(shù)據(jù)合作,為億級(jí)注冊(cè)用戶提供安全可靠的信貸服務(wù)。”他指出。
隱私計(jì)算普及的四大新挑戰(zhàn)
記者了解到,盡管隱私計(jì)算技術(shù)的普及,很大程度解決《個(gè)保法》要求下的金融機(jī)構(gòu)之間數(shù)據(jù)交流合規(guī)問題,但隱私計(jì)算技術(shù)在安全、性能、互聯(lián)互通等方面仍存在不小挑戰(zhàn)。
首先,隱私計(jì)算技術(shù)的安全性有待于進(jìn)一步提升。由于隱私計(jì)算涉及的算法多樣,但其安全基礎(chǔ)通常都會(huì)設(shè)定一些假設(shè),以此為基礎(chǔ)進(jìn)行安全算法設(shè)計(jì)。比如假設(shè)多方計(jì)算的各參與方都嚴(yán)格遵守協(xié)議流程、假設(shè)各參與方之間不產(chǎn)生共謀、假設(shè)硬件提供商完全可信等。但在實(shí)際情況下,這些假設(shè)未必都成立。與此同時(shí),隱私計(jì)算技術(shù)在產(chǎn)品化過(guò)程中,不可避免會(huì)產(chǎn)生系統(tǒng)安全風(fēng)險(xiǎn),由于隱私計(jì)算產(chǎn)品的安全要求較高,系統(tǒng)安全薄弱環(huán)節(jié)將最易被攻擊。
其次,隱私計(jì)算技術(shù)應(yīng)用仍需更大的計(jì)算和通信負(fù)載。目前,大規(guī)模應(yīng)用隱私計(jì)算普遍面臨計(jì)算和網(wǎng)絡(luò)負(fù)載的限制。例如通過(guò)隱私計(jì)算聯(lián)合建模的耗時(shí)是傳統(tǒng)機(jī)器學(xué)習(xí)的數(shù)十倍甚至數(shù)百倍,且隱私計(jì)算意味著多方同步計(jì)算,某一方計(jì)算或通信資源的瓶頸將直接限制整個(gè)計(jì)算平臺(tái)的性能。
第三,各方安全共識(shí)仍難以形成。隱私計(jì)算實(shí)際是讓多個(gè)參與方在安全共識(shí)下開展多方計(jì)算。但是,參與者很難直觀驗(yàn)證各方的安全性,當(dāng)前也缺少隱私計(jì)算安全分級(jí)標(biāo)準(zhǔn),實(shí)際應(yīng)用場(chǎng)景下的各方安全共識(shí)通常難以達(dá)成。
第四,不同產(chǎn)品之間很難互聯(lián)互通。每一個(gè)隱私計(jì)算應(yīng)用方都面臨著與不同機(jī)構(gòu)多方計(jì)算的問題,但各方部署的隱私計(jì)算平臺(tái)可能基于特定的算法和設(shè)計(jì)實(shí)現(xiàn),平臺(tái)間很難完成信息的交互,導(dǎo)致重復(fù)建設(shè)和成本浪費(fèi)。因此互聯(lián)互通正成為隱私計(jì)算技術(shù)普及所面臨的最大挑戰(zhàn)。
蔣寧告訴記者,目前眾多銀行與持牌消費(fèi)金融機(jī)構(gòu)都在加大隱私計(jì)算技術(shù)軟硬件研發(fā)投入,力爭(zhēng)盡早解決上述挑戰(zhàn)。其中包括通過(guò)軟硬件優(yōu)化加速提升隱私計(jì)算可用性,促進(jìn)隱私計(jì)算與區(qū)塊鏈、同態(tài)加密、差分隱私等多種技術(shù)互相融合,推動(dòng)隱私計(jì)算行業(yè)生態(tài)的融合發(fā)展等。
“可以預(yù)見的是,隱私計(jì)算將成為金融行業(yè)數(shù)字化轉(zhuǎn)型的關(guān)鍵一環(huán),助力構(gòu)建更加開放的金融生態(tài),促進(jìn)中國(guó)金融行業(yè)高質(zhì)量發(fā)展。”蔣寧指出。
記者還獲悉,為了促進(jìn)隱私計(jì)算技術(shù)在聯(lián)合風(fēng)控建模與精準(zhǔn)營(yíng)銷等金融場(chǎng)景獲得更好的應(yīng)用成效,越來(lái)越多銀行正加大與隱私計(jì)算技術(shù)研發(fā)平臺(tái)的技術(shù)合作。目前,銀行要么直接采購(gòu)隱私計(jì)算技術(shù)產(chǎn)品或解決方案,從而實(shí)現(xiàn)基于《個(gè)保法》規(guī)定的數(shù)據(jù)共享交流分析操作,要么付費(fèi)獲取這些隱私計(jì)算技術(shù)研發(fā)平臺(tái)的數(shù)據(jù)流通服務(wù)。
一位股份制銀行IT部門人士向記者透露,此前他們也曾考慮第二種操作模式,因?yàn)楹笳叩氖褂贸杀鞠鄬?duì)較低,但管理層再三權(quán)衡,認(rèn)為第一種操作模式更能令銀行符合《個(gè)保法》相關(guān)要求。
據(jù)畢馬威KPMG《隱私計(jì)算行業(yè)研究報(bào)告》預(yù)測(cè),隨著越來(lái)越多銀行、持牌消費(fèi)金融機(jī)構(gòu)等金融機(jī)構(gòu)積極引入隱私計(jì)算技術(shù),三年后這項(xiàng)技術(shù)服務(wù)營(yíng)收或?qū)⑦_(dá)到100億-200億元人民幣。
(21世紀(jì)經(jīng)濟(jì)報(bào)道記者 陳植 上海報(bào)道 統(tǒng)籌:馬春園)
主管單位:中國(guó)反腐敗司法研究中心
主辦單位:企業(yè)廉潔合規(guī)研究基地
學(xué)術(shù)支持:湘潭大學(xué)紀(jì)檢監(jiān)察研究院
技術(shù)支持:湖南紅網(wǎng)新媒科技發(fā)展有限公司