北京, 2022年12月21日 /美通社/ -- 近日,B站一位開發(fā)者UP主基于開源大模型"源1.0",開發(fā)了一個能夠無障礙進行微信聊天的人工智能"小源",并在與騙子的真實對話場景中進行測試,破解"殺豬盤"詐騙套路,識破詐騙話術,進而加深公眾對詐騙套路的認識,增強公眾的反詐騙意識,減少網(wǎng)絡詐騙受害者。
"殺豬盤"是當下一種交友婚戀類網(wǎng)絡詐騙:詐騙分子利用網(wǎng)絡交友,誘導受害人投資賭博的電信詐騙方式。
詐騙分子準備好人設、交友套路等,通過建立戀愛關系,最后騙取錢財,而他們的目標女性一旦被鎖定,無論最終結果如何,都將"渡劫"。從此類詐騙手段的名稱——"殺豬盤"就能看出,在這場圈套中,目標女性已不再被詐騙分子視為"人",而是渾身洋溢著金錢味道、等待被用感情裝飾的大刀揮下的"豬",目的極其惡劣。
以"殺豬盤"為代表的情感詐騙,不僅給受害者帶來巨大金錢損失,更帶來嚴重感情傷害,甚至屢屢導致自殺事件發(fā)生。
詐騙團伙一般身處境外,偽造身份信息并通過各種社交平臺尋找對象,若要根除這些團伙仍需時間,因此自身防范與識破套路的防御能力就變得尤為重要。
然而"以身試險"代價太大,在這個高科技發(fā)達的時代,能用魔法打敗魔法嗎?
情感詐騙毒瘤"殺豬盤",用黑科技打敗黑魔法
先看下這幾張聊天截圖:
小源是一線城市獨生女,房車雙全,工作體面穩(wěn)定,唯獨愛情還未開花結果,但她在賽博世界遇上了一份緣。
而對面正是一位從事金融行業(yè)的北京男孩,不僅性格爽朗體貼,經(jīng)濟上更是獨立,隨便一個項目就能小賺幾百萬,對她還很熱情。
但都說談錢傷感情,小源也未能幸免,面對投入資金進行共同投資的要求,我拒絕了對方,他因此認為小源沒有和他走下去的心意,后來甚至惡語相加。
很明顯,小源成為了這次殺豬盤的目標,但也不要太為"她"捏把汗。
因為嚴格來講,上述聊天截圖真假參半,真的是:確實在與懷有別樣目的性的男士在文字聊天,假的是:這位女生并非真實人類,而是人工智能。
這是一位開發(fā)者B站up主@圖靈的貓 基于開源預訓練中文模型"源1.0",開發(fā)了一個能夠無障礙進行微信聊天的人工智能"小源",并在與騙子的真實對話場景中進行測試,試著觀察AI如何與騙子斗智斗勇。
為了讓騙子上鉤,@圖靈的貓 在多個社交平臺注冊了賬號,然后根據(jù)反詐中心發(fā)布的受害者畫像,為賬號定位了單身、多金、高學歷乖乖女等身份標簽。果不其然私信爆炸。
AI通過大量學習,能更好地掌握對話規(guī)則,反套路詐騙犯,破解"殺豬盤"詐騙套路,識破詐騙話術,進而加深公眾對詐騙套路的認識,增強公眾的反詐騙意識,減少網(wǎng)絡詐騙受害者。
目前@圖靈的貓已將這一AI反詐項目已在Github上開源:
https://github.com/Turing-Project/AntiFraudChatBot
"殺豬盤"往往是有套路的,AI在對話中,又是如何見招拆招的呢?
當詐騙份子遇上AI:一場各懷心思的文字交鋒
這是一場文字上的交鋒,哪怕是AI上場,所謂的"見招拆招"需要有豐富的語料作為儲備。
本次項目基于的NLP大模型浪潮"源1.0"是浪潮人工智能研究院研發(fā)成功的大規(guī)模中文語言模型,參數(shù)量高達2457億,于2021年9月發(fā)布時即超越此前由美國OpenAI組織研發(fā)的1750億參數(shù)量的英文語言模型GPT-3,成為全球最大規(guī)模的人工智能語言模型。
有了"源1.0"作為智能基礎,開發(fā)者還在對話機制上進行了一些設計,讓AI對話起來更加自然,比如:設定每條信息的回復間隔,模擬真實打字速度(total_len / 10 * 2s)。
萬事具備,就開始交鋒吧。另外,作為一名潛在受害者,小源也并非事先知道哪位找她來聊天的是詐騙犯,"她"將和我們一起在溝通中發(fā)現(xiàn)蛛絲馬跡并進行防御,"她"發(fā)現(xiàn)蛛絲馬跡的過程正是為公眾識別詐騙做出的示范。
當然為了避免誤傷,開發(fā)者設定了一些嚴格的篩選條件,例如人設背景完美但關鍵信息模糊、照片確認為網(wǎng)圖、從事如私募、證券或投行等高端行業(yè)等,滿足這些條件的人才會讓小源接管對話。
之前就提到"殺豬盤"有一套嚴格的詐騙套路,規(guī)范的話術流程,詐騙犯把受害者叫做"豬":
第一步,"找豬"指私加好友。面對小源,詐騙犯也一上來就通過旁敲側擊來打聽女生的現(xiàn)實情況,小源也會根據(jù)對方提供的信息做出反應,一些俏皮玩笑語句輸出,讓對話有來有回。
第二步,"喂豬"指盜用他人優(yōu)質資料包裝自己,灌輸自己很成功、很優(yōu)秀等信息,獲取受害者的信任。
開始了開始了,他開始裝了。沒關系,根據(jù)他給的信息,小源也會給他舞臺,還給對方起了"富哥"作為昵稱,拉進彼此距離。
第三步,"養(yǎng)豬"指戀愛過程,這也是往往受害者放下警惕,交出信任的過程,詐騙犯在這一步都表現(xiàn)得深情款款,試圖讓對話氛圍蜜里調油,并且說一些套路騷話來確認"戀愛關系"。
到了這一步,小源已經(jīng)識別出他是詐騙犯了,那么為了反套路詐騙犯,小源裝作上套,也表示喜歡詐騙犯。
"殺豬盤"其實就是一種規(guī)則化、模式化的對話博弈,詐騙犯本就毫無真心真情,只求在一來一回的對話中讓受害者放低心理防御。在開發(fā)過程中,傳統(tǒng)的無目標導向的"開放域對話"或"詞槽式目的域對話"方案都表現(xiàn)不佳。
與GPT-3不同的是,"源1.0"更加擅長的是零樣本(Zero-Shot)和小樣本(Few-Shot)學習,而非目前更多模型所擅長的微調試學習(finetune)。在中文語言理解評測基準CLUE榜單的零樣本學習(zero-shot)和小樣本學習(few-shot)均取得過總榜第一的成績。
從實際應用效果來看也確實如此,在1~ 3個,甚至只有1個合適example的示范下,模型就可以實現(xiàn)開發(fā)者希望達到的"對話策略",比如反套路、用語料拋梗等等,讓AI看起來能夠對騙子具備識別能力,本質上這也是一種query->value的查詢匹配。
而開發(fā)者在本次項目中,example語料主要抽取自B站和貼吧的熱門評論,一來因為評論是天然的對話形式,有顯式的回復與被回復關系;二來自古評論出人才,一些金句和??梢园讶藱C對話變得不那么生硬,就像"富哥V5"、"小黑子,露出雞腳了吧",以及"喵"、"捏"都是頗具網(wǎng)感的語句和語氣助詞。
具體語料經(jīng)過人工篩選,過濾不當言論,再處理成prompt格式。 以下是Prompt Example的生成樣例:
第四步,"殺豬"指欺詐過程。這是詐騙犯的終極目標,于他們而講,能不能成就這一哆嗦了,而對受害者來說,這也是涉及財產(chǎn)有無損失的關鍵一步。
在這個項目里,詐騙犯在循序漸進、有意無意地總是提到一個利潤率很高的項目,試圖給對方留下高回報率的印象。
這是一個連環(huán)計,這時候就要考驗到AI的記憶力了。由于微信聊天是多輪對話,AI有時并不記得自己或對方上一句說過什么。
"源1.0"具備記憶能力,開發(fā)者同時參考了LSTM的思想,為系統(tǒng)增加了記憶機制,具體機制如下:
聊天記錄放入記憶區(qū),在每次回復時計算相似度,超過相似度閾值的歷史對話將被AI讀取使用;并且設定遺忘窗口M,超過M/2輪次的對話將被pop() 這樣,AI就能夠實現(xiàn)簡單的長短期對話記憶,比如昨天聊過的內(nèi)容或上一輪對話內(nèi)容。
帶著這樣的記憶,當過了兩天當詐騙犯再試圖和小源聊天時。小源也順著對方問出了"在哪里可以買到"的話:
當然,聊歸聊,開發(fā)在進行開發(fā)時就給小源加上了"思想鋼印"——凡是涉及投資理財、引導資金投入的都是詐騙。
哪怕是面對詐騙犯的威逼利誘,小源依然不為所動,堅持聲稱自己沒有錢,并提出向詐騙犯借錢。
到了后來,AI直接金蟬脫殼來一波反殺,面對PUA話術和挑釁行為,直接點出對方違法要求和"她"去警局自首,反將一軍。
AI向善,感性與創(chuàng)新引導下的理性應用
據(jù)開發(fā)者@圖靈的貓介紹,對話中的這位Henry騙子哥,只是主動找上"小源"的其中一位聊天對象,還有13位"嫌疑詐騙分子",這個數(shù)字還是在開發(fā)者已經(jīng)進行了一波篩選之后。
小源完美的待嫁單身女生形象,吸引了無數(shù)人,私信爆炸。可以想象,同樣條件的人類女生在社交網(wǎng)站上是多么危機四伏,隨時都可能成為受害對象。
人類和AI的最大不同在于,多數(shù)時候人類的感性是占據(jù)上風的,做不到AI那樣的絕對理性,所以才會不知不覺間落入圈套。
但正是這樣感性的驅動下,AI在我們?nèi)粘Ia(chǎn)生活所發(fā)揮的空間才無窮,因為人工智能等先進技術的本質仍是工具,而工具所謂的善惡傾向則取決于人類的出發(fā)點。
就如同@圖靈的貓 這樣的開發(fā)者因為身邊有遇到過殺豬盤的朋友們,進而義憤填膺基于"源1.0"大模型開發(fā)出AI反詐"工具人"小源,提醒廣大女性提高警惕性,注意防范網(wǎng)絡上的陌生人。
人類善用AI的智慧定會勝過日益強大的AI技術。
如今,人工智能已經(jīng)從點到面滲透到更多行業(yè)、更多領域的各類場景,創(chuàng)新不斷。作為通用的巨量中文AI模型,"源1.0"具備優(yōu)秀的自然語言理解和自然語言生成的能力,可以作為新一代認知智能的引擎,適應廣泛的下游AI任務,自開源問世以來,不少開發(fā)者和相關機構都基于此進行了諸多創(chuàng)新應用。
"源1.0"可以完成各種風格、類型文本的生成,如新聞資訊、金融行研、辦公公文、法律文書、廣告營銷、網(wǎng)絡文學、詩詞歌賦、食譜菜譜等。
超1000家用戶,采用"源1.0"提供的數(shù)據(jù)和API顯著提升了金融、互聯(lián)網(wǎng)、醫(yī)療和自動駕駛等行業(yè)應用的精度;
源1.0已經(jīng)與多個行業(yè)用戶開展深度合作,支持手機智能語音助手、大型互聯(lián)網(wǎng)翻譯平臺等應用的AI智能化升級……
除了這些相對"常規(guī)"的操作,不少開源社區(qū)的開發(fā)者們通過源1.0的開放開源平臺進行了創(chuàng)意實現(xiàn)。
在文娛方面,一群來自上海學生開發(fā)者創(chuàng)作的"AI劇本殺"就是其中代表,曾在GitHub引發(fā)熱烈討論。
Github鏈接:https://github.com/bigbrother666sh/shezhangbujianle
在心理輔導方面,自香港浸會大學社會工作系副教授 陳智達教授負責的運用AI模擬求助者支援社會服務工作者培訓項目。
在上述案例中,AI在不同領域以意想不到的方式發(fā)揮著自己的潛力,也幫助著訴求不同的開發(fā)者們拓寬創(chuàng)新的邊界。這些創(chuàng)新想法或許早就出現(xiàn)在他們富有想象力的腦海中,而將"靈光乍現(xiàn)"變成可實現(xiàn)、可落地的應用,很大程度上需歸功于外部技術環(huán)境的變化,例如,如今以"源1.0"為代表的大模型已經(jīng)成為人工智能算法基礎設施,正在普惠千行百業(yè)。
事實上,創(chuàng)新往往并非無中生有的頓悟,而是某一領域發(fā)展到一定階段、厚積薄發(fā)的涌現(xiàn),技術是向善的工具,亦是創(chuàng)新萌發(fā)的沃土。