-
歡迎來到北京明(míng)景科技有限公司
聯系我們: 010-82378600, 13911129392
歡迎來到北京明(míng)景科技有限公司
聯系我們: 010-82378600, 13911129392
應用程序“ZAO”火(huǒ)遍社交網絡,但(dàn)其引發的隐私、信息安全問(wèn)題待解。随着機器學習技術(shù)不斷發展以及AI的加持,虛假信息正逐漸影響公共生活。
在IEEE(電氣電子工(gōng)程師(shī)學會)的年(nián)度媒體交流會上(shàng),中科院自(zì)動化研究所副研究員(yuán)、 中國(guó)人(rén)工(gōng)智能(néng)學會理事董晶博士認為(wèi),打破虛假信息面具,“以AI對抗AI”将會是解決方案。
“蓄意與便利的圖像篡改,為(wèi)互聯網數(shù)據的真實性帶來巨大傷害,眼見(jiàn)再不為(wèi)實。”董晶表示,以換臉APP“ZAO”為(wèi)例,雖然開(kāi)發方并未透露其技術(shù)細節, 沒有明(míng)确表示其“換臉” 技術(shù)源自(zì)開(kāi)源的“Deepfakes”,但(dàn)有着強烈的相似性。
據董晶介紹,“Deepfakes”使用了(le)一(yī)種名為(wèi)生成式對抗網絡(GAN) 框架,利用神經網絡學習所用數(shù)據源的統計特征,其中一(yī)個網絡模塊負責生成僞圖,另一(yī)個負責鑒别生成圖片的質量,通(tōng)過對抗博弈的方式不斷進化,達到以假亂真的水平。
相對于傳統“換臉”技術(shù),生成式對抗網絡以機器人(rén)視(shì)覺(CV)為(wèi)基礎,技術(shù)門檻降低(dī),算法上(shàng)也有公開(kāi)的源代碼可(kě)循,數(shù)據庫、訓練模型均可(kě)方便獲得,其訓練結果與機器學習時(shí)間(jiān)長(cháng)短、訓練模型有關。同時(shí),模型依賴數(shù)據自(zì)動學習、自(zì)動生成,無需人(rén)工(gōng)幹預。體現在“Deepfakes”上(shàng),其流程包括對數(shù)據的提取、訓練和(hé)轉換。
近兩年(nián),AI最顯着的應用是在圖像領域,如(rú)人(rén)臉識别、醫(yī)療影像識别等,原因是深度學習在圖像領域首先取得了(le)成功,識别的準确率甚至超過了(le)人(rén)眼,使其完全達到了(le)可(kě)以産業化的水平。
不過,若采用機器深度學習的造假技術(shù)日益遭到濫用,預計将造成重大後果。“由于這(zhè)些技術(shù)都(dōu)利用了(le)生物(wù)信息,而生物(wù)信息本身具有不可(kě)撤銷性,因此它們一(yī)旦被洩露或被濫用,都(dōu)會給用戶帶來嚴峻且永久的後果,甚至會對司法調查、保險鑒定等這(zhè)些嚴肅、敏感的地(dì)帶造成嚴重沖擊。” 董晶說。
以取證為(wèi)例,董晶總結,目前在圖像、視(shì)頻(pín)領域的證據造假呈現兩大趨勢:從(cóng)內(nèi)容編輯轉向內(nèi)容生成,從(cóng)圖像篡改轉向視(shì)頻(pín)篡改。為(wèi)信息安全帶來巨大挑戰。
不過,技術(shù)推動了(le)新造假方式的産生,同時(shí)也提供了(le)打假的新方法。在學界,其中一(yī)種驗證方式是要(yào)求錄制的內(nèi)容必須提供元數(shù)據,元數(shù)據能(néng)顯示錄制的內(nèi)容是何時(shí)何地(dì)以及何種方式被收集的。了(le)解了(le)這(zhè)些信息,如(rú)果發現視(shì)頻(pín)、圖片的某個細節與實際情況不符,就可(kě)以據此判斷虛假信息加以剔除。
董晶通(tōng)過反向利用AI技術(shù),從(cóng)僞造圖片的蛛絲馬迹中辨别真僞信息: “我們首先需要(yào)确定人(rén)類視(shì)覺系統和(hé)計算機視(shì)覺系統在識别特定信息的認知特性、機理與計算方法,進而從(cóng)人(rén)類視(shì)覺系統與計算機視(shì)覺系統的認知差異性出發,通(tōng)過借鑒兩類視(shì)覺系統之間(jiān)的認知以及計算的差異性和(hé)關聯性來鑒别圖像真僞。”
目前,董晶研究通(tōng)過利用AI從(cóng)視(shì)頻(pín)中遠程讀取心率、呼吸頻(pín)率等生理特征, 進而辨别視(shì)頻(pín)中的人(rén)像是真人(rén)還是假人(rén)。在AI的幫助下(xià),原本肉眼無法看(kàn)到的心跳(tiào)、脈搏、呼吸率,也能(néng)以數(shù)據的形式具象化,突破人(rén)眼視(shì)覺的盲區(qū), 從(cóng)而達到深度鑒别的目的。
“要(yào)實現有效利用人(rén)類與計算機二者視(shì)覺系統認知的差異性及關聯性,關鍵難點就是僞造特征的獲取與表達。” 董晶說。
董晶強調,是否能(néng)将僞造特征在視(shì)覺內(nèi)容中有效地(dì)檢測與識别,往往決定了(le)真僞鑒定技術(shù)的可(kě)靠性。然而,僞造特征作(zuò)為(wèi)一(yī)種“微(wēi)弱信号”,很(hěn)多時(shí)候不易被察覺。同時(shí),由于僞造特征長(cháng)期處于不斷變化當中,沒有統一(yī)的模型,這(zhè)些特性都(dōu)給微(wēi)弱信号的捕捉與識别工(gōng)作(zuò)增加了(le)難度。