利用AI技術(shù)識别視(shì)頻(pín)圖像真僞信息-北京明(míng)景科技行(xíng)業新聞-北京明(míng)景科技 - 視(shì)頻(pín)偵查|影像鑒定|火(huǒ)災調查|視(shì)頻(pín)勘察|

利用AI技術(shù)識别視(shì)頻(pín)圖像真僞信息

2020/05/15

應用程序“ZAO”火(huǒ)遍社交網絡，但(dàn)其引發的隐私、信息安全問(wèn)題待解。随着機器學習技術(shù)不斷發展以及AI的加持，虛假信息正逐漸影響公共生活。

在IEEE（電氣電子工(gōng)程師(shī)學會）的年(nián)度媒體交流會上(shàng)，中科院自(zì)動化研究所副研究員(yuán)、中國(guó)人(rén)工(gōng)智能(néng)學會理事董晶博士認為(wèi)，打破虛假信息面具，“以AI對抗AI”将會是解決方案。

“蓄意與便利的圖像篡改，為(wèi)互聯網數(shù)據的真實性帶來巨大傷害，眼見(jiàn)再不為(wèi)實。”董晶表示，以換臉APP“ZAO”為(wèi)例，雖然開(kāi)發方并未透露其技術(shù)細節，沒有明(míng)确表示其“換臉” 技術(shù)源自(zì)開(kāi)源的“Deepfakes”，但(dàn)有着強烈的相似性。

據董晶介紹，“Deepfakes”使用了(le)一(yī)種名為(wèi)生成式對抗網絡（GAN）框架，利用神經網絡學習所用數(shù)據源的統計特征，其中一(yī)個網絡模塊負責生成僞圖，另一(yī)個負責鑒别生成圖片的質量，通(tōng)過對抗博弈的方式不斷進化，達到以假亂真的水平。

相對于傳統“換臉”技術(shù)，生成式對抗網絡以機器人(rén)視(shì)覺（CV）為(wèi)基礎，技術(shù)門檻降低(dī)，算法上(shàng)也有公開(kāi)的源代碼可(kě)循，數(shù)據庫、訓練模型均可(kě)方便獲得，其訓練結果與機器學習時(shí)間(jiān)長(cháng)短、訓練模型有關。同時(shí)，模型依賴數(shù)據自(zì)動學習、自(zì)動生成，無需人(rén)工(gōng)幹預。體現在“Deepfakes”上(shàng)，其流程包括對數(shù)據的提取、訓練和(hé)轉換。

近兩年(nián)，AI最顯着的應用是在圖像領域，如(rú)人(rén)臉識别、醫(yī)療影像識别等，原因是深度學習在圖像領域首先取得了(le)成功，識别的準确率甚至超過了(le)人(rén)眼，使其完全達到了(le)可(kě)以産業化的水平。

不過，若采用機器深度學習的造假技術(shù)日益遭到濫用，預計将造成重大後果。“由于這(zhè)些技術(shù)都(dōu)利用了(le)生物(wù)信息，而生物(wù)信息本身具有不可(kě)撤銷性，因此它們一(yī)旦被洩露或被濫用，都(dōu)會給用戶帶來嚴峻且永久的後果，甚至會對司法調查、保險鑒定等這(zhè)些嚴肅、敏感的地(dì)帶造成嚴重沖擊。” 董晶說。

以取證為(wèi)例，董晶總結，目前在圖像、視(shì)頻(pín)領域的證據造假呈現兩大趨勢：從(cóng)內(nèi)容編輯轉向內(nèi)容生成，從(cóng)圖像篡改轉向視(shì)頻(pín)篡改。為(wèi)信息安全帶來巨大挑戰。

不過，技術(shù)推動了(le)新造假方式的産生，同時(shí)也提供了(le)打假的新方法。在學界，其中一(yī)種驗證方式是要(yào)求錄制的內(nèi)容必須提供元數(shù)據，元數(shù)據能(néng)顯示錄制的內(nèi)容是何時(shí)何地(dì)以及何種方式被收集的。了(le)解了(le)這(zhè)些信息，如(rú)果發現視(shì)頻(pín)、圖片的某個細節與實際情況不符，就可(kě)以據此判斷虛假信息加以剔除。

董晶通(tōng)過反向利用AI技術(shù)，從(cóng)僞造圖片的蛛絲馬迹中辨别真僞信息： “我們首先需要(yào)确定人(rén)類視(shì)覺系統和(hé)計算機視(shì)覺系統在識别特定信息的認知特性、機理與計算方法，進而從(cóng)人(rén)類視(shì)覺系統與計算機視(shì)覺系統的認知差異性出發，通(tōng)過借鑒兩類視(shì)覺系統之間(jiān)的認知以及計算的差異性和(hé)關聯性來鑒别圖像真僞。”

目前，董晶研究通(tōng)過利用AI從(cóng)視(shì)頻(pín)中遠程讀取心率、呼吸頻(pín)率等生理特征，進而辨别視(shì)頻(pín)中的人(rén)像是真人(rén)還是假人(rén)。在AI的幫助下(xià)，原本肉眼無法看(kàn)到的心跳(tiào)、脈搏、呼吸率，也能(néng)以數(shù)據的形式具象化，突破人(rén)眼視(shì)覺的盲區(qū)，從(cóng)而達到深度鑒别的目的。

“要(yào)實現有效利用人(rén)類與計算機二者視(shì)覺系統認知的差異性及關聯性，關鍵難點就是僞造特征的獲取與表達。” 董晶說。

董晶強調，是否能(néng)将僞造特征在視(shì)覺內(nèi)容中有效地(dì)檢測與識别，往往決定了(le)真僞鑒定技術(shù)的可(kě)靠性。然而，僞造特征作(zuò)為(wèi)一(yī)種“微(wēi)弱信号”，很(hěn)多時(shí)候不易被察覺。同時(shí)，由于僞造特征長(cháng)期處于不斷變化當中，沒有統一(yī)的模型，這(zhè)些特性都(dōu)給微(wēi)弱信号的捕捉與識别工(gōng)作(zuò)增加了(le)難度。

利用AI技術(shù)識别視(shì)頻(pín)圖像真僞信息

導航

熱(rè)門Tags