您當前的位置:首頁 > 寵物

重新整理ImageNet紀錄,GAN不只會造假!DeepMind用它做影象分類,無監督的戰鬥機

作者:由 量子位 發表于 寵物時間:2022-06-29

栗子 邊策 發自 凹非寺

量子位 報道 | 公眾號 QbitAI

往日,GAN的光芒幾乎全部集中在生成的影象上。

生成不存在的妹子。

重新整理ImageNet紀錄,GAN不只會造假!DeepMind用它做影象分類,無監督的戰鬥機

△ 來自英偉達StyleGAN

生成不存在的老婆。

重新整理ImageNet紀錄,GAN不只會造假!DeepMind用它做影象分類,無監督的戰鬥機

△ 來自英偉達StyleGAN

甚至進化到幫妹子脫衣服的程度。

重新整理ImageNet紀錄,GAN不只會造假!DeepMind用它做影象分類,無監督的戰鬥機

但現在不同了。

DeepMind的兩位大佬,改造了“史上最強”的BigGAN,讓新的演算法去做影象分類,

重新整理了ImageNet無監督表徵學習的紀錄

換句話說,半路出家的

BigBiGAN

,秒殺了一眾專注分類20年的AI選手。

重新整理ImageNet紀錄,GAN不只會造假!DeepMind用它做影象分類,無監督的戰鬥機

△我有主角光環

同時,它生成的影象質量依然優秀。

重新整理ImageNet紀錄,GAN不只會造假!DeepMind用它做影象分類,無監督的戰鬥機

不過,如果你只當它是BigGAN的升級版,就太單純了。

我不叫BigBigGAN

GAN之父Ian Goodfellow幫團隊劃了波重點:

它叫Big

Bi

GAN,不是Big

Big

GAN。

Bi是雙向 (Bidirectional) 的意思,是說它又有編碼器,又有生成器。

我開始也看成BigBig了。

重新整理ImageNet紀錄,GAN不只會造假!DeepMind用它做影象分類,無監督的戰鬥機

那麼,就從這裡開始講原理吧。

給GAN加上編碼器的想法,是從自家前輩

BiGAN

那裡繼承的:

在原始的GAN架構裡,生成器是個前饋對映,從隨機取樣的潛變數 (也叫噪音) ,對映到生成的資料 (假圖) 上面。

而編碼器把真實資料 (真圖) 對映到潛變數上。這樣就有了兩種不同方向的對映,成了雙向GAN。

其實,從前BiGAN也在ImageNet上做過影象分類。但團隊說,BiGAN的生成器是DCGAN裡面的那種,生成不了高質量的影象,這樣編碼器學到的語義就會受影響。

所以,研究人員便決定讓BiGAN的編碼器,和BigGAN的生成器相愛了。

重新整理ImageNet紀錄,GAN不只會造假!DeepMind用它做影象分類,無監督的戰鬥機

但如果只是這樣,並不會幸福的。

別忘了,

判別器

也是GAN的重要部分,它不斷看穿生成器的作品,才讓對方生產的假圖越來越逼真。

而判別器自身就是一個強大的神經網路,團隊希望它可以在“

語義

(Semantic) ”層面強調影象的重構誤差,而不要太在意底層細節。

照這個目標出發,團隊開發了一個“聯合判別器” (

Joint Discriminator

) 。

和普通的判別器不同,它的輸入不只是影象資料 (真圖與假圖) ,而是

影象資料+潛變數

的成對資料。

那麼,它要區分的不是真圖和假圖,而是真圖與潛變數組成的對子 (來自編碼器) ,和假圖與潛變數組成的對子 (來自生成器) 。

雖然,新演算法的名字BigBiGAN,並沒有體現出生成器的獨特,但有了它才是完整的BigBiGAN:

重新整理ImageNet紀錄,GAN不只會造假!DeepMind用它做影象分類,無監督的戰鬥機

那麼,現在來看一下成績吧。

打破ImageNet紀錄

在ImageNet影象分類任務上,BigBiGAN成為了

無監督演算法中的地表最強

重新整理ImageNet紀錄,GAN不只會造假!DeepMind用它做影象分類,無監督的戰鬥機

與現有的監督邏輯迴歸分類器相比,BigBiGAN將ImageNet的top-1準確率提高到了61。3%。

作為一隻合格的GAN,BigBiGAN當然有製造“假照片”的功能。

重新整理ImageNet紀錄,GAN不只會造假!DeepMind用它做影象分類,無監督的戰鬥機

從無監督的BigBiGAN模型中選擇的影象重建的結果。第一行是真實影象;第二行是根據上面影象x的重建影象。

不同於大多數GAN,比如BigGAN那樣畫素級的影象重建,BigBiGAN更重視高層的表徵學習,也就更適合影象分類任務。

論文還寫到,消融實驗證明了:強大的生成模型有助於學習表徵,而強大的推理能力,反過來也能提升大規模生成模型的表現。

重新整理ImageNet紀錄,GAN不只會造假!DeepMind用它做影象分類,無監督的戰鬥機

瞻仰BigBiGAN,論文在此:

https://

arxiv。org/abs/1907。0254

4

前輩BigGAN:

https://

arxiv。org/abs/1809。1109

6

前輩BiGAN:

https://

arxiv。org/abs/1605。0978

2

p。s。全都來自一個團隊喲。

量子位 · QbitAI

վ‘ᴗ’ ի 追蹤AI技術和產品新動態

戳右上角「+關注」獲取最新資訊↗↗

如果喜歡,請分享or點贊吧~比心❤

標簽: BigBiGAN  影象  生成器  GAN  編碼器