重新整理ImageNet紀錄，GAN不只會造假！DeepMind用它做影象分類，無監督的戰鬥機

作者：由量子位發表于寵物時間：2022-06-29

栗子邊策發自凹非寺

量子位報道 | 公眾號 QbitAI

往日，GAN的光芒幾乎全部集中在生成的影象上。

生成不存在的妹子。

△ 來自英偉達StyleGAN

生成不存在的老婆。

△ 來自英偉達StyleGAN

甚至進化到幫妹子脫衣服的程度。

但現在不同了。

DeepMind的兩位大佬，改造了“史上最強”的BigGAN，讓新的演算法去做影象分類，

重新整理了ImageNet無監督表徵學習的紀錄

。

換句話說，半路出家的

BigBiGAN

，秒殺了一眾專注分類20年的AI選手。

△我有主角光環

同時，它生成的影象質量依然優秀。

不過，如果你只當它是BigGAN的升級版，就太單純了。

我不叫BigBigGAN

GAN之父Ian Goodfellow幫團隊劃了波重點：

它叫Big

GAN，不是Big

Big

GAN。

Bi是雙向（Bidirectional）的意思，是說它又有編碼器，又有生成器。

我開始也看成BigBig了。

那麼，就從這裡開始講原理吧。

給GAN加上編碼器的想法，是從自家前輩

BiGAN

那裡繼承的：

在原始的GAN架構裡，生成器是個前饋對映，從隨機取樣的潛變數（也叫噪音），對映到生成的資料（假圖）上面。

而編碼器把真實資料（真圖）對映到潛變數上。這樣就有了兩種不同方向的對映，成了雙向GAN。

其實，從前BiGAN也在ImageNet上做過影象分類。但團隊說，BiGAN的生成器是DCGAN裡面的那種，生成不了高質量的影象，這樣編碼器學到的語義就會受影響。

所以，研究人員便決定讓BiGAN的編碼器，和BigGAN的生成器相愛了。

但如果只是這樣，並不會幸福的。

別忘了，

判別器

也是GAN的重要部分，它不斷看穿生成器的作品，才讓對方生產的假圖越來越逼真。

而判別器自身就是一個強大的神經網路，團隊希望它可以在“

語義

（Semantic） ”層面強調影象的重構誤差，而不要太在意底層細節。

照這個目標出發，團隊開發了一個“聯合判別器” （

Joint Discriminator

）。

和普通的判別器不同，它的輸入不只是影象資料（真圖與假圖），而是

影象資料+潛變數

的成對資料。

那麼，它要區分的不是真圖和假圖，而是真圖與潛變數組成的對子（來自編碼器），和假圖與潛變數組成的對子（來自生成器）。

雖然，新演算法的名字BigBiGAN，並沒有體現出生成器的獨特，但有了它才是完整的BigBiGAN：

那麼，現在來看一下成績吧。

打破ImageNet紀錄

在ImageNet影象分類任務上，BigBiGAN成為了

無監督演算法中的地表最強

。

與現有的監督邏輯迴歸分類器相比，BigBiGAN將ImageNet的top-1準確率提高到了61。3%。

作為一隻合格的GAN，BigBiGAN當然有製造“假照片”的功能。

從無監督的BigBiGAN模型中選擇的影象重建的結果。第一行是真實影象；第二行是根據上面影象x的重建影象。

不同於大多數GAN，比如BigGAN那樣畫素級的影象重建，BigBiGAN更重視高層的表徵學習，也就更適合影象分類任務。

論文還寫到，消融實驗證明了：強大的生成模型有助於學習表徵，而強大的推理能力，反過來也能提升大規模生成模型的表現。

瞻仰BigBiGAN，論文在此：

https：//

arxiv。org/abs/1907。0254

前輩BigGAN：

https：//

arxiv。org/abs/1809。1109

前輩BiGAN：

https：//

arxiv。org/abs/1605。0978

p。s。全都來自一個團隊喲。

—

完

—

量子位 · QbitAI

վ‘ᴗ’ ի 追蹤AI技術和產品新動態

戳右上角「+關注」獲取最新資訊↗↗

如果喜歡，請分享or點贊吧~比心❤

標簽： BigBiGAN 影象生成器 GAN 編碼器

上一篇:我是養魚初學者，認為上濾的效率是最高的但效果是底濾最好，原因是底濾體積比上濾大很多。這個想法對嗎？

下一篇：有沒有人養黑熊犬或者養過黑熊犬的啊？

重新整理ImageNet紀錄，GAN不只會造假！DeepMind用它做影象分類，無監督的戰鬥機

猜你喜歡

應聘影象演算法崗位的面試心得

CVPR 2020 | 11篇GAN影象轉換img2img 的論文

Google Transformer模型圖文詳解

【論文速遞12-03】影象生成方向優質的論文及其程式碼

草稿紙上的seq2seq模型與Attention機制