重新整理ImageNet紀錄,GAN不只會造假!DeepMind用它做影象分類,無監督的戰鬥機
栗子 邊策 發自 凹非寺
量子位 報道 | 公眾號 QbitAI
往日,GAN的光芒幾乎全部集中在生成的影象上。
生成不存在的妹子。
△ 來自英偉達StyleGAN
生成不存在的老婆。
△ 來自英偉達StyleGAN
甚至進化到幫妹子脫衣服的程度。
但現在不同了。
DeepMind的兩位大佬,改造了“史上最強”的BigGAN,讓新的演算法去做影象分類,
重新整理了ImageNet無監督表徵學習的紀錄
。
換句話說,半路出家的
BigBiGAN
,秒殺了一眾專注分類20年的AI選手。
△我有主角光環
同時,它生成的影象質量依然優秀。
不過,如果你只當它是BigGAN的升級版,就太單純了。
我不叫BigBigGAN
GAN之父Ian Goodfellow幫團隊劃了波重點:
它叫Big
Bi
GAN,不是Big
Big
GAN。
Bi是雙向 (Bidirectional) 的意思,是說它又有編碼器,又有生成器。
我開始也看成BigBig了。
那麼,就從這裡開始講原理吧。
給GAN加上編碼器的想法,是從自家前輩
BiGAN
那裡繼承的:
在原始的GAN架構裡,生成器是個前饋對映,從隨機取樣的潛變數 (也叫噪音) ,對映到生成的資料 (假圖) 上面。
而編碼器把真實資料 (真圖) 對映到潛變數上。這樣就有了兩種不同方向的對映,成了雙向GAN。
其實,從前BiGAN也在ImageNet上做過影象分類。但團隊說,BiGAN的生成器是DCGAN裡面的那種,生成不了高質量的影象,這樣編碼器學到的語義就會受影響。
所以,研究人員便決定讓BiGAN的編碼器,和BigGAN的生成器相愛了。
但如果只是這樣,並不會幸福的。
別忘了,
判別器
也是GAN的重要部分,它不斷看穿生成器的作品,才讓對方生產的假圖越來越逼真。
而判別器自身就是一個強大的神經網路,團隊希望它可以在“
語義
(Semantic) ”層面強調影象的重構誤差,而不要太在意底層細節。
照這個目標出發,團隊開發了一個“聯合判別器” (
Joint Discriminator
) 。
和普通的判別器不同,它的輸入不只是影象資料 (真圖與假圖) ,而是
影象資料+潛變數
的成對資料。
那麼,它要區分的不是真圖和假圖,而是真圖與潛變數組成的對子 (來自編碼器) ,和假圖與潛變數組成的對子 (來自生成器) 。
雖然,新演算法的名字BigBiGAN,並沒有體現出生成器的獨特,但有了它才是完整的BigBiGAN:
那麼,現在來看一下成績吧。
打破ImageNet紀錄
在ImageNet影象分類任務上,BigBiGAN成為了
無監督演算法中的地表最強
。
與現有的監督邏輯迴歸分類器相比,BigBiGAN將ImageNet的top-1準確率提高到了61。3%。
作為一隻合格的GAN,BigBiGAN當然有製造“假照片”的功能。
從無監督的BigBiGAN模型中選擇的影象重建的結果。第一行是真實影象;第二行是根據上面影象x的重建影象。
不同於大多數GAN,比如BigGAN那樣畫素級的影象重建,BigBiGAN更重視高層的表徵學習,也就更適合影象分類任務。
論文還寫到,消融實驗證明了:強大的生成模型有助於學習表徵,而強大的推理能力,反過來也能提升大規模生成模型的表現。
瞻仰BigBiGAN,論文在此:
https://
arxiv。org/abs/1907。0254
4
前輩BigGAN:
https://
arxiv。org/abs/1809。1109
6
前輩BiGAN:
https://
arxiv。org/abs/1605。0978
2
p。s。全都來自一個團隊喲。
—
完
—
量子位 · QbitAI
վ‘ᴗ’ ի 追蹤AI技術和產品新動態
戳右上角「+關注」獲取最新資訊↗↗
如果喜歡,請分享or點贊吧~比心❤