您當前的位置:首頁 > 動漫

谷歌提出"光影魔術手"技術: 機器學習增強人像照明, “普通”照片更好看了!

作者:由 將門創投 發表于 動漫時間:2022-06-04

公眾號:

將門創投

(thejiangmen)

From: SIGGRAPH Asia 2020;編譯: T。R

在人像攝影和電影拍攝過程中,光照扮演著十分重要的作用。為了實現更好的渲染和後期製作,需要估計出影象中人物所處的光照資訊。受到投射陰影和高光反射線索的啟發,

谷歌

研究人員提出了一種

從任意光照條件下的單張RGB影象中學習出高動態全方位光照

的技術手段,並透過不同環境光照下配對的人物照片對模型進行訓練。

實驗顯示,這一方法可以有效為多種膚色的人物照片恢復高效能的光線效果

,在連續光照的作用下,也可將虛擬背景或者卡通人物新增到肖像照中來。輕量級的架構也使得其在移動端執行成為可能。

更多詳情,請參看論文原文:

谷歌提出"光影魔術手"技術: 機器學習增強人像照明, “普通”照片更好看了!

論文連結:

https://

arxiv。org/pdf/2008。0239

6。pdf

專案主頁:

https://

augmentedperception。github。io

/facelight/

相關參考:

https://

augmentedperception。github。io

/deeplight/

基於單張影象的高動態照明估計

對於經驗豐富的攝影師來說,拍攝時的光線情況不僅可以從面板的漫反射獲取,同時還可以透過投射陰影的方向和範圍、高光反射的強度和位置來獲取。在這一經驗的啟發下,研究人員提出了一個可以從人像實現逆向光照的模型,

無需任何特定的面板反射模型假設,也能估計出環境中全向的高動態範圍照明情況。

這種技術可以得到具有更高頻率細節的照明資訊,使得更真實的人像渲染和ARi視覺特效成為可能。

為了訓練這一模型,研究人員構建了一個包含人像和對應光照情況的龐大資料集。資料集中包含了70個人物在331個光照下的基礎資料,以及利用渲染技術生成的約一百萬張包含室內外光照環境的人像資料集。下面就讓我們從

資料集

模型架構

實驗

等方面來詳細瞭解這項技術的實現過程。

訓練模型需要大量的具有光照情況標記的肖像照片,但在現實中去收集如此龐大的資料集幾乎是不可能的,所以研究人員採用了一種基於影象的數字驅動的重光照技術來合成具有光照標註的肖像照片,透過適當地捕捉複雜的光傳輸現象來渲染出逼真的影象。在反射場的理論框架下,人們可以透過反射場和HDR環境光的點乘來獲取重新光照下的主體影象。

為了記錄人物的反射場,研究人員使用了安裝在球面內的331個LED燈來進行拍攝,反射場透過一系列反射基影象來進行記錄,每次開啟一個LED燈拍攝記錄一個獨立的光照結果(One-Light-At-a-Time, OLAT),並利用6個相機在不同的角度記錄了人物的影象。

谷歌提出"光影魔術手"技術: 機器學習增強人像照明, “普通”照片更好看了!

不同光照下的拍攝結果

其中35mm的鏡頭用於拍攝不同角度的半身像,50mm的鏡頭用於拍攝面部的細節。

谷歌提出"光影魔術手"技術: 機器學習增強人像照明, “普通”照片更好看了!

研究邀請了

70位

不同年齡、膚色和性別的人物來進行拍攝,並記錄了九種不同的表情,最終共得到了

3780套在331個光照序列下的成像結果

谷歌提出"光影魔術手"技術: 機器學習增強人像照明, “普通”照片更好看了!

由於獲取物件的完整OLAT序列需要六秒鐘,因此,目標在拍攝過程中不可避免地會有一定程度的移動。為了解決這個問題,

研究人員採用光流技術來對齊影象,每隔11個OLAT幀就增加一對均勻一致的照明“跟蹤”幀,以確保滿足光流的亮度恆定約束。

這一步驟可保證重光照操作時影象特徵的清晰度,以便將對齊的OLAT影象進行線性組合。

利用正前方的兩個相機,研究人員還獲取了每個主體的掩膜,以便於將他們渲染到新的環境中。首先利用六個LED均勻地照明灰色的背景材料,而人物不會被照明;同時還在相同條件下拍攝了沒有人物時的完整背景。這樣一來,掩膜可以用第一次拍攝的圖分離第二次拍攝乾淨的背景圖獲取。

高動態環境捕捉。為了利用拍攝好的反射場對主體進行重新打光,研究人員收集了大規模的高動態環境的資料集來驅動深度學習演算法。這裡主要使用影片級速率的影象捕捉技術獲取了近100萬張室內和室外的資料集。

谷歌提出"光影魔術手"技術: 機器學習增強人像照明, “普通”照片更好看了!

如上圖所示,其捕獲的影象中包含了散射、磨砂銀質和鏡面的參考球體。這三個球可以有效反映環境中不同的照明線索,其中,鏡面球反映了全向的高頻資訊,但會忽略較亮的光源,造成強度和顏色的改變;而近似朗伯體BRDF的漫反射球則可以視為低通濾波器,捕獲模糊但相對完整的場景照明線索。與前人的工作不同,本研究需要獲得真實的HDR照明資訊來對人物進行重新打光,需要顯式地提升這三個球的質量以估計其所處環境的HDR光照條件。

在給定三個捕獲反射狀況的球體影象後(可能會有畫素缺失),研究人員希望透過解算出HDR光照來得到合理的結果。首先,利用前面提到的光照系統記錄下漫反射球和散射銀球的的反射場,並將輻射基準影象轉換到相同的輻射空間中去,這一空間透過入射光源的顏色進行了歸一化。隨後,將反射基準影象投射到鏡面球上(基於朗伯方位角的等面積投影),針對每一個輸入影象積累能量來構成反射場。對於鏡面球捕捉的影象來說,如果不存在缺失,則直接利用反射率來恢復場景光照;如果存在缺失,則透過反射模型和最小二乘法來解出對應的結果。透過一系列複雜的演算法就可以重建出HDR反射場。

谷歌提出"光影魔術手"技術: 機器學習增強人像照明, “普通”照片更好看了!

上圖中,上半部分是基準LDR影象,而下半部分就是利用估計的HDR渲染出的球體光照記錄。更多詳細的推導可以參考文章的3。1的第四部分。

在為每個任務記錄下反射場和估計出HDR光照條件後,研究人員就可以將每個人物在新場景中進行重新光照渲染來生成大規模的訓練資料了。利用包含三個環境光探測器的背景影象,研究人員可以將記錄中獲取的人像渲染到豐富的背景環境中去。下圖展示了人物主體在新背景環境中得到自然的影象的過程。

谷歌提出"光影魔術手"技術: 機器學習增強人像照明, “普通”照片更好看了!

上圖分別展示了背景影象、對應的HDR照明結果、主體的拍攝結果和利用環境影象重照明的結果,最後利用掩膜與背景影象渾然天成的合成結果。

為了更有效的利用資料,研究人員還在其中增加了面部檢測的能力,為輸入的資料提供一定的人臉檢測框來幫助模型更好地學習。

谷歌提出"光影魔術手"技術: 機器學習增強人像照明, “普通”照片更好看了!

合成的訓練資料集將人臉檢測部分進行了剪下,右上角是HDR照明結果。

網路架構和實驗結果

網路的輸入影象是256x256畫素的歸一化影象和對應的LDR光照,利用編解碼器架構進行訓練,最終輸出結果為對數空間中32x32的鏡面球HDR影象來表示全向照明。同時還使用了輔助的判別器分支來增加對抗損失,強化合理的高頻照明估計。在最終的訓練中,同時引入了多尺度的影象重光照渲染損失和對抗損失來引導網路訓練。

谷歌提出"光影魔術手"技術: 機器學習增強人像照明, “普通”照片更好看了!

在訓練結束後,研究人員首先將估計出的環境光照資訊與多種演算法進行了對比,可以看到,

這一演算法恢復的結果更為真實可信。

谷歌提出"光影魔術手"技術: 機器學習增強人像照明, “普通”照片更好看了!

同時,研究人員還基於估計出的光照結果對人物進行重新打光,並對比了不同分量渲染結果,還將得到的光照用於渲染新的人物。

谷歌提出"光影魔術手"技術: 機器學習增強人像照明, “普通”照片更好看了!

上圖中,第一列和第二列為輸入的影象和對應的基準光照;第三列為預測出的光照結果;第四列是利用預測出的光照進行重新渲染的結果。最後三列則是利用前面的光照對新的人物在相同環境中進行渲染的結果。

此外,下圖顯示,

多尺度損失可以有效提升最終環境光的估計精度

,最下面的鏡面球估計的結果明顯變得更清晰了。

谷歌提出"光影魔術手"技術: 機器學習增強人像照明, “普通”照片更好看了!

接下來,我們再來看一些利用渲染影象預測出的環境光照結果,它可以在不同膚色、表情、頭部姿勢上穩定工作。

谷歌提出"光影魔術手"技術: 機器學習增強人像照明, “普通”照片更好看了!

在真實的戶外場景中,也可以實現高效能的光照估計,並且將新的任務渲染在相同的環境中。

谷歌提出"光影魔術手"技術: 機器學習增強人像照明, “普通”照片更好看了!

如圖所示,第一列為輸入的真實影象,第二列為估計出的光照結果,第三列為將數字人物渲染到對應環境中的結果。可以看到,光影效果非常逼真。

此外,有了估計出的環境光,一些特效也能渲染得非常真實,下圖就展示了在自拍中渲染出虛擬氣球做背景的效果,就像真的一樣。

谷歌提出"光影魔術手"技術: 機器學習增強人像照明, “普通”照片更好看了!

@將門創投· 讓創新獲得認可

如果喜歡,別忘了贊同、關注、分享三連哦!筆芯❤

標簽: 光照  影象  渲染  HDR  結果