您當前的位置:首頁 > 娛樂

內容推薦系統的興趣探索

作者:由 閆澤華 發表于 娛樂時間:2017-08-27

好的推薦系統,是應該給使用者帶來驚喜的。

興趣探索對於推薦系統而言是繞不開的一環,可以從內容供給的角度 和 使用者消費的角度分別來看。

內容的角度

推薦系統引入了新的內容或創作者,就好比超市上了新的貨品或品牌供應商,幫助新的內容儘快完成有效探索找到基礎使用者。內容的探索能夠讓我們對系統內的內容分佈和內容價值體系有更好的認知。

STEP1 大力出奇跡——生推

在系統體量較大的前提下,一個確實有用的方法是”生推“,即不考慮所有先驗資訊將內容交給推薦引擎來判斷。透過給予內容更高的Boost係數,保證內容能夠展示在一定規模使用者群體的資訊流中,以規模換效果。“姜太公釣魚願者上鉤”,藉由使用者的點選行為能夠逐步挖掘出這類內容的受眾群體。對應到超市的場景下,或許就是你走進超市入口那個打著新品促銷招牌的堆頭,讓消費者知道、交於消費者嘗試和判斷。

以嘻哈音樂為例,最近大火的“中國有嘻哈”讓這一長期小眾的文化迅速升溫,讓嘻哈樂的內容強曝光在大眾面前。三類受眾人群都得以挖掘:之前喜歡的持續點選、之前不喜歡的持續略過,之前不知道的點選過一兩次之後喜好分明、點選行為也趨於收斂。

STEP2 專家系統引入先驗判斷

生推的方式太簡單粗暴了,為了讓這個過程顯得稍微科學一些,我們引入了專家系統的先驗知識。基於人的判斷制定簡單規則,以規則引導內容的分發,將全人群的強展現轉為特定人群的強展現,從而以換取可能更高的點選率。對應到超市的場景下,可能是將新上市的啤酒擺在火鍋底料、小龍蝦的附近,預判消費者有共同購買的場景從而促進新品銷售。

同樣以嘻哈舉例:如果我們預估嘻哈音樂的受眾是年輕人,那麼可以制定提權規則,讓內容的分發向年輕人傾斜;如果我們發現嘻哈樂的樂迷們同時喜歡潮牌、那麼內容的分發可以向喜歡潮牌的使用者傾斜等等。

對於一些小眾的品類(比如預估只有萬分之一的受眾),生推的方式收斂速度太慢(展示給100萬人,在所有人都強反饋的時候也只有100人反饋,且很有可能就錯過了),通常建議採用專家系統引導的方式,保證探索的效率。

使用者的角度

在這一節,我們只關注沉澱下來的老使用者。關於系統的新使用者,可以參考冷啟動一節。

不同於內容探索的以規模換效果,使用者探索可以概括為以時間換效果:只要使用者在App內容停留的時間足夠長,就有機會透過各種相對低頻的方式來完善使用者的興趣圖譜。

一方面,使用者本身的興趣圖譜越完善,系統就越容易發現他的潛在興趣點。除了基礎的點選和閱讀行為,點選標籤詞、評論、關注等行為是使用者對於興趣表達的強化,每一個可信的興趣點都會引申出更多可能的興趣點。比如,潮牌使用者大都喜歡嘻哈樂,那麼當一個使用者被系統確定為對潮牌有強興趣的時候,就可以向其推薦嘻哈樂的內容。

另一方面,某些行為動作可以用來擴充使用者興趣,如搜尋、頻道順序調整、主動訪問頻道。如,當用戶搜尋特定關鍵詞“嘻哈”時,就代表了他對這類內容產生了短期興趣。

對於使用者的興趣探索,一個值得注意的問題是:小眾興趣的探索和丟失。

這個問題本身是因小眾興趣的供給不足引起的。比如,使用者的興趣偏好是“馬龍+乒乓球”,但是系統內這類內容只有一百條。從探索的角度來看,內容太少會導致試錯的成本太高,一次負反饋就會影響後續的探索。一旦因為上下文、場景等關係使用者沒有點選,系統就會轉向其他興趣點,從而錯過此類內容的發現;從消費的角度來看,即便發現了使用者的小眾興趣,但是若干次重新整理之後這類內容就全部被消費完畢了。之後,由於缺乏足夠的內容供給,使用者會在相當長的時間段裡沒有辦法觸達到此類內容。系統基於興趣衰減,小眾興趣就會被慢慢的淡化和丟失。

應對小眾興趣,一方面需要擴充系統的資源池,讓小眾興趣也有足夠的內容覆蓋;另一方面也需要透過產品設計鼓勵使用者強的主動表達行為(如收藏、關注),一次關注行為顯然比一次點選行為禁得起更長的時間衰減。

標簽: 使用者  興趣  內容  點選  探索