描述這個問題之前我們先來看看目前cv領域最重要也最為基礎的task:目標的檢測、跟蹤、識別,影象的檢索,人臉的識別和驗證,image caption,image generation,超解像,視覺slam(vo計算)等等,而這些任務本質上都
則網路會為每個輸出一個預測score向量在本文framework中,每個的輸出並不是維度的類別向量,作者將每個複製次,每個只針對第類,則對應的,其中表示不參與ranking loss的計算,因此網路針對每個的預測就是一個binary sca
如果和是一對資料的representation,是一個二值標示(0表示negative pair,1表示positive pair),距離是歐式距離,那麼我們可以把公式寫為:Triplet Ranking Loss例:用triplet ra
假設 就是 CNN 網路,我們可以把 Pairwise Ranking Loss 寫為:Triplet 網路和 Siamese 網路的思想一致,但 Triplet 網路擁有 3 個分支(3 個共享引數的 CNN),模型的輸入為 1 個正樣
使用TF-Ranking構建model_fn函式是基於兩個基本元件的組合: 評分函式(scoring function)和排名頭(ranking head)
這種新正規化我們稱之為Ranking and Tuning,它從兩個方面雙管齊下,提高預訓練模型庫利用率:Ranking部分對全部預訓練模型進行排序,能夠篩選出可能適合當前任務、但是名氣不大的模型,從而使得下載量低的模型也能有被利用的機會
這種排名方式在中國叫中式排名,在國外叫作dense ranking