論文讀後感
關於Efficient Image Retrieval via Decoupling Diffusion
into Online and Offline Processing的總結和感想
論文下載地址:
https://
arxiv。org/pdf/1811。1090
7。pdf
全文在講什麼?
從標題我們可以得知本文是講影象檢索方法的,透過
解耦擴散
線上、離線處理。檢索任務中,為了獲得更高的檢索效能,通常採用
擴散排序
或重新排序的方法,近年來受到了廣泛的關注,擴散的一個缺點是,與單純的k-NN搜尋相比,它的執行速度較慢,這導致在大型資料集上的線上計算開銷非常大。為了克服這一缺點,本文提出了一種新的
擴散技術
。作者提出的方法沒有對查詢應用擴散,而是預先計算資料庫中每個元素的擴散結果,使線上搜尋成為一個簡單的線性組合
2、對於文章內容的描述
文章出現的random walk,其最終狀態可以看作是顯示資料庫中每個影象與查詢的相似性的排序得分,為了使最終狀態達到收斂,有兩隻方法,第一種是使用這種迭代的方法,最終得到閉式解。我們注意到,線上擴散過程速度的主要瓶頸來自隨機遊走和準備步驟。本文提出的方法可以很好的解決在線上擴散的隨機遊走,以提高擴散效率。此外,以前的擴散版本利用了在親和
矩陣
標準化過程之前發生的早期截斷。而本文提出在標準化過程之後截斷可以顯著提升效率。下圖是作者提出的方法和早先方法的效能對比圖,可以看出作者提出的方法確實在效能上得到了有效改善。
橫軸
表示每個查詢的執行時間,縱軸表示
平均準確率
。
(1)此處為Iscan等人的做法。
實現這種擴散有兩種方法,本文采用Iscen等人使用的方法。首先定義資料為一個向量形式:
其中Xi為特徵向量,即可以表示
全域性特徵向量
,也可以表示為區域特徵向量,其中,當查詢由全域性特徵描述時,m = 1;當查詢包含區域特徵時,m > = 1。將查詢也表示為一個向量:
接下來是構建圖的過程,將X和Q合併為一個矩陣。構建
親和矩陣
A,由A矩陣的到隨機矩陣S。
接下來是隨機遊走過程,將隨機遊走狀態記為ft,初始化後開始迭代,最終得到閉式解。f*包含每個資料庫元素與查詢的相似性,這些相似性將用作重新排序的
排序分數
。
求解起來比較困難,本文將放線上下處理,為計算定義一個
單位矩陣
B={b1, b2,…。bn},根據f*來計算,由,我們用共軛梯度法可解得Ci,Ci可當成是的近似第i列。
綜上所述,直接應用在L上的後期截斷消除了前期截斷的負面影響,完全是預先離線計算的。此外,截斷的初始狀態向量是固定的,這意味著不需要額外的開銷來構建它
3、自己的看法
讀到這篇文章我能聯想的場景是百度輸入相應文字,搜尋出相關的圖片資訊。從文章看出,不同的演算法結構將帶來不同的效果,用這種後截斷操作就可最佳化這種前截斷帶來的效能缺陷,
平常應該多培養這種逆向思考的能力。
4、總結
文章將求影象檢索問題轉化為求解查詢向量和資料特徵向量的相似度,求解f*中比較難解決的是,本文將其離線化處理,降低了時間複雜度。記錄下自己的第一篇論文總結,有種強行合理化的感覺。整個文章讀下來非常痛苦,相關方面的知識欠缺,後期邊學邊提升自身能力。
上一篇:教育文獻的閱讀框架和寫作思路
下一篇:怎麼寫論文框架