[pytorch]一些有關程式碼的細節問題

作者：由 kunkun0v0 發表于繪畫時間：2021-04-04

detach的作用：

（研究simsiam時候發現的detach完全不會用orz）

import

torch

。

tensor

（［

，

3。

］，

requires_grad

True

）

（

。

grad

）

# 輸出None

torch

。

sigmoid

（

）

。

detach

（）

。

mean

（）

。

backward

（）

（

。

grad

）

# tensor（［0。3333， 0。3333， 0。3333］）

（

）

# tensor（［1。7311， 2。8808， 3。9526］， grad_fn=）

（

。

grad

）

# None

這裡可以發現我們在使用detach後，計算c的一個分支就被剝離出來不參與梯度計算

backward的作用：

見上部分程式碼，我們在呼叫backward後會將計算圖釋放，所以中間節點的梯度無法得到。如果想要得到中間節點的梯度，則對中間節點呼叫。retain_grad（）

多次呼叫backward會對梯度進行累加

標簽： Grad detach print backward 梯度

上一篇:《美好的日子》嫌棄趙多福的王素蘭：她用一好遮百醜贏得幸福婚姻

下一篇：【深入理解Java集合框架】Java ArrayDeque原始碼剖析

[pytorch]一些有關程式碼的細節問題

猜你喜歡

c語言，條件編譯程式怎麼寫？

Python面試題，輸出結果是什麼？給出自己的解釋？

有沒有一段程式碼看起來簡單，實則威力無窮，求分享？

Pandas庫之Series使用介紹

[數值計算] 一些經典的最佳化演算法