聯合檢驗:LM統計量
上一篇文章講解了可以用來聯合檢驗的F統計量。
在計量學習過程中,還有一個統計量也可以進行聯合檢驗:拉格朗日乘數(LM)統計量,也被叫作得分統計量。
首先,先回顧一下高斯——馬爾科夫假定:
1。
線性於引數
2。
隨機抽樣,
樣本是從總體中隨機抽取的。
3。
不存在完全共線性
(在一元迴歸中,這一條被寫作為
x有變動
,實際上也是x與常數項不完全共線性的另一種表示)
4。
條件均值為零
5。
同方差性
,隨機誤差項的條件方差相同
6。
正態性
,隨機誤差項的條件分佈是正態分佈,與假定4和5結合起來就可以寫為:
給定
水平下,
我們的F統計量是基於以上6個假定推匯出來的,假定1-5可以用來證明OLS估計量是所有線性無偏估計量中使得引數的方差最小的估計量,也就是保證了線性有效性。假定6用來進行t檢驗和F檢驗,當我們放寬假定6時,t檢驗和F檢驗還能夠進行嗎?
我們可以證明,
在假定1-5成立以及大樣本的前提下,OLS統計量(引數的估計量)是漸進正態的
,也就是說,即使隨機誤差項的條件分佈不是正態分佈,當樣本量足夠大時引數分佈可以被看做是正態的,基於這個定理,我們可以推匯出:
在大樣本下,t統計量和F統計量近似為t分佈和F分佈,我們可以進行正常的t檢驗和F檢驗
(證明過程略,漸進性的證明是非常複雜的,伍德里奇的計量經濟學也沒有完全證明,感興趣可以去搜一下高階計量中關於這裡的證明)
t統計量和F統計量的漸進性使得假定6即使不滿足,在大樣本下也可以正常進行假設檢驗,但是我們也可以用其他的統計量來進行漸進檢驗,LM統計量就是這樣被創造出來的。與前一篇文章類似,我們考慮這樣一個問題:
現在你擁有1個被解釋變數y和4個解釋變數,如何判斷x3,x4這2個變數是沒有必要的?
F統計量構造思路是將原方程與去掉x3,x4這2個變數後的方程分別迴歸,比較二者的SSR變化程度,現在我們換一個思路。
考慮去掉這兩個變數後的方程:
如果x3,x4可以被去掉,那麼x3,x4不在
裡面,同時,根據高斯馬爾科夫假定,
與x1,x2也是不相關的,
因此 #FormatImgID_9# 與x1,x2,x3,x4都無關。
我們對去掉x3,x4後的方程:
進行估計,然後用y的真實值減去擬合值,得到殘差
的資料,隨後用
與x1,x2,x3,x4構建迴歸模型並進行估計:
記上述方程的
為
,當我們的假設
與x1,x2,x3,x4無關)是正確的,那麼
=0,當然,由於抽樣總會有誤差,我們可能會得到一個接近於0而不是等於0的
。與F統計量的構造時我們需要想辦法從統計學意義上描述兩次SSR相差有多大類似,當我們走到這一步時,就需要構造一個統計量來描述
多小時可以認為逼近於0。樣本容量記為n,可以證明:
其中,q為約束變數個數(在這個例子中,約束變數為x3,x4,q=2)。
至此,LM統計量就被構造出來了,
,從形式上來看,LM統計量還被稱為
統計量。
1.為什麼需要LM統計量?LM統計量與F統計量的區別
即使不滿足正態假設,在大樣本下F統計量也滿足F分佈,可以正常進行聯合檢驗,但是,我們要注意到F統計量
能夠影響F是否顯著的因素有
、
、q、n-k-1
而
能夠影響LM是否顯著的因素有n、q、
。
LM與原迴歸解釋性有多高、原迴歸的變數有多少都不相關,因此我們可以認為,LM統計量與F統計量所關注的重點不同,構造方法也不同,當進行聯合檢驗時,LM和F都可以拿來進行檢驗,是比較穩妥的。
2.當我們進行迴歸時,自動報出的LM統計值是什麼?
與我們進行迴歸時迴歸結果自動給出的F統計值類似,一些統計軟體也會自動幫你計算當全部變數都為約束變數(x1,x2,…,xk)時LM統計量是多少,可以判斷你的變數是不是需要全部捨棄。