您當前的位置:首頁 > 寵物

什麼是假設檢驗?一文解釋概念、步驟和示例

作者:由 二八Data 發表于 寵物時間:2022-09-15

什麼是假設檢驗?一文解釋概念、步驟和示例

假設檢驗是一種統計技術,可幫助科學家和研究人員測試他們對現實世界中關於某種事件發生的判斷的有效性。這篇文章將介紹一些關鍵的統計概念,以及如何為假設檢驗制定假設相關的示例。假設設定和假設檢驗的知識將是構建各種不同機器學習模型以解決現實世界問題的關鍵。如果瞭解機器學習,會發現很多機器學習演算法都是基於假設公式的檢驗,如線性迴歸,邏輯迴歸模型等。

目錄

1。什麼是假設和假設檢驗?

2。假設檢驗的輸出有哪些不同型別?

3。如何將假設表述為零假設或備擇假設?

什麼是原假設?

什麼是備擇假設?

4。設定原假設和備擇假設的示例

5。工具:使用P值執行假設檢驗

1。什麼是假設和假設檢驗?

根據牛津字典的定義,假設是基於有限證據的假設或建議的解釋,作為進一步調查的起點。

假設可以被定義為對與世界上存在的某物或事物的現實相關的真理的主張。例如,假設有人聲稱每天學習超過6小時的學生在考試中獲得超過90%的分數。請注意,這只是一個主張,而不是現實世界中的事實。然而,為了證明這一說法或拒絕這一說法,人們需要透過收集資料樣本和評估這一說法來做一些實證分析。這種收集資料和評估假設的分析,目的是拒絕或未能拒絕假設,這被稱為假設檢驗。有不同的技術來測試這個假設,以便得出這個假設是否可以用來代表存在的現實的結論。

簡單地說,假設檢驗是一個統計框架,可以用來回答關於現實世界中事件真相的簡單“是”和“否”問題。例如:

作為線性迴歸模型的一部分,響應變數和預測變數之間是否存在關係?比方說,房價取決於已經留在當地的人的平均收入。這個說法是真的嗎?或者,這種說法有多大可能性是真的?我們怎麼知道這是真的?

據稱一個特定品牌的500克糖包,被發現只含有大約480克。這是真的嗎?我們怎麼知道這種說法是真的呢?

戒菸會增加壽命嗎?假設是戒菸會導致壽命延長。

假設意味著一個命題或一組命題,作為對某些特定現象發生的解釋而提出,要麼僅作為指導調查的臨時猜想斷言,要麼基於既定事實被接受為高度可能。

根據上述陳述,在考慮假設的表述時,有兩個重要方面需要注意。下面表示可以進行假設檢驗的不同型別的方案:

既定事實或被認為正確的陳述

:事實已確立或被接受為真理或“知識”的情況。回想一下,根據認識論,知識被定義為正當的真正信仰。例如,當您購買一包500克糖時,基於包裝上的500克標籤,你會假設該包裝至少含有500克,而不是更少。在這種情況下,事實被給出或假設是事實。如果聲稱假設或預設的存在狀態不為真,如發現糖包由大約480克糖組成,則可以考慮將這種情況用於假設檢驗。

聲稱是真實的陳述

:對世界上存在的現實(事實)提出一些主張的情況。例如,房價取決於已經留在當地的人的平均收入這一事實可以被視為一種說法,而不是假設是真實的。另一個例子是聲稱每天跑步5英里會導致一個月內體重減輕10公斤。可能存在各種各樣的這種說法,當需要證明為真實時,必須經過假設檢驗。

假設檢驗的第一步是定義或陳述假設。

一旦定義或陳述了假設,下一步就是制定零假設和備選假設,以便如上所述開始假設檢驗。基於上述考慮,以下假設可用於進行假設檢驗,目的是證明假設是正確的。

一包500克糖確實含有480克糖。

房價取決於居住在當地居民的平均收入。

每天跑步5英里,一個月內體重減輕10公斤。

現在假設已經陳述,讓我們繼續將假設表述為零假設和備用假設,以便執行假設檢驗。

2。假設檢驗的輸出有哪些不同型別?

在假設檢驗中,一旦假設被表述為零假設或備擇假設,就會有兩種可能的結果。這些結果如下:

拒絕原假設

有足夠的證據可以拒絕原假設(真理或既定事實)。假如零假設是,聲稱學生每天學習超過6小時並獲得超過90%的分數之間沒有關係。在30名每天學習超過6小時的學生的樣本中,發現27名學生的得分超過90%。

鑑於原假設為真,這種結果不可能偶然發生。這意味著這種說法可以被視為現實世界中的事實。人們可以去取更多的樣品來執行更多的測試。如果類似的結果出現在其他測試中,可以非常有信心地說,有足夠的證據來拒絕原假設,即每天學習超過6小時的學生與獲得超過90%的分數之間沒有關係。

在這種情況下,人們可以接受這樣一個事實,即每天學習超過6小時的學生會得到超過90%的分數。在這種情況下,備擇假設可以被認為是正確的,直到新的測試提供反對這一說法的證據。

未能否定原假設

沒有足夠的證據可以否定原假設(既定事實或現實)。因此人們將無法否定原假設。在30名每天學習超過6小時的學生的樣本中,只有7名學生的得分超過90%。鑑於原假設為真,這種結果是相當可能或預期的。使用給定的樣本,人們不能拒絕原假設,即每天學習超過6小時的學生與獲得超過90%分數的學生之間沒有關係。因此備擇假設或所提出的主張是不正確的。

3。如何將假設表述為零假設或備擇假設?

鑑於上述資訊,人們可以相應地制定假設,並將其稱為

原假設

備擇假設

什麼是原假設?

如果給定的陳述是一個既定的事實或現實世界中的預設狀態,人們可以稱之為

零假設

(用更簡單的話來說,沒有什麼新東西)。成熟的事實不需要任何假設檢驗,因此可以稱為

原假設。

在這種情況下,當有任何新的宣告在現實世界中沒有得到很好的確立時,原假設可以被認為是該宣告的預設狀態。

例如在上一節中,提出一個宣告或假設,即每天學習超過6小時的學生在考試中獲得超過90%的分數。在這種情況下,原假設將是宣告這是事實。零假設可以被描述為這樣一個事實,即學生每天閱讀超過6小時會得到超過90%的分數是真實的。

什麼是備擇假設?

如果給定的陳述是一個宣告(現實世界中的意外事件)尚未得到證實,則可以將其表述為

備擇假設

,並相應地定義原假設。簡而言之,需要根據現實進行測試的假設或主張可以稱為備擇假設。為了得出該主張是真實的結論(有現有證據),重要的是要否定原假設。

應該注意的是,零假設和備擇假設是相互排斥的,同時也是不對稱的。在上一節中給出的示例中,聲稱學習超過6小時的學生不會獲得超過90%的分數的說法可以稱為備擇假設。

4。制定原假設和備擇假設的示例

以下是原假設和備擇假設的一些示例。

以標籤為500克的糖為例。如上所述,這代表了所作陳述在現實中被認為是真實的情況。因此,據信(基於給定的標籤)罐裝糖重500克是真實的。然而,聲稱標籤為500g的罐裝糖被發現有 重量小於500g的情況。

因此,我們需要進行假設檢驗,以確定所提出的主張是否屬實。需要進行假設檢驗以確定所提到的500克標籤的真實性,因為有人聲稱糖包由480克組成。在這種情況下,

原假設

將被表述為罐裝糖的重量等於500克的陳述。因此,備擇假設將被表述為糖包重量小於500克的陳述。

原假設

:糖包的重量是500克(一個公認的事實)

備擇假設

:糖包的重量小於500克。

每天跑5英里會導致一個月內體重減輕10公斤。現在,這是需要證明或以其他方式證明的主張。備擇假設將首先表述為“每天跑步5英里將導致一個月內體重減輕10公斤”的陳述。因此,原假設將與備擇假設相反,並表示為“每天跑步5英里不會導致一個月內體重減輕10公斤”的事實。

原假設

:每天跑步5英里不會導致一個月內體重減輕10公斤。

備擇假設

:每天跑步5英里,一個月內體重減輕10公斤。

再舉一個例子,有一個主張是房價取決於留在當地的人的平均收入。備擇假設將首先表述為“房價取決於居住在當地的人的平均收入”的陳述。因此,零假設將被表述為房價不取決於居住在當地的人的平均收入的陳述。

原假設

:房價不取決於居住在當地居民的平均收入。

備擇假設

:價取決於居住在當地居民的平均收入。

5。工具:使用P值執行假設檢驗

一旦你作出假設,就需要測試這些假設。也就是說,假設零假設被設定為糖包的重量是500克,則需要透過獲取房價樣本來測試,並且根據測試結果,這個零假設可以

被拒絕

未能被拒絕

。在假設檢驗中,以下兩個是結果:

否定

原假設

未能否定

原假設

以上面重達500克的糖包為例。原假設被設定為糖包重達500克的陳述。在取了20個糖包的樣品並測試其重量後,發現糖包的平均重量達到490克。計算了該樣本的檢驗統計量(t統計量),並確定了P值。假設P值被發現為15%。假設顯著性水平選擇為5%,檢驗統計量在統計意義上不顯著(P 值> 5%),因此,原假設無法被否定。因此,人們可以有把握地得出結論,糖包確實重達500克。然而,如果罐裝糖包的平均重量為475克,這遠遠低於500克的平均值,人們最終可能會拒絕基於P值的零假設。

下圖表示假設檢驗的工作流程。

什麼是假設檢驗?一文解釋概念、步驟和示例

圖 1.假設檢驗工作流

總結一下進行假設檢驗時要採取的一些

步驟

陳述假設

:首先,需要陳述假設。假設可以是假定為真的陳述,也可以是被假定為真的陳述。

制定假設

:此步驟要求人們區分清楚零假設和備擇假設,或者用簡單的話說,要被拒絕的零假設。

設定判斷決策的條件

:確定可用於評估原假設的檢驗統計資訊。上面示例的測試統計資料將是罐裝糖包的平均重量,t統計量將用於計算P值。

確定顯著性水平 (alpha)

:在開始假設檢驗之前,需要設定顯著性水平(也稱為

alpha

),該顯著性水平表示P值小於或等於

alpha

的值在統計意義上被認為是顯著的。

alpha

的典型值為 0。1、0。05 和 0。01。如果 P 值被評估為具有統計顯著性,則原假設被否定。如果 P 值大於

alpha

值,則原假設無法被否定。

計算檢驗統計量

:下一步是計算檢驗統計量(z 檢驗、t 檢驗)以確定 P 值。如果樣本數量大於 30,建議使用 z 統計量。否則,可以使用 t 統計量。在當前示例中,選擇 20 包罐裝醬汁進行假設檢驗,將計算平均值為 505 g(樣本平均值)的 t 統計量。然後,t 統計量將計算為 505 g(樣本均值)和總體均值 (500 g) 的差值除以樣本標準差除以樣本數量平方根 (20)。

計算檢驗統計量的 P 值

:計算檢驗統計量後,使用t表或z表查詢 P 值。P 值是獲得檢驗統計量(t 分數或 z 分數)等於或大於從樣本資料獲得的結果的機率,前提是原假設 H0 為真。

將 P 值與顯著性水平進行比較

:顯著性水平設定為允許的範圍,如果出現該值,則

無法否定

原假設。此區域也稱為

非拒絕區域

。將 alpha 的值與P值進行比較。如果P值小於顯著性水平,則檢驗具有統計顯著性,因此原假設將被否定。

*知識點測驗

1。需要確定的假設為__

A。原假設

B。備擇假設

2。假設檢驗的結果是___(請選擇2個正確答案)

A。否定原假設

B。否定備擇假設

C。接受原假設

D。未能否定原假設

3。P值定義為在原假設為真的情況下獲得極值結果的機率

A。真

B。假

4。有一種說法是,做調息瑜伽會導致逆轉糖尿病。以下哪項是關於原假設的?

A。是的,做調息瑜伽可以逆轉糖尿病

B。做瑜伽對逆轉糖尿病沒有影響

總結

在資料科學中,需要理解假設檢驗概念的原因之一是需要驗證依賴變數(響應)和獨立(預測變數)變數之間的關係。因此,人們需要理解相關的概念,例如零假設和備擇假設,顯著性水平,檢驗統計計算,P值等。鑑於因變數和自變數之間的關係是一種宣告,原假設可以設定為因變數和自變數之間沒有關係的場景。以上就是假設檢驗的內容,基本過程很簡單,但是在實際操作是需要注意細節。

最後歡迎大家關注我,我是拾陸,搜尋公眾號“二八Data”,更多技術乾貨持續奉獻。

什麼是假設檢驗?一文解釋概念、步驟和示例

什麼是假設檢驗?一文解釋概念、步驟和示例

標簽: 假設  假設檢驗  備擇  500  糖包