Minitab 在質量管理中應用----描述性統計及圖形分析 (四)
昨天一不小心,公司食堂食物中毒,急性腸胃炎上吐下瀉,明明已經寫完的部分,只能拖了一天再更新。。。
4。2。6箱線圖( Boxplots)
h
ref=“”>· 目的
箱線圖(Boxplots):
使用資料中的五個統計量來描述資料的一種圖示方法。
1)
利用它可以粗略地看出資料是否具有對稱性、中心位置和分佈範圍等資訊。
2)對同一性質的多組資料在同一座標下分別作箱線圖,可以直觀地進行多組資料比較。
箱線圖的標準元素組成
href=
“”>· 結構元素組成
箱線圖由箱體,上下須觸線和星號三部分組成,圖形的形狀和位置由最小值、第一四分位數、中位數、第三四分位數和最大值這五個統計量決定。最小值,中位數和最大值的含義前面都介紹過了,下面解釋下第一四分位數和第三四分位數以及四分位間距:
· 第一四分位數(1st quartile, Q1)
:當把資料集劃分為兩部分,其中小於等於次數的資料約佔整個資料集的25%,大於等於此數的資料約佔整個資料集的75%。
· 第三四分位數(3rd quartile, Q3)
:當把資料集劃分為兩個部分時,其中小於等於此數的資料約佔整個資料集的75%,大於等於此數的資料約佔整個資料集的25%。
· 四分位間距(interquartile range,IQR):
等於第三四分位數與第一四分位數的差值,即
IQR=Q3-Q1。
PS:需要注意的是,須觸線的上下限,不一定等於資料集裡的最大值和最小值。
下限=max{Q1-1.5IQR,最小值}
上限=min{Q3+1.5IQR,最大值}
舉下限的例子說明,如果最小值很小,須觸線下限將延伸到Q1-1.5IQR處為止;如果最小值較大,須觸線的下限將到最小值處為止。
最後再介紹下星號,如果上下限的計算結果不是觀測值中的最大、最小值,箱線圖上就會出現一些遊離點,有異常值的嫌疑,通常用星號“ * ”表示。
例項:
植物化肥製造商想要研製一種使植物高度生長最快的化肥配方。為檢驗化肥配方,一位科學家準備了三組完全相同的秧苗(每組 50 棵):未使用化肥的對照組、使用他們的 GrowFast 化肥的組和使用他們競爭對手的 SuperPlant 化肥的組。植物在受控制的溫室環境中生長三個月後,這位科學家測量了這些植物的高度。
施加化肥和無化肥對比
結果解釋說明:
總體來說,使用 GrowFast 種植的植物最高。SuperPlant 也增加了植物高度,但其變異性最大,SuperPlant 對大部分秧苗都沒有正面影響。該圖形顯示 GrowFast 使植物高度有了較大且穩定的增長。
4。2。7時間序列圖( Time Series Plots)
·
目的
時間序列圖( Time Series Plots):
是顯示觀察值隨時間變化而不斷變化的圖形,主要為了去反映客觀現象隨時間變化發展變化的差異及其規律性。
時間序列圖
注意:時間序列圖是一種看似最簡單,但在定義分析問題階段查詢異常值、突變或其他規律最有效的工具。為什麼呢? 下面會一一列舉:
1.
發現異常值(outlier)
紅色標識為異常點
由資料輸入錯誤導致的異常值。技術人員在工作表中意外輸入了值 4(正確數值為40)。
2.
發現趨勢突變(sudden shift)
對於過程資料中發生的突變,需要調查其背後的發生原因(人機料法環的變化點);
3.
發現趨勢
趨勢是資料值中的長期增加或減小。趨勢可以是線性的,也可以表現出一定程度的彎曲。
遞增與遞減趨勢
4.
發現季節性模式或迴圈運動
季節性circle模式
季節性模式是資料值中在同一個時間段內定期反覆的上升和下降。例如,汽車零件商店的訂單量在每週一很低,之後增加,到週五到達峰值。季節性模式始終具有固定的已知時間段。
(五)
描述性統計量在Minitab中計算
在minitab中統計 =>基本統計 =>顯示描述性統計量,然後選擇想要顯示的統計量指標,如下圖:
當然,對於這些描述性統計量指標,更多是在今後分享的一些minitab功能應用中發揮更大的作用,單純的計算這些指標的意義並不大。
到這裡,關於描述性統計以及圖形分析在minitab的應用部分就結束了,希望各位同行能夠多多支援!
預告:後續要分享的部分是統計分析中一些機率論的基礎知識(隨機抽樣,正態分佈等)以及在minitab中的簡單操作應用。
下一篇:請問一下上海致逸設計怎麼樣?