多個離散型變數如何進行資料分析?
作者:由 世界冠軍張佳樂 發表于 體育時間:2022-03-20
1)三個自變數,是否均為無序離散型變數?
無序離散型變數的意思是,變數的每個取值權重都一樣。例如,使用溫度(高溫)是否和使用溫度(低溫)的業務含義或價值不一樣?例如使用者評分中的 1分和 5分的業務含義就完全不同。
如果高溫和低溫對與感冒症狀的影響完全不一樣,那麼就要將自變數判定為:
有序離散型
。
其他兩個(穿戴時長、時段、天數)同理判斷。
2)三個自變數,是否相互獨立?
如果相互獨立,即可使用相關性演算法來判斷。
3)因變數,是否為離散型或連續型變數?
感冒症狀是否減輕,如何表示?
如果表示為:1級、2級、3級,那麼就是離散型變數。
如果表示為體溫,就是連續型變數。
上面 3 步都確定後,就可以按照下表選擇演算法了: