對比分析分為兩類:橫向分析(靜態比較):在同一時間條件下對不同總體指標的比較縱向分析(動態比較):在同一總體條件下對不同時期指標數值的比較本質在於:多資料維度對比:研究同一目標群體在不同資料維度的表現,以觀察其自身的個性特徵多使用者對比:研
——採用“單因素方差分析”聚類分析除了對類別的確定需討論外,還有一個比較關鍵的問題就是分類變數到底對聚類有沒有作用有沒有貢獻,如果有個別變量對分類沒有作用的話,應該剔除
解決此問題的方法,首先要對使用者特徵和業務場景有足夠了解,然後將相關性大的特徵權重加大,即讓使用者在這些特徵間的差異性放大,這樣主要特徵對最終分類結果的影響就會增加
any()剔除空值3、刪除異常值,如年齡為90-120歲之間的資料為異常整體做描述統計分析:發現僅有兩個欄位做了描述性統計看下整體欄位的型別tripduration為千位符格式,轉為float型別,mobike_user
列表法可以簡單明確地表示出物理量之間的對應關係,便於分析和發現資料的規律性,也有助於檢查和發現實驗中的問題,這就是列表法的優點