您當前的位置:首頁 > 遊戲

MySQL——資料分析的好幫手

作者:由 Xx x 發表于 遊戲時間:2018-08-19

之前介紹了資料分析中如何使用Excel來進行資料清洗。今天就來看一下清洗好的資料如何匯入MySQL中使用,並輔助我們分析。

首先,為什麼要使用資料庫呢?我們日常分析小問題當然可以用Excel來進行簡單的分析,但是一旦資料的量到達十萬百萬級別,我們使用Excel就會難以操作,Excel根本不能負荷這麼大的資料來工作,這就需要使用到資料庫了。

我們在分析之前先確立幾個提出需要解決的幾個問題,我們需要知道資料分析師就業的需求:

1.就業資料分析師,我們應該選擇什麼行業呢?資料分析師在哪些領域的需求比較大呢?

2.就資料分析師這個崗位而言,公司規模大小與學歷需求的關係如何?是否我要到碩士、博士才能更好找到資料分析師的工作呢?

3.作為一個無經驗的自學轉行到資料分析師,我應該期待第一份工作的薪酬是多少呢?

就以上幾個問題,我們嘗試利用Navicat來操作MySQL解決。

匯入資料:

MySQL——資料分析的好幫手

匯入資料時,一路高歌,最要注意的就是這裡。我們這裡先直接以預設的匯入。

匯入後表如下圖:

MySQL——資料分析的好幫手

問題一:就業資料分析師,我們應該選擇什麼行業呢?資料分析師在哪些領域的需求比較大呢?

公司所屬領域這裡我們因為有些公司涉及到兩個領域所以分開兩列,方便資料整合。這裡我們可以透過建立檢視的方式,將其整合成一列。

MySQL——資料分析的好幫手

然後開始統計時應該是這樣的:

MySQL——資料分析的好幫手

可是你會發現第二列存在“空值”,可是我明明在建立檢視時已經將空值排除在外了。為何還會有空呢?我們可以找回Excel匯入的結構設定。看到當初這兩列設的格式是varchar,而varchar這個格式是可變的字串,而這裡的“空值”很可能就是空字串而不是NULL。所以我們可以用以下方法嘗試解決。

第一個:我們只需要字串長度大於0的,用來排除空字串

MySQL——資料分析的好幫手

第二個:更改檢視的構建,直接排除空字串

MySQL——資料分析的好幫手

最後結果顯示:

MySQL——資料分析的好幫手

小結:資料中可以清晰地看出,移動網際網路領域的資料分析師是需求是相當大的,幾乎佔了全領域的三分之一。而前五名分別是:移動網際網路,金融,資料服務,電子商務決O2O,如果大家還沒有明確定位針對什麼領域就業資料分析師可以先學習以上幾個領域的業務知識,在其中挑選你感興趣的行業進行就業。

問題二:就資料分析師這個崗位而言,公司規模大小與學歷需求的關係如何?是否我要到碩士、博士才能更好找到資料分析師的工作呢?

MySQL——資料分析的好幫手

這裡我們使用join來對招聘網站資料來自連線從而實現對公司大小與教育要求的連線比較分析。

小結:從上面的分析資料我們可以看出,在資料分析師中本科學歷要求學歷仍然佔大頭,畢竟基數較大。但是仔細分析博士需求只在最小的少於15人,15-50人,50-150人這三個規模的公司有招,而且這三個最小規模型別的公司也是招聘碩士佔比最多的,大公司反而不看重學歷的要求,側面看出,創業的小公司需要的是少數高精尖的人才,而大公司因為系統龐大,往往分工比較細緻,不需要太高階的人才,也可以說不需要透過簡歷來篩選人才,可以有更好的人力資源來篩選有辦事實力的人才。所以只有找資料分析師的並不需要一定到碩士博士的學歷,你可以去較大的公司嘗試,這樣成功率可能會更高。

問題三:作為一個無經驗的自學的本科生轉行到資料分析師,我應該期待第一份工作的薪酬是多少呢?

MySQL——資料分析的好幫手

我們透過上面的查詢語句看到一個錯誤的現象,為何最大值反而比平均值還要小呢?

我們先在表中對平均工資這一列進行排序看看。

MySQL——資料分析的好幫手

確實是9。5排在第一,其次是9。那現在我們排查一下問題,先來看看錶的結構

MySQL——資料分析的好幫手

這裡平均工資設定的仍然是varchar格式,這是我們匯入資料預設的格式。看到這裡我們就知道,對數字字串進行排序,就像目錄一樣,只針對第一個數字進行排序。所以我們要把它改成浮點型的資料格式,那樣才能實行我們想達到的目的。而且我們發現設定格式時並沒用設定主鍵,這也不利於我們以後的分析,所以既然要動手改格式就一起搞好吧。

MySQL——資料分析的好幫手

透過備註中的語句對錶結構進行更改。我們可以看到更改後的結果。這時回去再排序就會變成這樣

MySQL——資料分析的好幫手

再執行之前的查詢語句

MySQL——資料分析的好幫手

小結:如果你擁有很強的能力,那麼你可能會擁有60k的月薪哦,當然這可能只是一個特例或者意外,但不難看出,資料分析師也是一個很吃香的職業,本科生無工作經驗的平均工資都能達到9k以上,所以大家去求職時可以參考一下。

MySQL使用經驗總結:

使用檢視和join等建立一下特定情況下需要使用而當前表不能提供的新資料來輔助解決問題是十分有效的。

MySQL在創表時,如果針對特定的資料值設定好結構,會剩下很多的時間,而當使用過程中出現問題,查詢語句都正確而無法得到正確答案可以從表的結構入手分析錯誤原因。

使用MySQL可以有許多異想天開的查詢方式,構想這種問題的思維也是你解決這個問題的突破點,好好建立自己的資料分析思維來解決問題是十分重要的。

標簽: 資料  分析師  我們  匯入  excel