Airbnb產品分析報告
目前Airbnb作為一款社群平臺類產品,其業務遍佈了191個國家,並且經常出現在商業分析的優秀案例中。Airbnb在做好了產品體驗、房源美感、民宿共享服務之後,這款產品和背後的業務是否存在可以改進的地方?
我們用使用者畫像,推廣渠道,轉化漏斗三個方面來分析
•資料集名稱:Airbnb顧客預訂資料•資料集來源:
https://www。
kaggle。com/c/airbnb-rec
ruiting-new-user-bookings/data
•資料集簡介:此資料集是kaggle上的一個競賽專案,主要用來製作目的地資訊的預測模型。此資料聚集包含兩張資料表,其中train_user表中為使用者資料,sessions表中為行為資料。
train_users_
=
pd
。
read_csv
(
“train_users_2。csv”
)
train_users
=
train_users_
。
drop
([
“country_destination”
],
axis
=
1
)
#去除掉train表中目的地的一列。
all_users
=
pd
。
concat
([
train_users
,
test_users
])
#聚合train和test兩張表的所有資料。
all_users
[
“gender”
]
。
value_counts
()
airbnb的男女使用者佔比差別不大,女性使用者要比男性使用者佔總使用者人數多:6。4%。
all_users。loc[((all_users[“age”]<7)|(all_users[“age”]>75)),“age”]=0
#選取歲數小於7歲,大於75歲的使用者,並將異常資料置0。
age = all_users。loc[all_users[“age”]!=0,“age”]
#統計時只統計非零歲數的使用者。
age = age。dropna()
age_counts = age。value_counts()
age_counts_sort = age_counts。sort_index()
airbnb的使用者主要為“中青年群體”,其中使用者數量最多的是80後(29歲~39歲),其次為90後,然後為70後。
all_users[“first_device_type”]。value_counts()
#直接統計。
airbnb使用者登陸電腦端Mac比windows多,移動端iPhone,iPad比Android多。
train_users_no_NDF = train_users_。loc[train_users_[“country_destination”]!=“NDF”]
#train_users_no_NDF
lan = train_users_no_NDF。groupby(“language”)[“country_destination”]。value_counts()
lan
airbnb的產品真的很國際化,使用者遍佈多個地區。有超過90%的使用者是英語國家(歐美);airbnb是2013年開始進入中國市場的(此資料集止於2014年),所以此時中文使用者數量雖然排名第二,但是佔比卻非常小。
Airbnb畢竟還是歐美國家使用者使用得多,中國使用者去最多的國家是美國。
all_users[“y-m”] = train_users[“date_account_created”]。str[:7]
#日期只取前7位,取到月,日期不管。
date_account_created = all_users。groupby(“y-m”)[“id”]。count()
date_account_created
從視覺化結果可以看出:
airbnb的使用者增長曲線健康,前期(2011年之前)平緩,2012年2月之後開始快速增長。2012年之後的增長速度很快。
此產品新使用者的增加存在季節性規律:每年的1~7月,產品都會迎來使用者增長的高峰,推測為夏季(北半球)是旅行的旺季,而短租產品本身就是旅行消費的一種。
all_users[“channel-provider”] = all_users[“affiliate_channel”]。str。cat(all_users[“affiliate_provider”],sep =“-”)
#把渠道和推廣方式用“-”連線起來。
visit = all_users。groupby([“channel-provider”])[“id”]。count()
#訪問統計
booking = all_users。groupby([“channel-provider”])[“date_first_booking”]。count()
#註冊統計
rate = booking/visit
#轉化計統計
渠道註冊量方面:
•airbnb的整體渠道轉化率表現很好,多數渠道的轉化率都在30%以上。
•表現最好的為谷歌競價(SEM),其中品牌競價註冊量大於非品牌競價的註冊量。
•渠道註冊量符合二八定律,前7個渠道(總共有40個渠道推廣)的註冊量已經佔據了產品總的渠道來源的90%以上。
•content-google14。82%的轉化率低於其它渠道。
visit = all_users。groupby([“first_affiliate_tracked”])[“id”]。count()
#統計不同內容的訪問量
booking = all_users。groupby([“first_affiliate_tracked”])[“date_first_booking”]。count()
#統計不同內容的註冊量
v_b = pd。merge(visit,booking,on = “first_affiliate_tracked” )
v_b[“rate”] = v_b[“booking”]/v_b[“visit”]
#統計轉化率
v_b = v_b。sort_values(“booking”,ascending = False)
v_b
營銷內容方面:
統計功能異常、資料追蹤效果差。
linked和omg兩個營銷內容的的轉化率好。
相比較其他營銷內容的轉化率、localops的轉化率非常低。
#統計總人數
users_sum = sessions。groupby([“user_id”])[“user_id”]。count()
users_sum。shape
#所有使用者中的活躍使用者數
user_active = user_action_count[user_action_count>=10]
user_active。shape
#註冊使用者數
pd_all = pd。merge(sessions,all_users,left_on=“user_id”,right_on=“id”)
pd_all。groupby([“user_id”])[“user_id”]。count()。shape
#下單使用者 使用者行為中“reservations”為預定(下單)使用者數
reser = sessions。loc[sessions[“action_detail”]==“reservations”]
reser。groupby(“user_id”)[“user_id”]。count()。shape
#實際支付使用者 使用者行為中“payment_instruments”為支付使用者數
payment = sessions。loc[sessions[“action_detail”]==“payment_instruments”]
payment。groupby(“user_id”)[“user_id”]。count()。shape
#復購使用者 統計進行了“payment_instruments”操作次數大於1次的使用者
repay = sessions。loc[sessions[“action_detail”]==“payment_instruments”]
repay_count = repay。groupby(“user_id”)[“user_id”]。count()
repay_count[repay_count>=2]
從視覺化結果可以看出:
•註冊使用者到下單使用者是airbnb轉化漏斗中流失率最高的一個環節。僅有14%的註冊使用者下單、僅佔全部使用者的7。651%。
•活躍和復購環節表現的好,其中有60%的下單使用者復購,說明airbnb的產品和服務做的非常好。
•下單使用者中有大約13%的使用者沒有最終支付,需要產品研發介入排查。
關於推廣渠道上的改進
•7~10月是業務的旺季,建議運營部門在每年的7~10月加大活動營銷的力度,同時加大渠道廣告的投放力度。
•在主要渠道(註冊量在前7名的渠道)中content_google轉化率非常低(只有15%),建議運營部門計算此渠道的*ROI和ARPU(每客戶平均收入),如果ROI過低,建議停止此渠道的投放。
•SEO推廣下各渠道的拉新和轉化都好,SEO作為一種較低成本的獲客方式(主要為人力成本),建議企業管理層日常要更加支援SEO相關的資源投入,甚至考慮擴大SEO的團隊。
備註:整個分析過程有借鑑知乎上週貳毛
https://
zhuanlan。zhihu。com/p/77
558304
的分析過程,他用的是sql寫的,我用的是pandas,影象上他用的是tableau,我用的是pyecharts。
*ROI=轉化率*ARPU值/CPC
上一篇:初入業餘無線電,想選個手臺?
下一篇:文軒大粉肆意天氣是不是腦子有大病