離線數倉和實時數倉區別?
作者:由 Ijlhsub 發表于 繪畫時間:2022-01-18
我們從以下7個方面來對比離線數倉與實時數倉區別:
1。架構選擇方面,離線數倉採用傳統大資料架構模式搭建,而實時數倉採用Kappa架構方式搭建。
2。建設方法上兩者都是採用傳統數倉建模方法論。
3。準確性方面,離線數倉準確度高,實時數倉隨著技術發展,準確度也比較高。
4。實時性方面:離線數倉統計資料結果一般是T+1,實時數倉統計結果一般是分鐘級別、秒級別。
5。穩定性方面:離線數倉穩定性好、方便重算。實時數倉對資料波動比較敏感,資料重新計算時相對麻煩。
6。資料吞吐量方面,離線數倉吞吐量都很高,實時數倉隨著實時技術發展吞吐量較高。
7。資料儲存方面,離線數倉一般將資料儲存在HDFS、Hive中,實時數倉一般將資料儲存在Kafka、Hbase、Redis、ClickHouse中。
一、技術棧上,離線一般hive spark hdfs等,實時flink kafka hbase
二、分層上,離線分層更多,實時相對減少
三、實效性上,實時更加實時,延時控制在秒級別
四、運維上,實時相對比較困難,其儲存使用kafka ,不可查詢,排查問題比較困難
五、業務需求上,離線多於實時。
歡迎關注[Flink實戰剖析]公眾號一起進步~