您當前的位置:首頁 > 繪畫

離線數倉和實時數倉區別?

作者:由 Ijlhsub 發表于 繪畫時間:2022-01-18

離線數倉和實時數倉區別?馬士兵教育官方2022-01-18 21:31:33

我們從以下7個方面來對比離線數倉與實時數倉區別:

1。架構選擇方面,離線數倉採用傳統大資料架構模式搭建,而實時數倉採用Kappa架構方式搭建。

2。建設方法上兩者都是採用傳統數倉建模方法論。

3。準確性方面,離線數倉準確度高,實時數倉隨著技術發展,準確度也比較高。

4。實時性方面:離線數倉統計資料結果一般是T+1,實時數倉統計結果一般是分鐘級別、秒級別。

5。穩定性方面:離線數倉穩定性好、方便重算。實時數倉對資料波動比較敏感,資料重新計算時相對麻煩。

6。資料吞吐量方面,離線數倉吞吐量都很高,實時數倉隨著實時技術發展吞吐量較高。

7。資料儲存方面,離線數倉一般將資料儲存在HDFS、Hive中,實時數倉一般將資料儲存在Kafka、Hbase、Redis、ClickHouse中。

離線數倉和實時數倉區別?Flink實戰剖析2022-02-01 16:04:34

一、技術棧上,離線一般hive spark hdfs等,實時flink kafka hbase

二、分層上,離線分層更多,實時相對減少

三、實效性上,實時更加實時,延時控制在秒級別

四、運維上,實時相對比較困難,其儲存使用kafka ,不可查詢,排查問題比較困難

五、業務需求上,離線多於實時。

歡迎關注[Flink實戰剖析]公眾號一起進步~

標簽: 數倉  離線  實時  資料  方面