hive

您當前的位置：首頁 > 標簽>hive

Hive - 建立在Hadoop架構之上的資料倉庫
總結：從上到下的這個過程，從客戶端傳遞sql至driver來解析sql語句到最後生成物理執行計劃交給mapreduce執行這些都是由hive核心完成的，我們輸入僅僅只有一條sql語句，那麼輸出就是相應的作業的輸出了，那麼左邊還剩下兩個框Me
2017-09-11標簽： hive MySQL SQL MapReduce
閱讀更多
大資料學習：Hadoop入門學習書單
Hadoop大資料學習書單：1、Hadoop權威指南：大資料的儲存與分析(第4版)作者：Tom White著王海，華東，劉喻，呂粵海譯這本書作為Hadoop最全面的入門書，結合理論和實踐，由淺入深，全方位介紹了Hadoop這一高效能的海量數
2020-11-17標簽： Hadoop HDFS MapReduce hive 資料
閱讀更多
請問各位Java的大資料的路線是什麼呢？
現如今，正式為了應對大資料的這幾個特點，開源的大資料框架越來越多，越來越強，先列舉一些常見的：檔案儲存：Hadoop HDFS、Tachyon、KFS離線計算：Hadoop MapReduce、Spark流式、實時計算：Storm、Spar
2020-04-18標簽：資料 Hadoop hive SQL HDFS
閱讀更多
面試|不可不知的十大Hive調優技巧最佳實踐
Apache Hive是建立在Apache Hadoop之上的資料倉庫軟體專案，用於提供資料查詢和分析
2020-11-16標簽： hive 查詢 join 分割槽
閱讀更多
7.8、Hive 資料查詢詳解
id as STRING））
2021-06-04標簽： EMP id select hive
閱讀更多
八家國企大資料面經(乾貨，詳細答案)
（一般不會這麼操作）Kafka cluster：Kafka由多個broker組成，一個broker作為一個例項（節點）Kafka叢集可以儲存多種型別的資料，是由多個topic進行分類的一個topic其實就是一個佇列每個topic可以建立一個
2019-09-17標簽：資料面試官 hive join 執行緒
閱讀更多
Spark SQL你不得不知道的那些事兒
文件上說sparkSQL是處理結構化資料的模組，這個說過了，他與基本的RDD程式設計是不一樣的，那麼sparkSQL提供了一些介面，這些介面可以提供給spark更多的資訊包括資料的結構化以及在計算層面的執行都做了很多的最佳化，那麼事實上，S
2017-09-16標簽： SQL hive Spark shark
閱讀更多
Hive初識二
auto=true⑤向hive中匯入資料的方式伺服器本地檔案：load data local inpath ’/opt/data/hive/hive-t1-1
2021-09-28標簽： hive MySQL OPT T1 安裝
閱讀更多
五萬字 | Hive知識體系保姆級教程
階段四：最佳化邏輯執行計劃Hive中的邏輯查詢最佳化可以大致分為以下幾類：投影修剪推導傳遞謂詞謂詞下推將Select-Select，Filter-Filter合併為單個操作多路 Join查詢重寫以適應某些列值的Join傾斜階段五：生成物理執
2021-08-19標簽： hive String select tablename
閱讀更多
Hive常見面試問題
當distribute by 和sort by 欄位相同時，可以使用cluster by3）Hive map,reduce數怎麼設定1）通常情況下，作業會透過input的目錄產生一個或者多個map任務合併小檔案，減少map數set mapr
2021-01-24標簽： reduce name hive cost map
閱讀更多
Shell指令碼結合Hive自動分析日誌資訊
load_dynamic_table partition（date=‘${hiveconf：DAY}’，hour=‘${hiveconf：HOUR}’）修改我們的指令碼$HIVE_HOME/bin/hive ——hiveconf log_
2019-12-22標簽： String load hive Table hiveconf
閱讀更多
Hive資料倉庫實戰
建表操作#建Hive表指令碼create EXTERNAL table IF NOT EXISTS ods_kc_fact_clicklog_tab（userid string，kcid string，time string）ROW FOR
2020-11-22標簽： ODS KC fact hive chongdianleme
閱讀更多
【筆記】Hive知識整合（33）
reduce上的傾斜：空值產生傾斜、大小表連線、資料型別不一致hive已經有這個功能了，要做的就是把小表放在前邊就可以了總結-1 Hive 資料表分割槽、分桶的作用是為了提高查詢效率，分割槽表產生不用的目錄避免全表掃描，分桶表產生不同的檔案
2022-01-19標簽：查詢分桶資料抽樣 hive
閱讀更多
《Hive使用者指南》- Hive的連線join與排序
對於某些特殊的情況，即小表與大表的連線，這種情況下Hive提供了mapjoin功能，透過將連線操作全部在Map任務中完成，大大提高效率——沒有Reduce任務，避免產生資料傾斜沒有Map、Reduce任務中間的shuffle操作，減少網路傳
2020-04-09標簽： hive 連線 value1 Sort distribute
閱讀更多
Flink + Iceberg 在去哪兒的實時數倉實踐
在 BI 上的收益是：原先 BI 為了提升 Hive 查詢速度建了多級分割槽，導致小檔案和元資料過多，入湖過程中，利用 Spark 排序 BI 經常查詢的條件，結合隱式分割槽，最終提升 BI 檢索速度的同時，也沒有小檔案的問題，Iceber
2021-06-24標簽： Iceberg 資料 hive 實時檔案
閱讀更多
Flink1.11+Hive批流一體數倉
所以如果需要用Flink流式消費Hive的分割槽表，那應該保證分割槽在新增的時候它的資料是完整的
2021-11-17標簽： hive Flink 資料流式 SQL
閱讀更多
大資料系列之大資料開發工程師
png綜合結果如下知識1、本科及以上學歷（3）2、計算機相關專業（4）硬技能1、熟練掌握hadoop、Hbase、Hive、Storm、Spark Streaming、flink等大資料開發工具中一種或幾種（5）2、熟悉shell、pyth
2020-09-17標簽：開發資料資料倉庫熟悉 hive
閱讀更多

Hive - 建立在Hadoop架構之上的資料倉庫

大資料學習：Hadoop入門學習書單

請問各位Java的大資料的路線是什麼呢？

面試|不可不知的十大Hive調優技巧最佳實踐

7.8、Hive 資料查詢詳解

八家國企大資料面經(乾貨，詳細答案)

Spark SQL你不得不知道的那些事兒

Hive初識二

五萬字 | Hive知識體系保姆級教程

Hive常見面試問題

Shell指令碼結合Hive自動分析日誌資訊

Hive資料倉庫實戰

【筆記】Hive知識整合（33）

《Hive使用者指南》- Hive的連線join與排序

Flink + Iceberg 在去哪兒的實時數倉實踐

Flink1.11+Hive批流一體數倉

大資料系列之大資料開發工程師