您當前的位置:首頁 > 體育

多維分析常用操作 – 切片、切塊

作者:由 happy貓貓 發表于 體育時間:2022-08-18

多維分析是針對資料集(稱為 CUBE)做互動操作,基於一個或多個維度彙總指標,達到從不同維度或角度觀察資料(測度)的目的,其計算本質實際上就是對一個數據集做分組彙總。

用 SQL 描述為:SELECT D,…, SUM(M), … FROM C GROUP BY D,…

其中,D(GROUP BY 的)就是多維分析中所說的維度(觀察角度),M 是測度(觀察的資料,可以求和、計數等),C 則為資料立方體(CUBE)。

這是個經典的資料立方體模型:

多維分析常用操作 – 切片、切塊

維度有產品、年度、地區等,測度為銷售額,當然還可以有其它維度和測度了。

切片、切塊

瞭解了多維分析的概念和其計算本質後, 再理解切片、切塊就相對簡單一些了。那麼,作為多維分析常用操作之一的切片、切塊,其本質又是啥?又有啥意義呢?

首先說下什麼是切片(塊),是指指定了某些維度值後,來觀察剩餘維度的測度變化。

比如,分析“2012 年各地區各產品銷售額”,切片維度為“年度”,維度值指定為單值“2012”後,觀察各地區產品的銷售情況,這就是切片,如下

多維分析常用操作 – 切片、切塊

如果是“2011、2012 年各地區各產品銷售額”,切片維度值為“2011”及“2012”多個了,則為切塊。

多維分析常用操作 – 切片、切塊

結合兩圖可以看出,“切塊”時,選出的資料是一個三維子集,而“切片”是一個二維子集。

如果用 SQL 來描述,其實就是 WHERE 部分增加了維度值過濾條件,目的是用來選擇維度中的固定值進行分析。

SELECT D,…, SUM(M), … FROM C WHERE D’=d’ AND … GROUP BY D,…

D’是切片(塊)維度, 緯度值為單值時是切片、多值則為切塊。

所以,切片(塊)的計算本質就是對指定維度的資料過濾,其意義在於更細緻的剖析資料,便於分析人員多側面地觀察、對比資料。

操作示例

接下來,看下如何進行切片、切塊的操作。

安裝潤乾報表後,啟動自帶 demo 應用

1、 訪問分析介面

url:

http://

localhost:6868/demo/raq

soft/guide/jsp/olap。jsp

多維分析常用操作 – 切片、切塊

2、 選擇資料集,並拖拽生成分析報表

這裡採用預先準備的 Excel 資料檔案。

多維分析常用操作 – 切片、切塊

維度為:年度、城市、產品;測度為:訂單額

3、 切片、切塊

對於上面的分析報表,進一步做切片及切塊的處理,如前面提到的,切片觀察“2012 年度各城市各產品的銷售額”,即固定(篩選)年度維度值為“2012”的資料,如下

多維分析常用操作 – 切片、切塊

多維分析常用操作 – 切片、切塊

切塊是同樣操作過程,如分析 2011、2012 各地區各產品銷售額,年度值給定為“2011,2012”,多值時用逗號隔開即可。

多維分析常用操作 – 切片、切塊

標簽: 維度  切片  切塊  2012  測度