上一篇講了資料倉儲的家庭,還有魔術方塊使用下鑽、上捲、切片、切塊、旋轉功能介紹,如果還沒看過的可以點擊以下的網址。

資料探勘筆記4-資料倉儲(data warehouse) @ 奇怪的(´・ω・`)增加了的部落格 :: 痞客邦 :: (pixnet.net)

 

資料倉儲的身體檢查

 

1.全身擴散

  有幾個維度就有2的次方種表示方式,有三個維度就是2^3次方就是8種,由下而上聚集

 

image

 

 

2.症狀名稱

  從資料倉儲查詢出的結果稱為晶格(lattice),所以3個維度就有8個晶格(藍色的方塊)。

 

3.束手無策

  資料倉儲會把可能的查詢結果先算出來(偷跑),並儲存便下次的使用,但是當空間不足時,會先算出最多維度的晶格,方便往前推算。



資料倉儲的術前討論

 

  上次講了建置資料倉儲的步驟,這次講的是建置前程序。

 

1.需求分析

  你到底要什麼?或者是想要什麼?要先有一個方向才知道接下來要做什麼。

 

2.資料來源

  知道要什麼之後,就要開始蒐集資料,來源為何?

 

3.資料處理

  整理過的資料才有用阿。

 

4.架構

  由「真實資料表」&「維度資料表」所組成,兩個的差別在於一個是真實(原汁原味)的資料一個是經過統整(後期加工)的資料。

 

真實資料表與維度資料表的關係。

  主鍵(primary key)和外來鍵(foreign key),有學過資料庫大概都知道,就是這種關係。

 

image

 

 

  星狀式(有如星星般的耀眼) 維度資料表只有一個維度去連結真實資料表

image

 

  雪花式(如雪花般多變) 一個維度資料表接者一個維度資料表連結真實資料表。

image

 

星狀雪花式(冰?) 就是上面的混合版。

image

OLAP的家族

 

  在第三篇的時候又稍微介紹了,就好像是子彈與手槍的關係,子彈就是資料手槍就是OLAP,要什麼就打什麼,但是也有不同類型的武器阿。

 

1.ROLAP(手槍)

子彈->關聯式資料庫,容易(取)完(得)成,缺點就是效(射)率(速)

 

2.MOLAP(步槍) 

  子彈->資料立方體,可以(加)放(裝)彙整資料(彈鼓),效率高(射速快),缺點是只限特定子彈,要用別的要重新開發

 

3.HOLAP(衝鋒槍)

混和體,取得上述兩者的平衡。

 

 

arrow
arrow
    創作者介紹
    創作者 讀書小天地 的頭像
    讀書小天地

    書籍分享天地

    讀書小天地 發表在 痞客邦 留言(0) 人氣()