上一篇講了資料倉儲的家庭,還有魔術方塊使用下鑽、上捲、切片、切塊、旋轉功能介紹,如果還沒看過的可以點擊以下的網址。
資料探勘筆記4-資料倉儲(data warehouse) @ 奇怪的(´・ω・`)增加了的部落格 :: 痞客邦 :: (pixnet.net)
資料倉儲的身體檢查
1.全身擴散
有幾個維度就有2的次方種表示方式,有三個維度就是2^3次方就是8種,由下而上聚集。
2.症狀名稱
從資料倉儲查詢出的結果稱為晶格(lattice),所以3個維度就有8個晶格(藍色的方塊)。
3.束手無策
資料倉儲會先把可能的查詢結果先算出來(偷跑),並儲存便下次的使用,但是當空間不足時,會先算出最多維度的晶格,方便往前推算。
資料倉儲的術前討論
上次講了建置資料倉儲的步驟,這次講的是建置前程序。
1.需求分析
你到底要什麼?或者是想要什麼?要先有一個方向才知道接下來要做什麼。
2.資料來源
知道要什麼之後,就要開始蒐集資料,來源為何?
3.資料處理
整理過的資料才有用阿。
4.架構
由「真實資料表」&「維度資料表」所組成,兩個的差別在於一個是真實(原汁原味)的資料一個是經過統整(後期加工)的資料。
真實資料表與維度資料表的關係。
主鍵(primary key)和外來鍵(foreign key),有學過資料庫大概都知道,就是這種關係。
星狀式(有如星星般的耀眼) 維度資料表只有一個維度去連結真實資料表。
雪花式(如雪花般多變) 一個維度資料表接者一個維度資料表連結真實資料表。
星狀雪花式(冰?) 就是上面的混合版。
OLAP的家族
在第三篇的時候又稍微介紹了,就好像是子彈與手槍的關係,子彈就是資料,手槍就是OLAP,要什麼就打什麼,但是也有不同類型的武器阿。
1.ROLAP(手槍)
子彈->關聯式資料庫,容易(取)完(得)成,缺點就是效(射)率(速)慢。
2.MOLAP(步槍)
子彈->資料立方體,可以存(加)放(裝)彙整資料(彈鼓),效率高(射速快),缺點是只限特定子彈,要用別的要重新開發。
3.HOLAP(衝鋒槍)
混和體,取得上述兩者的平衡。
留言列表