上一篇講了資料倉儲的前後端、資料倉儲建置過程、OLAP跟data mining的差別、OLAP跟OLTP的差別,沒看過的可以點擊下面的連結。
資料探勘筆記3-再再次認識資料探勘 @ 奇怪的(´・ω・`)增加了的部落格 :: 痞客邦 :: (pixnet.net)
資料倉儲的家庭
1. 資料倉儲(data warehouse) 父母
經過時間的堆積,把人生的經歷整理過後放入腦袋中(資料倉儲),以後有需要就可以查看。
2. 資料超市(data mart) 小孩
經過父母的教導,把待人處事的道理,記在腦海中,為了之後的人生。(資(腦)料(容)量小)。
3.多層次資料倉儲
父母下面還有很多的小孩。
4.聯合式資料倉儲
父母的上面可能還有父母
資料倉儲的真面目
前面有講,資料倉儲是儲存多維度的資料,所以儲存的架構稱為多維度資料庫結構,也可以由關聯式資料庫、多維度資料立方體來做,或兩者混合,那下面就來講資料立方體(data cube)。
俄羅斯方塊?
你可以把資料立方體(data cube)想像成一個魔術方塊,但是他中間也是有方塊的,這個範例(飯粒?)有三個維度月份、商品、地區,這三個維度,所構成的一個方塊稱為cell(單元),而每一個cell都有一個量值在這裡是指價錢。
魔方的一部份
把魔術方塊拆開大概長這樣,然後魔方也是有階層(級)關係,稱概念階層(concept hierarchy),這樣子是不是可以很快速的查詢。
月份維度:年、季、月。
商品維度:商品類型、商品價錢。
地區維度:北、中、南。
暴力拆開魔術方塊
1.下鑽(drill down)
方塊中暗藏一個方塊,可以更清楚的知道細節。
2.上捲(roll up)
一個魔方其實只是一個方塊,更大的世界觀。
3.切片(slice)
我要xx->xx月分的資料。
4.切塊(dice)
在買一個新的魔方。
5.旋轉(rotate)
從各個角度看魔方。
留言列表