上一次講了資料探勘的流程和四大護法,沒看過的可以點擊以下連結。
資料探勘筆記2-再次認識資料探勘 @ 奇怪的(´・ω・`)增加了的部落格 :: 痞客邦 :: (pixnet.net)
另結新歡
這次要來講資料倉儲(data warehouse),通常會搭配OLAP和data mining 。(腳踏兩條船)
data warehouse屬於後端的,在背後辛苦的工作者,只為了給前端的OLAP和data mining來去給決策者一些意見。
腳踏兩條船的過程
data warehouse就是厲害(渣男),來介紹一下使(犯)用(罪)的過程。
1.蒐集資料
從各個地方蒐集資料。
2.資料整理
選出自己要下手的目標,如果有不明的就不要。
3.資料整合
統整成一個表格方便觀看。
4.資料載入和定期更新
建立一個資料立方體(data club),還要定期的更新名單。
兩條船之間的差別
題外話
講一下為什麼渣男會這麼喜歡腳踏兩條船,不知道大家有沒有聽過一個實驗就是一個籠子中放入一公一母的老鼠,因為鼠心大悅所以會交配,交配完之後實驗人員把那隻母老鼠拿走,放入一隻新的母老鼠,結果公老鼠又開始了那個過程,實驗人員重複了很多次這個過程,所以如果渣男有第一次就會有第二次,女性朋友要小心啊,當然也會有例外,被發現後悲痛萬分的改了,只不過那個人不會在你身邊。
分析處理OLAP是使用者使用了之後,會顯示查詢的結果,而這個結果要使用者自己去看,優點就是快速、方便。
資料探勘data mining是把資料經過了一些工具(統計、分析...)得出我好帥這個結果,不要瞎掰好嗎,優點就是可能會發現一些奇特確有用的知識。
外來者挑戰
挑戰者:
資料庫代表:線上交易處理(on-line Transcation Processing,OLTP)。
被挑戰者:
資料倉儲代表 :線上分析處理(on-Line Analytical Processing,OLAP)。
留言列表