close
上一篇講了資料維度的精簡的方法,沒有看過的可以點擊以下的網址
資料探勘筆記9-維度精簡 @ 奇怪的(´・ω・`)增加了的部落格 :: 痞客邦 :: (pixnet.net)
數值精簡的方法
如果是針對年齡的話,可以分成 少年、青年、中年、老年,可以用標準去分,也可以用裝箱法來分,以減少數值的多樣性,在資料清理的時候就有講過裝箱法,有分等寬跟等深,沒有看過的可以點擊以下的網址,我就不贅述了。
資料探勘筆記6-資料前置處理 @ 奇怪的(´・ω・`)增加了的部落格 :: 痞客邦 :: (pixnet.net)
資料紀錄的方法
1.抽樣法(sampling)
1.隨機抽樣
1.取回式 - 可重複。
2.不取回式 - 不可重複、較常使用。
在一堆資料中抽出幾筆資料當作,來精簡過於龐雜的資料。
2.隨機分層
我們依據下面的月收入分成3個層分別是1、2、3,如果我要3個資料的話分別從這三個層各抽出1筆。
文章標籤
全站熱搜
留言列表