close

上一篇講了資料維度的精簡的方法,沒有看過的可以點擊以下的網址

資料探勘筆記9-維度精簡 @ 奇怪的(´・ω・`)增加了的部落格 :: 痞客邦 :: (pixnet.net)

 

數值精簡的方法

 

  如果是針對年齡的話,可以分成 少年、青年、中年、老年,可以用標準去分,也可以用裝箱法來分,以減少數值的多樣性,在資料清理的時候就有講過裝箱法,有分等寬跟等深,沒有看過的可以點擊以下的網址,我就不贅述了。

資料探勘筆記6-資料前置處理 @ 奇怪的(´・ω・`)增加了的部落格 :: 痞客邦 :: (pixnet.net)

 

 

資料紀錄的方法

1.抽樣法(sampling)

1.隨機抽樣

1.取回式 - 可重複。

2.不取回式 - 不可重複、較常使用。

在一堆資料中抽出幾筆資料當作,來精簡過於龐雜的資料。

 

2.隨機分層

我們依據下面的月收入分成3個層分別是1、2、3,如果我要3個資料的話分別從這三個層各抽出1筆。

 

image

 

 

 

 

 

 

 

 

 

 

arrow
arrow
    創作者介紹
    創作者 讀書小天地 的頭像
    讀書小天地

    書籍分享天地

    讀書小天地 發表在 痞客邦 留言(0) 人氣()