2007年10月11日 星期四

Data Mining

資料探勘
所以它一定是跟"資料"有關
和資料相關的第一個一定是想到資料庫
探勘,一般也說是採擴,顧名思義,它的資料量一定很大
所以資料倉儲(data warehouse)是基礎課程

有了資料後
前置動作(Preprocessing)就是把要的資料留下來,不要的丟棄,不好不對的加以修正
如果資料量太大,還要用資料精簡方法讓SIZE小一點

資料有了統一的格式後
就可以來把資料分類,一般是以決策樹為基礎的分類法最為常見
分類好就可以使用測試樣本(test sample)來驗証分類法對不對

另還有一些群集分析(Cluster Analysis)用來切割資料
主要是要將資料記錄加以分群成數個群集,群集資料較有高的相似程度

沒有留言: