X hits on this document

Powerpoint document

第十一章 顧客關係管理CRM與資料探勘 - page 31 / 41

133 views

0 shares

0 downloads

0 comments

31 / 41

2/14/2015

第十一章 顧客關係管理CRM與資料探勘

31

決策樹

人工智慧領域的決策分析機制

利用樹狀結構的資料表示法 (Data Representation),再加上適當的演算法 (Algorithm)

選擇一個分隔屬性

用屬性將物件作分類

算分隔後之平均分散度

節點

根部(root):資料從根部的節點進入決策樹

子節點(child node):每一個節點代表「是」或「否」的問題點。答案代表前往下一個問題的前進路徑。

葉部節點(leaf node):決策過程一再重複,直到資料到達葉部節點為止

分散度定義:一群物件分散的程度,有以下三種測量方法(以二個物件為例):

Min (P1, P2)

P1*P2

Entropy(亂度): (-P1 log(P1)) + (-P2log(P2))

能使"分散度"or"亂度" 降得最低,即為最佳分隔變數。

Document info
Document views133
Page views136
Page last viewedThu Dec 08 03:23:29 UTC 2016
Pages41
Paragraphs838
Words1192

Comments