徐idealxuideal@163.com决策树•决策树简介•创建策略•候选集划分•构建流程•剪枝处理•代码实战目录2课前甜点3•什么是树?•决策树简介•直观理解•概述•使用•介绍•创建策略•候选集划分•构建流程•剪枝处理•代码实战目录4•决策树是一种树形结构,其中每个内部节点表示一个属性上的测试,每个分支代表一个测试输出,每个叶节点代表一种类别。决策树是一种十分常用的分类回归方法•凯特想在某征婚网站上寻找自己的另一半,但她发现在海量的信息中筛选出值得见面的人比较繁琐。因此,凯特想建立一个模型,让模型帮自己从众多候选者中筛选出自己有意愿见面的对象。•做法:从网站里随机挑选了100个人,主要观察4个特征,并给出标记(是否见面)。然后凯特训练了一个决策树模型,通过模型对征婚网站上的人进行筛选直观理解5序号收入年龄公务员长相是否见面122k25否帅是27k23是中等否325k31否中等否........................10015k27是中等是直观理解6分类决策树•凯特想在某征婚网站上寻找自己的另一半,但她发现在海量的信息中筛选出值得见面的人比较繁琐。因此,凯特想建立一个模型,让模型帮自己从众多候选者中筛选出自己有意愿见面的对象。•做法:从网站里随机挑选了100个人,主要观察4个特征,并给出标记(这个男生在自己心里的打分)。然后凯特训练了一个决策树模型,通过模型对征婚网站上的人进行筛选直观理解7序号收入年龄公务员长相打分122k25否帅9727k23是中等43325k31否中等30........................10015k27是中等73直观理解8回归决策树概述9•决策树结构•结点(node):内部结点和叶结点。内部结点=》?;叶结点=》?•有向边•分类决策树•叶结点=》类别•回归决策树•叶结点=》实数特征标签使用10•决策树的构建•暂略•决策树的预测•从根结点开始,对实例的某一特征进行测试,根据测试结果将实例分配到其子结点,如此递归地对实例进行判断并分配,直至达到叶结点。•叶结点对应什么?•分类:输出得票最多的类•回归:输出样本标签的均值•备注•可以将决策树看成一个if-else规则的集合。每一个实例只被一条路径所覆盖介绍•从历史上来说,决策树的起源非常早,甚至在有机器学习之前就有决策树了,因为决策树模仿的是人类在做决策的过程。在医药、商业的应用里,如何让电脑模仿人类做决策是一个很早的人工智能问题•决策树的构建包含了很多前人的巧思(启发式),但是为什么要这样做并没有什么理论保证,决策树的构建算...