徐idealxuideal@163.com朴素贝叶斯•贝叶斯公式•朴素贝叶斯•特征工程-词频统计•代码实战目录2•早雾晴,晚雾阴?课前甜点3•贝叶斯公式•概率•条件概率•全概率公式•贝叶斯公式•朴素贝叶斯•特征工程-词频统计•代码实战目录4•概率5•条件概率•设A,B为任意两个事件,若P(A)>0,我们称在已知事件A发生的条件下,事件B发生的概率为条件概率,记为P(B|A),并定义条件概率6)()()|(APABPABP•全概率公式•如果,P(Ai)>0,则对任一事件B,有•案例:•假设在聊天群的环境中,假设A时间是有人发消息•而发送消息的人只可能是‘小姐姐’,‘卢本伟’,‘灰太狼’•那么这三个就是所有的可能性(100%)•将B记为问问题的可能性,我们知道,发言的三个人都有可能提问,那么提问的概率是多少呢?•就是将这三个人发言提问的可能性进行加和就可以了全概率公式7)(1jiAAAjinii对一切,niiiABPAPBP1)|()()(•贝叶斯公式(又称逆概公式)•如果,P(Ai)>0,则对任一事件B,只要P(B)>0,有•我们可以通过贝叶斯公式,可以通过某件事情发生条件,来预测某些条件下,发生这件事情的概率贝叶斯公式8)(1jiAAAjinii对一切,),...,2,1,(|||1njiABPAPABPAPBPBAPBAPniiijjjj•如果将贝叶斯公式的思想使用到机器学习中,效能是不是很大,可以帮助我们去预测类别呢?•不可行•因为在显示过程中特征值不只有一个,很难去计算概率,计算复杂度很高•P(X(1)X(2)X(3)|Y)•如何可以降低运算复杂度呢?贝叶斯公式9•贝叶斯公式•朴素贝叶斯•定义•直观理解•朴素价值•拉普拉斯平滑•案例分析•底层实现•特征工程-词频统计•代码实战目录10定义•朴素贝叶斯法是基于贝叶斯定理与特征条件独立假设的分类方法。最为广泛的两种分类模型是决策树模型(DecisionTreeModel)和朴素贝叶斯模型(NaiveBayesianModel,NBM)。•贝叶斯定理是关于随机事件A和B的条件概率(或边缘概率)的一则定理。其中P(A|B)是在B发生的情况下A发生的可能性。11定义12•在机器学习中,朴素贝叶斯分类器是一系列以假设特征之间强独立(朴素)下运用贝叶斯定理为基础的简单概率分类器。•高度可扩展的,求解过程只需花费线性时间•目前来说,朴素贝叶斯在文本分类(textclassification)的领域的应用多,无论是sklearn还是SparkMllib中,都只定制化地实现了在文本分类领域的算法直观理解•肤色x1={黑,黄},发型x2={卷,直}...