电脑桌面
添加蜗牛文库到电脑桌面
安装后可以在桌面快捷访问

第18章概率潜在语义分析.pptxVIP免费

第18章概率潜在语义分析.pptx第18章概率潜在语义分析.pptx第18章概率潜在语义分析.pptx第18章概率潜在语义分析.pptx
第十八章概率潜在语义分析概率潜在语义分析•概率潜在语义分析(probabilisticlatentsemanticanalysis,PLSA),是一种利用概率生成模型对文本集合进行话题分析的无监督学习方法。•模型的最大特点是用隐变量表示话题;整个模型表示文本生成话题,话题生成单词,从而得到单词一文本共现数据的过程•假设每个文本由一个话题分布决定,每个话题由一个单词分布决定。•概率潜在语义分析受潜在语义分析的启发,前者基于概率模型,后者基于非概率模型基本想法•给定一个文本集合,每个文本讨论若干个话题,每个话题由若干个单词表示。•对文本集合进行概率潜在语义分析,就能够发现每个文本的话题,以及每个话题的单词。•话题是不能从数据中直接观察到的,是潜在的。基本想法•文本集合转换为文本-单词共现数据,具体表现为单词-文本矩阵•文本数据基于如下的概率模型产生(共现模型):•首先有话题的概率分布,然后有话题给定条件下文本的条件概率分布,以及话题给定条件下单词的条件概率分布。•概率潜在语义分析就是发现由隐变量表示的话题,即潜在语义。•直观上,语义相近的单词、语义相近的文本会被聚到相同的软的类别中,而话“”题所表示的就是这样的软的类别。基本想法•假设有3个潜在的话题,图中三个框各自表示一个话题。生成模型•假设有单词集合,其中M是单词个数•文本(指标)集合,其中N是文本个数•话题集合,其中K是预先设定的话题个数•随机变量w取值于单词集合•随机变量d取值于文本集合•随机变量z取值于话题集合生成模型•概率分布P(d)、条件概率分布P(zld)、条件概率分布P(w|z)皆属于多项分布•P(d):生成文本d的概率•P(zId):文本d生成话题z的概率•P(wIz):话题z生成单词w的概率•一个文本的内容由其相关话题决定,一个话题的内容由其相关单词决定。生成模型•生成模型通过以下步骤生成文本-单词共现数据:•(1)依据概率分布P(d),从文本(指标)集合中随机选取一个文本d,共生成N个文本;针对每个文本,执行以下操作•(2)在文本d给定条件下,依据条件概率分布P(z|d),从话题集合随机选取一个话题z,共生成L个话题,这里L是文本长度•(3)在话题z给定条件下,依据条件概率分布P(wlz),从单词集合中随机选取一个单词w生成模型•生成模型中,单词变量w与文本变量d是观测变量,话题变量z是隐变量•模型生成的是单词-话题-文本三元组(w,z,d)的集合,但观测到的是单词-文本二元组(w,d)的集合•观测数据表示为单词-文本矩阵T的...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。
3、如文档内容存在违规,或者侵犯商业秘密、侵犯著作权等,请点击“违规举报”。

碎片内容

蜗牛文库的最新文档

二年级数学下册其中检测卷二年级数学下册其中检测卷附答案#期中测试卷.pdf
10.00金币
0下载
二年级数学下册期末质检卷(苏教版)二年级数学下册期末质检卷(苏教版)#期末复习 #期末测试卷 #二年级数学 #二年级数学下册#关注我持续更新小学知识.pdf
10.00金币
0下载
二年级数学下册期末混合运算专项练习二年级数学下册期末混合运算专项练习#二年级#二年级数学下册#关注我持续更新小学知识 #知识分享 #家长收藏孩子受益.pdf
10.00金币
1下载
二年级数学下册年月日三类周期问题解题方法二年级数学下册年月日三类周期问题解题方法#二年级#二年级数学下册#知识分享 #关注我持续更新小学知识 #家长收藏孩子受益.pdf
10.00金币
0下载
二年级数学下册解决问题专项训练二年级数学下册解决问题专项训练#专项训练#解决问题#二年级#二年级数学下册#知识分享.pdf
10.00金币
1下载
二年级数学下册还原问题二年级数学下册还原问题#二年级#二年级数学#关注我持续更新小学知识 #知识分享 #家长收藏孩子受益.pdf
10.00金币
1下载
二年级数学下册第六单元考试卷家长打印出来给孩子测试测试争取拿到高分!#小学二年级试卷分享 #二年级第六单考试数学 #第六单考试#二年级数学下册.pdf
10.00金币
0下载
二年级数学下册必背顺口溜口诀汇总二年级数学下册必背顺口溜口诀汇总#二年级#二年级数学下册 #知识分享 #家长收藏孩子受益 #关注我持续更新小学知识.pdf
10.00金币
0下载
二年级数学下册《重点难点思维题》两大问题解决技巧和方法巧算星期几解决周期问题还原问题强化思维训练老师精心整理家长可以打印出来给孩子练习#家长收藏孩子受益 #学霸秘籍 #思维训练 #二年级 #知识点总结.pdf
10.00金币
0下载
二年级数学下册 必背公式大全寒假提前背一背开学更轻松#二年级 #二年级数学 #二年级数学下册 #寒假充电计划 #公式.pdf
10.00金币
0下载
蜗牛文库+ 关注
实名认证
内容提供者

提供各种专业文档内容

确认删除?
QQ
  • QQ点击这里给我发消息
微信客服
  • 微信客服
回到顶部