数学之美&浪潮之巅吴军Google研究院2008年12月30日整理I目录1.数学之美................................................................11.1.数学之美系列一—统计语言模型..................................................11.2.数学之美系列二—谈谈中文分词..................................................51.3.数学之美系列三—隐含马尔可夫模型在语言处理中的应用....................91.4.数学之美系列四—怎样度量信息?...............................................131.5.数学之美系列五—简单之美:布尔代数和搜索引擎的索引..................171.6.数学之美系列六—图论和网络爬虫(WebCrawlers)......................221.7.数学之美系列七—信息论在信息处理中的应用................................261.8.数学之美系列八—贾里尼克的故事和现代语言处理..........................291.9.数学之美系列九—如何确定网页和查询的相关性.............................351.10.数学之美系列十—有限状态机和地址识别.....................................391.11.数学之美系列十一—Google阿卡47的制造者阿米特.辛格博士........421.12.数学之美系列十二—余弦定理和新闻的分类..................................451.13.数学之美系列十三—信息指纹及其应用........................................491.14.数学之美系列十四—谈谈数学模型的重要性..................................521.15.数学之美系列十五—繁与简自然语言处理的几位精英......................551.16.数学之美系列十六(上)—不要把所有的鸡蛋放在一个篮子里-谈谈最大熵模型591.17.数学之美系列十六(下)—不要把所有的鸡蛋放在一个篮子里-最大熵模型..631.18.数学之美系列十七—闪光的不一定是金子--谈谈搜索引擎作弊问题(SearchEngineAnti-SPAM)............................................................671.19.数学之美系列十八—矩阵运算和文本处理中的分类问题.....................701.20.数学之美系列十九—马尔可夫链的扩展贝叶斯网络(BayesianNetworks)741.21.数学之美系列二十—自然语言处理的教父--马库斯........................761.22.数学之美系列二十一—布隆过滤器(BloomFilter).......................791.23.数学之美系列二十二—由电视剧《暗算》所想到的-谈谈密码学的数学原理821.24.数学之美系列二十三—输入一个汉字需要敲...