报告人:兰艳艳中国科学院计算技术研究所智能信息检索模型52%45%教育背景012001-2005本科,山东大学数学系统计学专业022005-2011中国科学院数学与系统科学研究院概率统计专业,博士学位工作经历⚫2011.7-2013.9,中科院计算所,助理研究员⚫2013.9-2019.9,中科院计算所,副研究员⚫2018.4-2019.4,美国加州伯克利大学,访问学者⚫2019.9至今,中科院计算所,研究员学术成果研究方向:机器学习与信息检索⚫CCF-A类论文42篇⚫GoogleScholar引用2651次,h-Index24⚫获得SIGIR最佳学生论文奖⚫获得CIKM最佳论文Runner-Up奖主要学术工作机缘巧合:2006基于机器学习的网页排序马志明院士刘铁岩博士研究方向:基于学习的信息检索模型查询数据排序用户数据匹配搜索、推荐监督学习表示න𝑄න𝑋×𝑌𝐿𝑓;𝑥,𝑦𝑃𝑑𝑥,𝑑𝑦𝑃(𝑑𝑞)1𝑚𝑖=1𝑚1𝑛𝑖𝑗=1𝑛𝑖𝐿𝑓;𝑥𝑖,𝑦𝑖𝑃𝑑𝑥𝑗,𝑑𝑦𝑗𝑃(𝑑𝑞𝑖)期望风险经验风险𝑓∗排序机器学习模型分类Pointwise𝑥𝑦文档相关度Pairwise𝑥=(𝑥1,𝑥(2))一对文档𝑦偏好度Listwise𝑞=𝑥=(𝑥1,⋯,𝑥(𝑛))文档集𝑦排序列表排序机器学习模型研究历史研究工作⚫深度文本匹配学习⚫对话式信息检索深度文本匹配学习⚫人工定义特征的局限性⚫代价高(专业知识,领域相关)⚫不全面,过于具体⚫深度学习在各个领域的巨大成功ChristopherManning.UnderstandingHumanLanguage:CanNLPandDeepLearningHelp?KeynoteSIGIR2016深度文本匹配学习SiameseNetworkCIKM13DSSM模型CIKM14CDSSM模型NIPS14ARC-I模型问题:学到的是数据的表示,而不是匹配的特征深度文本匹配学习核心挑战:如何自动学习匹配特征?基于交互的深度文本匹配模型深度文本匹配学习核心思想:关联矩阵将两个欧式向量空间映射到一个高维张量空间,实现匹配特征的联合学习查询空间文档空间匹配空间深度文本匹配学习核心挑战:如何自动学习匹配特征?基于交互的深度文本匹配模型AAAI2016MatchPyramid模型IJCAI2016MatchSRNN模型CIKM2017DeepRank模型CIKM2017ViP模型AAAI2016MV-LSTM模型SIGIR2018HiNT模型深度文本匹配学习:MatchPyramid模型出发点:文本匹配的层次化结构LiangPang,YanyanLan,JiafengGuo,JunXuandXueqiCheng,TextMatchingasImageRecognition,AAAI2016.深度文本匹配学习:MatchPyramid模型出发点:文本匹配的层次化结构LiangPang,YanyanLan,JiafengGuo,JunXuandXueqiCheng,TextMatchingasImageRecognition,AAAI2016.深度文本匹配学习:MatchPyramid模型出发点...