查詢意圖自動(dòng)分類與分析
發(fā)布時(shí)間:2025-01-13 23:14
當(dāng)今時(shí)代,信息呈指數(shù)級(jí)增長(zhǎng),信息社會(huì)給用戶帶來(lái)豐富信息的同時(shí),也使得用戶在信息海洋中容易迷失方向。從海量的信息資源中準(zhǔn)確、快速地獲取所需信息成為信息服務(wù)者不斷努力的方向,在此背景下,搜索引擎成為了幫助用戶快速定位到互聯(lián)網(wǎng)資源并獲取相關(guān)信息的重要工具。然而,用戶向搜索引擎輸入的簡(jiǎn)短查詢存在模糊性和歧義性,通常只能粗略地表達(dá)用戶信息需求,因此,用戶迫切希望搜索引擎能自動(dòng)識(shí)別查詢中包含的用戶意圖,直接返回與其信息需求相關(guān)的文檔。于是,查詢意圖(即查詢中應(yīng)包含的用戶信息需求、目標(biāo)等)識(shí)別是當(dāng)前學(xué)界和業(yè)界一研究熱點(diǎn)。 其中,給定類目體系下的查詢意圖分類是查詢意圖識(shí)別的重要研究方向。當(dāng)前的此類研究大多基于Broder提出的分類體系(即將查詢意圖分為信息類、導(dǎo)航類和事務(wù)類)進(jìn)行,且主要工作是探討如何對(duì)信息類和導(dǎo)航類進(jìn)行有效區(qū)分,而對(duì)如何實(shí)現(xiàn)信息類、事務(wù)和導(dǎo)航類三者自動(dòng)分類的研究甚少。另查詢意圖的分類信息需最終用于指導(dǎo)搜索引擎性能優(yōu)化中,而當(dāng)前對(duì)如何利用查詢意圖分類信息來(lái)指導(dǎo)搜索引擎優(yōu)化的探討較少。 基于此,本文首先實(shí)現(xiàn)信息類、導(dǎo)航類與事務(wù)類的自動(dòng)分類,且在此基礎(chǔ)上,首次嘗試從搜索引擎穩(wěn)定性、個(gè)...
【文章頁(yè)數(shù)】:175 頁(yè)
【學(xué)位級(jí)別】:博士
【文章目錄】:
論文創(chuàng)新點(diǎn)
圖目錄
表目錄
摘要
Abstract
0 引言
0.1 選題背景與研究意義
0.1.1 選題背景
0.1.2 研究意義
0.2 國(guó)內(nèi)外研究現(xiàn)狀分析
0.2.1 查詢意圖研究現(xiàn)狀
0.2.2 搜索引擎穩(wěn)定性研究現(xiàn)狀
0.2.3 查詢個(gè)性化潛力研究現(xiàn)狀
0.2.4 網(wǎng)絡(luò)動(dòng)態(tài)研究現(xiàn)狀
0.2.5 研究述評(píng)
0.3 研究方法與研究思路
0.3.1 研究方法
0.3.2 研究思路
0.4 研究?jī)?nèi)容與創(chuàng)新
0.4.1 研究?jī)?nèi)容
0.4.2 研究創(chuàng)新
1 相關(guān)理論基礎(chǔ)
1.1 基于認(rèn)知的信息檢索模型
1.1.1 信息需求表達(dá)研究
1.1.2 相關(guān)性研究
1.2 查詢意圖相關(guān)理論
1.2.1 查詢意圖概念界定
1.2.2 查詢意圖理解維度
1.2.3 查詢意圖分類體系
1.2.4 查詢意圖分析維度
2 查詢意圖自動(dòng)分類
2.1 查詢意圖分類體系構(gòu)建
2.2 查詢意圖分類的相關(guān)方法
2.2.1 查詢表示方法
2.2.2 查詢意圖特征選取
2.2.3 查詢意圖分類算法
2.2.4 查詢意圖分類效果評(píng)測(cè)
2.3 查詢意圖分類的難點(diǎn)
2.4 查詢意圖特征選取
2.4.1 已有提出的查詢意圖特征
2.4.2 本文提出的查詢意圖特征
2.5 實(shí)驗(yàn)及其結(jié)果分析
2.5.1 數(shù)據(jù)集獲取
2.5.2 人工標(biāo)注
2.5.3 查詢會(huì)話切分
2.5.4 查詢處理
2.5.5 實(shí)驗(yàn)設(shè)計(jì)
2.5.6 實(shí)驗(yàn)結(jié)果分析
2.6 實(shí)驗(yàn)總結(jié)
3 查詢意圖的搜索引擎穩(wěn)定性分析
3.1 搜索引擎穩(wěn)定性概述
3.1.1 搜索引擎不穩(wěn)定的原因
3.1.2 搜索引擎穩(wěn)定性的概念界定
3.2 衡量搜索引擎穩(wěn)定性的方法
3.2.1 基于重疊的方法
3.2.2 Spearman's footrule方法
3.2.3 Kendall tau方法
3.2.4 Fagin's方法
3.3 數(shù)據(jù)集獲取
3.3.1 搜索引擎的選取
3.3.2 實(shí)驗(yàn)數(shù)據(jù)的獲取
3.4 查詢意圖的同一搜索引擎穩(wěn)定性分析
3.4.1 基于Purl與Turl指標(biāo)的穩(wěn)定性分析
3.4.2 基于Kendall tau距離的穩(wěn)定性分析
3.5 查詢意圖的不同搜索引擎之間穩(wěn)定性分析
3.6 實(shí)驗(yàn)總結(jié)
3.6.1 實(shí)驗(yàn)小結(jié)
3.6.2 相關(guān)建議
4 查詢意圖的個(gè)性化潛力分析
4.1 查詢個(gè)性化潛力概述
4.2 衡量個(gè)性化潛力的相關(guān)指標(biāo)
4.2.1 顯式評(píng)測(cè)指標(biāo)
4.2.2 隱式評(píng)測(cè)指標(biāo)
4.3 實(shí)驗(yàn)數(shù)據(jù)來(lái)源
4.3.1 人工評(píng)測(cè)數(shù)據(jù)集
4.3.2 其它數(shù)據(jù)集
4.4 實(shí)驗(yàn)結(jié)果分析
4.4.1 查詢意圖的個(gè)性化潛力分析
4.4.2 不同指標(biāo)之間的相關(guān)性分析
4.4.3 查詢意圖的表征個(gè)性化潛力的查詢特征分析
4.5 實(shí)驗(yàn)總結(jié)
4.5.1 實(shí)驗(yàn)小結(jié)
4.5.2 相關(guān)建議
5 查詢意圖的網(wǎng)絡(luò)動(dòng)態(tài)分析
5.1 衡量網(wǎng)絡(luò)動(dòng)態(tài)的方法
5.1.1 衡量查詢動(dòng)態(tài)的方法
5.1.2 衡量信息需求動(dòng)態(tài)的方法
5.1.3 衡量文檔動(dòng)態(tài)的方法
5.2 數(shù)據(jù)集獲取
5.3.1 查詢與結(jié)果集的選擇
5.3.2 基于人工評(píng)測(cè)的數(shù)據(jù)
5.3 實(shí)驗(yàn)結(jié)果分析
5.3.1 查詢意圖的查詢動(dòng)態(tài)分析
5.3.2 查詢意圖的文檔動(dòng)態(tài)分析
5.3.3 查詢意圖隨查詢動(dòng)態(tài)的文檔動(dòng)態(tài)分析
5.3.4 查詢意圖隨查詢動(dòng)態(tài)的信息需求動(dòng)態(tài)分析
5.4 實(shí)驗(yàn)總結(jié)
5.4.1 實(shí)驗(yàn)小結(jié)
5.4.2 相關(guān)建議
6 研究總結(jié)與展望
6.1 研究總結(jié)
6.2 研究展望
中英文參考文獻(xiàn)
攻博期間科研成果列表
致謝
本文編號(hào):4026041
【文章頁(yè)數(shù)】:175 頁(yè)
【學(xué)位級(jí)別】:博士
【文章目錄】:
論文創(chuàng)新點(diǎn)
圖目錄
表目錄
摘要
Abstract
0 引言
0.1 選題背景與研究意義
0.1.1 選題背景
0.1.2 研究意義
0.2 國(guó)內(nèi)外研究現(xiàn)狀分析
0.2.1 查詢意圖研究現(xiàn)狀
0.2.2 搜索引擎穩(wěn)定性研究現(xiàn)狀
0.2.3 查詢個(gè)性化潛力研究現(xiàn)狀
0.2.4 網(wǎng)絡(luò)動(dòng)態(tài)研究現(xiàn)狀
0.2.5 研究述評(píng)
0.3 研究方法與研究思路
0.3.1 研究方法
0.3.2 研究思路
0.4 研究?jī)?nèi)容與創(chuàng)新
0.4.1 研究?jī)?nèi)容
0.4.2 研究創(chuàng)新
1 相關(guān)理論基礎(chǔ)
1.1 基于認(rèn)知的信息檢索模型
1.1.1 信息需求表達(dá)研究
1.1.2 相關(guān)性研究
1.2 查詢意圖相關(guān)理論
1.2.1 查詢意圖概念界定
1.2.2 查詢意圖理解維度
1.2.3 查詢意圖分類體系
1.2.4 查詢意圖分析維度
2 查詢意圖自動(dòng)分類
2.1 查詢意圖分類體系構(gòu)建
2.2 查詢意圖分類的相關(guān)方法
2.2.1 查詢表示方法
2.2.2 查詢意圖特征選取
2.2.3 查詢意圖分類算法
2.2.4 查詢意圖分類效果評(píng)測(cè)
2.3 查詢意圖分類的難點(diǎn)
2.4 查詢意圖特征選取
2.4.1 已有提出的查詢意圖特征
2.4.2 本文提出的查詢意圖特征
2.5 實(shí)驗(yàn)及其結(jié)果分析
2.5.1 數(shù)據(jù)集獲取
2.5.2 人工標(biāo)注
2.5.3 查詢會(huì)話切分
2.5.4 查詢處理
2.5.5 實(shí)驗(yàn)設(shè)計(jì)
2.5.6 實(shí)驗(yàn)結(jié)果分析
2.6 實(shí)驗(yàn)總結(jié)
3 查詢意圖的搜索引擎穩(wěn)定性分析
3.1 搜索引擎穩(wěn)定性概述
3.1.1 搜索引擎不穩(wěn)定的原因
3.1.2 搜索引擎穩(wěn)定性的概念界定
3.2 衡量搜索引擎穩(wěn)定性的方法
3.2.1 基于重疊的方法
3.2.2 Spearman's footrule方法
3.2.3 Kendall tau方法
3.2.4 Fagin's方法
3.3 數(shù)據(jù)集獲取
3.3.1 搜索引擎的選取
3.3.2 實(shí)驗(yàn)數(shù)據(jù)的獲取
3.4 查詢意圖的同一搜索引擎穩(wěn)定性分析
3.4.1 基于Purl與Turl指標(biāo)的穩(wěn)定性分析
3.4.2 基于Kendall tau距離的穩(wěn)定性分析
3.5 查詢意圖的不同搜索引擎之間穩(wěn)定性分析
3.6 實(shí)驗(yàn)總結(jié)
3.6.1 實(shí)驗(yàn)小結(jié)
3.6.2 相關(guān)建議
4 查詢意圖的個(gè)性化潛力分析
4.1 查詢個(gè)性化潛力概述
4.2 衡量個(gè)性化潛力的相關(guān)指標(biāo)
4.2.1 顯式評(píng)測(cè)指標(biāo)
4.2.2 隱式評(píng)測(cè)指標(biāo)
4.3 實(shí)驗(yàn)數(shù)據(jù)來(lái)源
4.3.1 人工評(píng)測(cè)數(shù)據(jù)集
4.3.2 其它數(shù)據(jù)集
4.4 實(shí)驗(yàn)結(jié)果分析
4.4.1 查詢意圖的個(gè)性化潛力分析
4.4.2 不同指標(biāo)之間的相關(guān)性分析
4.4.3 查詢意圖的表征個(gè)性化潛力的查詢特征分析
4.5 實(shí)驗(yàn)總結(jié)
4.5.1 實(shí)驗(yàn)小結(jié)
4.5.2 相關(guān)建議
5 查詢意圖的網(wǎng)絡(luò)動(dòng)態(tài)分析
5.1 衡量網(wǎng)絡(luò)動(dòng)態(tài)的方法
5.1.1 衡量查詢動(dòng)態(tài)的方法
5.1.2 衡量信息需求動(dòng)態(tài)的方法
5.1.3 衡量文檔動(dòng)態(tài)的方法
5.2 數(shù)據(jù)集獲取
5.3.1 查詢與結(jié)果集的選擇
5.3.2 基于人工評(píng)測(cè)的數(shù)據(jù)
5.3 實(shí)驗(yàn)結(jié)果分析
5.3.1 查詢意圖的查詢動(dòng)態(tài)分析
5.3.2 查詢意圖的文檔動(dòng)態(tài)分析
5.3.3 查詢意圖隨查詢動(dòng)態(tài)的文檔動(dòng)態(tài)分析
5.3.4 查詢意圖隨查詢動(dòng)態(tài)的信息需求動(dòng)態(tài)分析
5.4 實(shí)驗(yàn)總結(jié)
5.4.1 實(shí)驗(yàn)小結(jié)
5.4.2 相關(guān)建議
6 研究總結(jié)與展望
6.1 研究總結(jié)
6.2 研究展望
中英文參考文獻(xiàn)
攻博期間科研成果列表
致謝
本文編號(hào):4026041
本文鏈接:http://www.wukwdryxk.cn/tushudanganlunwen/4026041.html
最近更新
教材專著