基于新穎性和影響力的論文推薦方法研究
【文章頁(yè)數(shù)】:61 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖2-1LDA模型
第二章相關(guān)技術(shù)理論介紹11第二章相關(guān)技術(shù)理論介紹2.1LDA主題模型LDA(LatentSemanticAnalysis)是一種概率主題模型,在自然語(yǔ)言處理中常被用于挖掘海量文檔集合或語(yǔ)料庫(kù)中的潛在的主題信息以及歸屬于這些主題的單詞分布情況。LDA模型中包含三個(gè)層次,自上而下分別....
圖2-2自編碼神經(jīng)系統(tǒng)結(jié)構(gòu)
華南理工大學(xué)碩士學(xué)位論文12Step2:從狄利克雷分布β中為每個(gè)主題抽取對(duì)應(yīng)的單詞分布矩陣。Step3:文檔i中的單詞將根據(jù)下面步驟逐步生成,重復(fù)下面步驟直到該篇文檔抽取完畢:1)從主題分布矩陣iθ中抽樣生成目標(biāo)單詞j所對(duì)應(yīng)的的主題jiz,2)從單詞分布矩陣中取樣生成目標(biāo)單詞ji....
圖2-3Word2vec模型
華南理工大學(xué)碩士學(xué)位論文14單詞的語(yǔ)義特征,而向量與向量之間的距離了則表示了單詞之間的語(yǔ)義相似度。Word2vec主要包括Skip-gram和CBOW(ContinuousBag-of-WordsModel)兩種模型。模型結(jié)構(gòu)如圖2-3所示。兩種模型都是三層神經(jīng)網(wǎng)絡(luò)模型,其包括輸....
圖3-1圖形變化特征提取過程
第三章基于主題共現(xiàn)圖的論文新穎性檢測(cè)方法研究19圖3-1圖形變化特征提取過程其中,背景圖是表示先前觀察到的所有論文的主題共現(xiàn)圖。論文圖是表示一篇論文構(gòu)建的主題共現(xiàn)圖。然后提取在添加過程中論文的主題共現(xiàn)圖與當(dāng)前背景圖結(jié)合所產(chǎn)生的變化特征。當(dāng)添加完一篇論文之后,該論文的主題共現(xiàn)圖與當(dāng)....
本文編號(hào):3998380
本文鏈接:http://www.wukwdryxk.cn/tushudanganlunwen/3998380.html