基于向量空間模型的畢業(yè)論文相似性辨識研究
本文選題:向量空間模型 + 相似性計算; 參考:《科學(xué)技術(shù)與工程》2007年09期
【摘要】:隨著高校擴招以及互聯(lián)網(wǎng)信息膨脹,高校畢業(yè)論文管理中排查論文抄襲的工作量越來越大。文中提出采用向量空間模型計算論文之間的相似度,通過相似度排序,找出“可疑”論文,然后再進行人工審核,從而加快了管理機構(gòu)對論文排查的速度,減少了人工排查的工作量,增加了論文排查過程的公正性。
[Abstract]:With the expansion of college enrollment and the expansion of Internet information, the workload of investigating plagiarism in the management of graduation thesis is increasing. In this paper, a vector space model is proposed to calculate the similarity between papers. Through similarity ranking, we can find out the "suspicious" papers, and then carry out manual review, thus speeding up the speed of the management organization to search the papers. The workload of manual search is reduced, and the fairness of the process is increased.
【作者單位】: 湖南大學(xué)經(jīng)濟管理數(shù)據(jù)中心 長沙航空職業(yè)技術(shù)學(xué)院
【分類號】:TP391.1
【參考文獻】
相關(guān)期刊論文 前2條
1 龐劍鋒,卜東波,白碩;基于向量空間模型的文本自動分類系統(tǒng)的研究與實現(xiàn)[J];計算機應(yīng)用研究;2001年09期
2 吳棟,滕育平;中文信息檢索引擎中的分詞與檢索技術(shù)[J];計算機應(yīng)用;2004年07期
【共引文獻】
相關(guān)期刊論文 前10條
1 戰(zhàn)守義,井新;加入時間因素的個性化信息過濾技術(shù)[J];北京理工大學(xué)學(xué)報;2005年09期
2 代勁;胡峰;王國胤;;基于不完備信息系統(tǒng)的文本分類研究與應(yīng)用[J];重慶郵電學(xué)院學(xué)報(自然科學(xué)版);2006年03期
3 李粵;安捷;李星;;排序融合算法在校園網(wǎng)搜索引擎中的應(yīng)用[J];大連理工大學(xué)學(xué)報;2005年S1期
4 邵晶,黨海峰,白慧先,鄭慶華;OPAC資源與網(wǎng)絡(luò)教育資源共享集成關(guān)鍵技術(shù)研究[J];大學(xué)圖書館學(xué)報;2005年03期
5 蔡勇智;基于最大匹配分詞算法的中文詞語粗分模型[J];福建電腦;2005年09期
6 谷峰;吳揚揚;;文本分類關(guān)鍵技術(shù)[J];福建電腦;2006年09期
7 賀衛(wèi)紅;曹毅;;基于向量空間模型文本過濾算法[J];系統(tǒng)工程;2005年10期
8 胡佳妮,徐蔚然,郭軍,鄧偉洪;中文文本分類中的特征選擇算法研究[J];光通信研究;2005年03期
9 謝科;張輝;陳鵬;龐斌;;文本分類系統(tǒng)關(guān)鍵技術(shù)[J];廣西師范大學(xué)學(xué)報(自然科學(xué)版);2007年02期
10 朱培毅,黃敏;基于Boosting算法的文本自動分類器模型設(shè)計[J];高校圖書館工作;2004年05期
相關(guān)會議論文 前2條
1 Zhao Shuanzhu Chen Junjie Guo Xin College of Computer and Software Taiyuan University of Technology,Taiyuan,Shanxi,Chnia,030024;Research on the Frame Structure and Its Implement of a Special Field-based Content Information Mining System on Web[A];Proceedings of 6th International Symposium on Test and Measurement(Volume 8)[C];2005年
2 王虎;王潛平;;對整詞二分自動分詞機制的改進[A];中國計算技術(shù)與語言問題研究——第七屆中文信息處理國際會議論文集[C];2007年
相關(guān)博士學(xué)位論文 前10條
1 楊震;個性化信息獲取方法的研究[D];大連理工大學(xué);2004年
2 劉華;基于關(guān)鍵短語的文本內(nèi)容標引研究[D];北京語言大學(xué);2005年
3 孫越恒;基于統(tǒng)計的NLP技術(shù)在中文信息檢索中的應(yīng)用研究[D];天津大學(xué);2005年
4 王秀娟;文本檢索中若干問題研究[D];北京郵電大學(xué);2006年
5 劉濤;現(xiàn)代信息檢索中的文本分類及圖像恢復(fù)研究[D];北京郵電大學(xué);2006年
6 周瑛;神經(jīng)網(wǎng)絡(luò)作為分類器的算法研究及在信息檢索中的應(yīng)用[D];安徽大學(xué);2006年
7 張亮;面向開放域的中文問答系統(tǒng)問句處理相關(guān)技術(shù)研究[D];南京理工大學(xué);2006年
8 姜韶華;科研項目管理中的文本挖掘方法研究及應(yīng)用[D];大連理工大學(xué);2006年
9 杜衛(wèi)鋒;粗糙集理論在中文文本分類中的應(yīng)用[D];西南交通大學(xué);2006年
10 王永恒;海量短語信息挖掘技術(shù)的研究與實現(xiàn)[D];國防科學(xué)技術(shù)大學(xué);2006年
相關(guān)碩士學(xué)位論文 前10條
1 楊盛;電子郵件過濾系統(tǒng)的研究與設(shè)計[D];中南大學(xué);2005年
2 邱宇紅;向量空間模型在醫(yī)學(xué)文獻相關(guān)性研究中的應(yīng)用[D];中國醫(yī)科大學(xué);2006年
3 馬安香;基于分類語義的Web信息抽取機制的研究與實現(xiàn)[D];東北大學(xué);2005年
4 周欽強;基于人工智能技術(shù)Naive Bayes文本自動分類系統(tǒng)研究[D];廣東工業(yè)大學(xué);2005年
5 侯麗敏;基于網(wǎng)絡(luò)的智能答疑系統(tǒng)的研究與實現(xiàn)[D];河南大學(xué);2005年
6 胡卓穎;專題型網(wǎng)頁搜集器關(guān)鍵算法的研究及實現(xiàn)[D];江西師范大學(xué);2005年
7 廖海波;基于投影尋蹤回歸的文本分類研究[D];江西師范大學(xué);2005年
8 付雪峰;基于模糊—粗糙集的文本分類模型[D];江西師范大學(xué);2005年
9 李威;基于向量空間的文本自動分類系統(tǒng)的研究和實現(xiàn)[D];蘭州理工大學(xué);2005年
10 陳樂;基于智能文本分類技術(shù)的素材管理軟件的設(shè)計與開發(fā)[D];南京師范大學(xué);2003年
【二級參考文獻】
相關(guān)期刊論文 前1條
1 嚴威,趙政;開發(fā)中文搜索引擎漢語處理的關(guān)鍵技術(shù)[J];計算機工程;1999年06期
【相似文獻】
相關(guān)期刊論文 前10條
1 李虎;鄒鵬;賈焰;周斌;;一種基于MapReduce的分布式文本數(shù)據(jù)過濾模型研究[J];信息網(wǎng)絡(luò)安全;2011年09期
2 申瑩;徐東平;龐俊;;基于概念的中文博客情感極性聚類分析[J];計算機系統(tǒng)應(yīng)用;2011年08期
3 潘正高;侯傳宇;談成訪;;基于命名實體的Web新聞文本分類方法[J];合肥工業(yè)大學(xué)學(xué)報(自然科學(xué)版);2011年08期
4 孫桂煌;;一種基于n-gram短語的文本聚類方法研究[J];現(xiàn)代計算機(專業(yè)版);2011年14期
5 孟佳娜;林鴻飛;李彥鵬;;基于特征貢獻度的特征選擇方法在文本分類中應(yīng)用[J];大連理工大學(xué)學(xué)報;2011年04期
6 李志明;李善平;楊朝暉;林欣;;基于本體分割的本體映射算法[J];模式識別與人工智能;2011年02期
7 冷亞軍;梁昌勇;張恩橋;戚筱雯;;基于項類偏好的協(xié)同過濾推薦算法[J];情報學(xué)報;2011年07期
8 許志凱;徐志明;李棟;李生;;面向互聯(lián)網(wǎng)新聞的話題檢測與追蹤[J];智能計算機與應(yīng)用;2011年03期
9 李e,
本文編號:1842408
本文鏈接:http://www.wukwdryxk.cn/wenshubaike/caipu/1842408.html