基于重用檢測(cè)的微博垃圾用戶過(guò)濾算法
本文關(guān)鍵詞: 垃圾消息 微博 重用檢測(cè) 出處:《南京大學(xué)學(xué)報(bào)(自然科學(xué)版)》2013年04期 論文類型:期刊論文
【摘要】:針對(duì)微博中的反垃圾處理問(wèn)題,本文提出了基于重用檢測(cè)模型的垃圾用戶檢測(cè)算法,該方法綜合考慮了消息序列中文本相關(guān)性和時(shí)間相關(guān)性,對(duì)垃圾用戶的發(fā)布行為進(jìn)行建模.按照文本粒度不同,基于重用檢測(cè)模型的檢測(cè)算法分為語(yǔ)句級(jí)檢測(cè)(SRD)和詞項(xiàng)級(jí)檢測(cè)(TRD).SRD算法側(cè)重于用戶行為方式,而TRD算法側(cè)重于垃圾消息的主題.基于真實(shí)數(shù)據(jù)集的實(shí)驗(yàn)表明,SRD算法在整體性能上優(yōu)于TRD算法,但TRD算法具有更高的運(yùn)行效率,并且檢測(cè)針對(duì)性強(qiáng),可發(fā)現(xiàn)指定類型的垃圾用戶.最后,本文運(yùn)用重用檢測(cè)算法在垃圾用戶群體檢測(cè)方面做了初步嘗試,實(shí)驗(yàn)表明基于轉(zhuǎn)發(fā)關(guān)系的重用檢測(cè)算法可以發(fā)現(xiàn)真實(shí)有效的垃圾群體用戶.
[Abstract]:For the problem of waste micro-blog in the proposed detection algorithm reuse spam detection model based on this method, considering the correlation and time correlation of text message sequence, modeling the user's garbage release behavior. According to the text of different size, detection algorithm reuse detection model is divided into a statement level detection based on SRD () and lexical entry level detection (TRD).SRD algorithm focuses on user behavior, while the TRD algorithm focuses on junk news theme. Experiments based on real data sets show that, SRD algorithm is better than TRD in the overall performance, but the TRD algorithm has higher efficiency, and the detection of targeted, can be found in the specified the type of garbage users. Finally, this paper uses the reuse detection algorithm in spam detection of user groups to do a preliminary attempt, experiments show that the reuse detection method based on the relationship of the forwarding can be issued The real and effective users of the garbage group.
【作者單位】: 南京師范大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院;
【基金】:江蘇省自然科學(xué)基金重點(diǎn)項(xiàng)目(BK2011005) 國(guó)家自然科學(xué)基金(61272221) 江蘇省社科基金(12YYA002)
【分類號(hào)】:TP393.092
【正文快照】: 微博作為目前流行的網(wǎng)絡(luò)營(yíng)銷媒體,為商業(yè)用戶拓展市場(chǎng)空間、樹(shù)立品牌形象和開(kāi)展網(wǎng)絡(luò)營(yíng)銷提供了巨大的幫助.但同時(shí)也成為了垃圾用戶(Spammer)發(fā)布非法廣告和垃圾消息的平臺(tái).垃圾消息的大量出現(xiàn)不僅影響了用戶的使用體驗(yàn),還妨礙了商業(yè)營(yíng)銷活動(dòng)在微博平臺(tái)上的健康發(fā)展.所以,研究
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 王鼎云;;對(duì)微博的發(fā)展?fàn)顩r和趨勢(shì)的冷思考[J];時(shí)代教育(教育教學(xué));2011年01期
2 王艷;;Twitter技術(shù)及其在情景教育中的應(yīng)用[J];中國(guó)西部科技;2010年16期
3 李士奇;;微博使用者應(yīng)具備的基本素養(yǎng)[J];科教導(dǎo)刊(上旬刊);2011年03期
4 張來(lái)勇;;淺析移動(dòng)互聯(lián)網(wǎng)技術(shù)的教育應(yīng)用[J];中國(guó)信息技術(shù)教育;2011年Z1期
5 崔爭(zhēng)艷;;基于語(yǔ)義的微博短信息分類[J];現(xiàn)代計(jì)算機(jī)(專業(yè)版);2010年08期
6 劉穎錄;;淺析新網(wǎng)絡(luò)時(shí)代的微博傳播[J];商業(yè)文化(上半月);2011年05期
7 申詩(shī)逸;;論“微博”的傳播特點(diǎn)與推廣[J];青年文學(xué)家;2010年14期
8 揭瀟君;;淺析動(dòng)漫作品在微博平臺(tái)的傳播[J];數(shù)字技術(shù)與應(yīng)用;2010年11期
9 王傳林;符易陽(yáng);;網(wǎng)絡(luò)隱蔽通道及其識(shí)別技術(shù)研究[J];現(xiàn)代電子技術(shù);2009年15期
10 陳丹偉;劉杰;孫國(guó)梓;韓俊;;一種基于概率訓(xùn)練的病毒檢測(cè)模型[J];計(jì)算機(jī)應(yīng)用研究;2010年06期
相關(guān)會(huì)議論文 前10條
1 秦首科;常建龍;谷姍姍;周傲英;;數(shù)據(jù)流上的綜合性突變檢測(cè)算法[A];第二十二屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2005年
2 廖鵬;;基于異常特征的DDoS檢測(cè)模型[A];經(jīng)濟(jì)發(fā)展方式轉(zhuǎn)變與自主創(chuàng)新——第十二屆中國(guó)科學(xué)技術(shù)協(xié)會(huì)年會(huì)(第四卷)[C];2010年
3 羅浩;方濱興;云曉春;王欣;辛毅;;一種高速實(shí)時(shí)的郵件蠕蟲(chóng)異常檢測(cè)模型[A];全國(guó)網(wǎng)絡(luò)與信息安全技術(shù)研討會(huì)'2005論文集(上冊(cè))[C];2005年
4 謝毅;張俊靈;王瑩;胡翠林;;一種基于SVM的信息安全入侵檢測(cè)模型[A];2007通信理論與技術(shù)新發(fā)展——第十二屆全國(guó)青年通信學(xué)術(shù)會(huì)議論文集(上冊(cè))[C];2007年
5 李俊薇;楊青;張連發(fā);黃宇穎;;基于貝葉斯定理的個(gè)性化體檢網(wǎng)站的研究[A];第二十三屆中國(guó)(天津)2009IT、網(wǎng)絡(luò)、信息技術(shù)、電子、儀器儀表創(chuàng)新學(xué)術(shù)會(huì)議論文集[C];2009年
6 李千目;戚涌;嚴(yán)悍;張宏;劉鳳玉;;基于免疫學(xué)的網(wǎng)絡(luò)節(jié)點(diǎn)故障檢測(cè)系統(tǒng)[A];第二十二屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2005年
7 李俊薇;楊青;張連發(fā);黃宇穎;;基于貝葉斯定理的個(gè)性化體檢網(wǎng)站的研究[A];第二十二屆中國(guó)(天津)'2008IT、網(wǎng)絡(luò)、信息技術(shù)、電子、儀器儀表創(chuàng)新學(xué)術(shù)會(huì)議論文集[C];2008年
8 許列;王明印;;基于隱馬爾可夫模型(HMM)實(shí)時(shí)異常檢測(cè)[A];中國(guó)通信學(xué)會(huì)第六屆學(xué)術(shù)年會(huì)論文集(上)[C];2009年
9 劉子豪;莊毅;;一種電子郵件敏感信息檢測(cè)算法[A];第八屆全國(guó)信息隱藏與多媒體安全學(xué)術(shù)大會(huì)湖南省計(jì)算機(jī)學(xué)會(huì)第十一屆學(xué)術(shù)年會(huì)論文集[C];2009年
10 帥春燕;江建慧;歐陽(yáng)鑫;;基于狀態(tài)機(jī)的多階段網(wǎng)絡(luò)攻擊模型及檢測(cè)算法[A];第六屆中國(guó)測(cè)試學(xué)術(shù)會(huì)議論文集[C];2010年
相關(guān)重要報(bào)紙文章 前10條
1 包家慶;IDS五大發(fā)展趨勢(shì)[N];網(wǎng)絡(luò)世界;2002年
2 ;分擔(dān)分析提高無(wú)線安全性[N];網(wǎng)絡(luò)世界;2005年
3 科文;VIXD算法分析Web異常[N];中國(guó)計(jì)算機(jī)報(bào);2008年
4 ;方興未艾的入侵檢測(cè)技術(shù)[N];人民郵電;2007年
5 陳星霖;NIDS:老樹(shù)發(fā)新枝[N];網(wǎng)絡(luò)世界;2009年
6 谷雨;入侵檢測(cè)需要協(xié)同[N];網(wǎng)絡(luò)世界;2001年
7 中聯(lián)綠盟、李群;IDS的關(guān)鍵:解決好誤報(bào)和漏報(bào)[N];中國(guó)計(jì)算機(jī)報(bào);2002年
8 ;免費(fèi)與付費(fèi)IDS你選誰(shuí)[N];中國(guó)計(jì)算機(jī)報(bào);2005年
9 趙曉濤;當(dāng)Web安全成為難以實(shí)現(xiàn)的夢(mèng)想[N];網(wǎng)絡(luò)世界;2008年
10 ;聯(lián)想網(wǎng)御百兆防火墻[N];計(jì)算機(jī)世界;2002年
相關(guān)博士學(xué)位論文 前10條
1 王曉鋒;Web應(yīng)用入侵異常檢測(cè)新技術(shù)研究[D];華中科技大學(xué);2007年
2 李目海;基于流量的分布式拒絕服務(wù)攻擊檢測(cè)[D];華東師范大學(xué);2010年
3 張亮;推薦系統(tǒng)中協(xié)同過(guò)濾算法若干問(wèn)題的研究[D];北京郵電大學(xué);2009年
4 楊曉峰;基于機(jī)器學(xué)習(xí)的Web安全檢測(cè)方法研究[D];南京理工大學(xué);2011年
5 曾劍平;基于模糊集的自適應(yīng)偽裝入侵檢測(cè)算法及其在ASP服務(wù)安全中的應(yīng)用研究[D];廈門大學(xué);2006年
6 趙靜;網(wǎng)絡(luò)協(xié)議異常檢測(cè)模型的研究與應(yīng)用[D];北京交通大學(xué);2010年
7 詹川;反垃圾郵件技術(shù)的研究[D];電子科技大學(xué);2005年
8 秦首科;數(shù)據(jù)流上的異常檢測(cè)[D];復(fù)旦大學(xué);2006年
9 吳作順;基于免疫學(xué)的入侵檢測(cè)系統(tǒng)研究[D];中國(guó)人民解放軍國(guó)防科學(xué)技術(shù)大學(xué);2003年
10 黎耀;IPv6環(huán)境下異常檢測(cè)系統(tǒng)的關(guān)鍵技術(shù)研究[D];華中科技大學(xué);2006年
相關(guān)碩士學(xué)位論文 前10條
1 朱少萍;微博內(nèi)作弊和推廣聯(lián)盟的檢測(cè)算法研究[D];大連理工大學(xué);2013年
2 王翔宇;基于IP流量的僵尸網(wǎng)絡(luò)檢測(cè)模型的設(shè)計(jì)與實(shí)現(xiàn)[D];上海交通大學(xué);2011年
3 陳濤;網(wǎng)絡(luò)威脅檢測(cè)模型及行為序列分析方法研究[D];西安電子科技大學(xué);2010年
4 米金良;入侵檢測(cè)技術(shù)及其應(yīng)用[D];西安建筑科技大學(xué);2003年
5 王棟;防火墻深度包檢測(cè)技術(shù)研究[D];西安電子科技大學(xué);2005年
6 吳甜甜;一種低存儲(chǔ)消耗的超點(diǎn)檢測(cè)算法研究[D];大連海事大學(xué);2012年
7 李俐穎;分布式拒絕服務(wù)攻擊檢測(cè)技術(shù)研究[D];電子科技大學(xué);2007年
8 何金艷;基于內(nèi)容分析的Blog話題檢測(cè)方法研究[D];哈爾濱工業(yè)大學(xué);2010年
9 胡大偉;基于標(biāo)簽協(xié)同過(guò)濾算法在微博推薦中的研究[D];內(nèi)蒙古科技大學(xué);2012年
10 江華;基于組合聚類分析的網(wǎng)絡(luò)異常檢測(cè)模型[D];中國(guó)民航大學(xué);2013年
,本文編號(hào):1481617
本文鏈接:http://www.wukwdryxk.cn/guanlilunwen/ydhl/1481617.html