a国产,中文字幕久久波多野结衣AV,欧美粗大猛烈老熟妇,女人av天堂

采用URL特征的Hub網(wǎng)頁識別方法研究

發(fā)布時間:2019-11-25 22:11
【摘要】:【目的】通過構(gòu)建簡單數(shù)據(jù)樣本,解決傳統(tǒng)網(wǎng)頁類型識別方法效率低的難題。【方法】采用URL特征作為識別依據(jù),抽取URL信息構(gòu)建訓(xùn)練集與測試集,使用支持向量機(jī)(SVM)建立機(jī)器學(xué)習(xí)模型以提高識別效率。【結(jié)果】在同樣的數(shù)據(jù)集上,該方法的準(zhǔn)確率為91.2%,優(yōu)于其他識別方法。在效率性能方面,該方法提升近60%!揪窒蕖慨(dāng)遇到URL特征不明顯甚至完全相背的網(wǎng)站時,識別準(zhǔn)確率會大幅度降低!窘Y(jié)論】該方法在效率方面存在很大優(yōu)勢,應(yīng)用到采集系統(tǒng)中可提高采集效率。

【參考文獻(xiàn)】

相關(guān)碩士學(xué)位論文 前1條

1 謝光華;中文網(wǎng)頁自動分類的研究及其應(yīng)用[D];大連理工大學(xué);2007年

【共引文獻(xiàn)】

相關(guān)碩士學(xué)位論文 前6條

1 蘇秀芝;網(wǎng)頁去噪與特征提取算法的研究及實現(xiàn)[D];西南交通大學(xué);2010年

2 白凡;改進(jìn)的K近鄰算法在網(wǎng)頁文本分類中的應(yīng)用[D];安徽大學(xué);2010年

3 劉艷敏;網(wǎng)頁自動分類和存儲管理系統(tǒng)的設(shè)計與實現(xiàn)[D];北京郵電大學(xué);2010年

4 王立建;中文web文本過濾技術(shù)研究[D];中北大學(xué);2010年

5 郭媛媛;基于GIS的商場疏散安全評估系統(tǒng)的設(shè)計與實現(xiàn)[D];電子科技大學(xué);2013年

6 錢強(qiáng);中文網(wǎng)頁分類算法研究[D];江蘇科技大學(xué);2013年

【二級參考文獻(xiàn)】

相關(guān)期刊論文 前9條

1 陳桂林,王永成;Internet網(wǎng)絡(luò)信息自動摘要的研究[J];高技術(shù)通訊;1999年02期

2 馮是聰,單松巍,龔筆宏,張志剛,李曉明;“天網(wǎng)”目錄導(dǎo)航服務(wù)研究[J];計算機(jī)研究與發(fā)展;2004年04期

3 王琦,唐世渭,楊冬青,王騰蛟;基于DOM的網(wǎng)頁主題信息自動提取[J];計算機(jī)研究與發(fā)展;2004年10期

4 周明建,高濟(jì),李飛;基于本體論的Web信息抽取[J];計算機(jī)輔助設(shè)計與圖形學(xué)學(xué)報;2004年04期

5 趙欣欣;索紅光;劉玉樹;;基于標(biāo)記窗的網(wǎng)頁正文信息提取方法[J];計算機(jī)應(yīng)用研究;2007年03期

6 許勇,荀恩東,賈愛平,宋柔;基于互連網(wǎng)的術(shù)語定義獲取系統(tǒng)[J];中文信息學(xué)報;2004年04期

7 孫承杰,關(guān)毅;基于統(tǒng)計的網(wǎng)頁正文信息抽取方法的研究[J];中文信息學(xué)報;2004年05期

8 胡國平;張巍;王仁華;;基于雙層決策的新聞網(wǎng)頁正文精確抽取[J];中文信息學(xué)報;2006年06期

9 范焱,鄭誠,王清毅,蔡慶生,劉潔;用Naive Bayes方法協(xié)調(diào)分類Web網(wǎng)頁[J];軟件學(xué)報;2001年09期

相關(guān)碩士學(xué)位論文 前1條

1 董靜;中文網(wǎng)頁形式自動分類[D];大連理工大學(xué);2006年

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 張東準(zhǔn);網(wǎng)頁減肥工具大觀[J];電腦技術(shù);2001年04期

2 黃家貞;彈指間網(wǎng)頁內(nèi)碼隨心換[J];電腦知識與技術(shù);2004年22期

3 黃家貞;彈指間網(wǎng)頁內(nèi)碼隨心換[J];網(wǎng)絡(luò)與信息;2004年09期

4 宏偉;巧妙抓取防滾屏網(wǎng)頁[J];電腦愛好者;2005年20期

5 啟動;;淺談網(wǎng)頁文件引用[J];網(wǎng)絡(luò)與信息;2006年05期

6 小叢;;教你輕松抓取無法滾屏的網(wǎng)頁[J];計算機(jī)與網(wǎng)絡(luò);2006年08期

7 花的神明;;追尋網(wǎng)頁上閃動的音樂[J];電腦迷;2007年12期

8 秋思;;收藏一個網(wǎng)頁只需一個文件[J];電腦愛好者(普及版);2009年05期

9 唐永明;;淺議網(wǎng)頁設(shè)計與制作[J];科技信息;2009年20期

10 蔣偉;徐義平;;個性化網(wǎng)頁淺析[J];魅力中國;2009年35期

相關(guān)會議論文 前7條

1 張曉明;奈一雄;齊炯明;安媛媛;張建楠;王靜嫻;;基于信息隱藏的網(wǎng)頁入侵檢測技術(shù)與實現(xiàn)[A];2009通信理論與技術(shù)新發(fā)展——第十四屆全國青年通信學(xué)術(shù)會議論文集[C];2009年

2 林政;呂雅娟;劉群;馬希榮;;基于雙語混和網(wǎng)頁的平行語料挖掘[A];中國計算機(jī)語言學(xué)研究前沿進(jìn)展(2007-2009)[C];2009年

3 熊德蘭;鄢靖豐;陳靜;;基于論壇主題的網(wǎng)頁褒貶傾向性識別[A];第三屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議論文集[C];2007年

4 隋春明;郭志豐;;網(wǎng)頁防篡改技術(shù)在電力信息網(wǎng)中的應(yīng)用[A];二○○九年全國電力企業(yè)信息化大會論文集[C];2009年

5 王海源;石睿智;;高校網(wǎng)頁惡意代碼的檢測、清理與預(yù)防[A];中國高等教育學(xué)會教育信息化分會第十次學(xué)術(shù)年會論文集[C];2010年

6 戴玉剛;;藏文網(wǎng)頁采集技術(shù)研究[A];民族語言文字信息技術(shù)研究——第十一屆全國民族語言文字信息學(xué)術(shù)研討會論文集[C];2007年

7 劉世杰;唐世渭;楊冬青;王騰蛟;姚小波;;自動的WEB信息提取和集成[A];第十九屆全國數(shù)據(jù)庫學(xué)術(shù)會議論文集(技術(shù)報告篇)[C];2002年

相關(guān)重要報紙文章 前10條

1 范德生 鄧亞玲;守住網(wǎng)頁的秘密[N];電腦報;2005年

2 貞;網(wǎng)頁特效與瘦身專家[N];中國電腦教育報;2002年

3 網(wǎng)天;在自己的電腦上發(fā)布網(wǎng)頁[N];大眾科技報;2000年

4 楊興平 六子;我的網(wǎng)頁你別動[N];電腦報;2004年

5 楊耀祥;簡繁網(wǎng)頁批量互轉(zhuǎn)有妙法[N];中國電腦教育報;2003年

6 河北 李永波;網(wǎng)頁底圖顯個性[N];電腦報;2004年

7 ;讓你的網(wǎng)頁綻放最美麗的特效[N];中國電腦教育報;2004年

8 劉成富;編輯網(wǎng)頁有妙法[N];計算機(jī)世界;2004年

9 綿陽南山 iled;讓 Frontpage 2000 給我們“一了百了”[N];電腦報;2001年

10 陳宗偉;妙用查找替換功能編輯網(wǎng)頁[N];電腦報;2004年

相關(guān)博士學(xué)位論文 前3條

1 計華;Web Spam特征分析及其檢測技術(shù)研究[D];山東師范大學(xué);2015年

2 陳定權(quán);自動主題搜索的應(yīng)用研究[D];中國科學(xué)院研究生院(文獻(xiàn)情報中心);2003年

3 胡燕;基于Web信息抽取的專業(yè)知識獲取方法研究[D];武漢理工大學(xué);2007年

相關(guān)碩士學(xué)位論文 前10條

1 杜明明;基于關(guān)鍵詞的垃圾網(wǎng)頁判別研究[D];哈爾濱工業(yè)大學(xué);2015年

2 劉慕凡;基于主題與語義的作弊網(wǎng)頁檢測方法研究[D];北京化工大學(xué);2015年

3 賀知義;基于關(guān)鍵詞的搜索引擎網(wǎng)頁去重算法研究[D];華中師范大學(xué);2015年

4 李小娟;基于分類技術(shù)的網(wǎng)頁去噪方法的研究[D];貴州師范大學(xué);2015年

5 龔誠;網(wǎng)頁增量式采集技術(shù)研究[D];哈爾濱工業(yè)大學(xué);2007年

6 李雙;基于用戶思維模型分析的網(wǎng)頁可用性設(shè)計研究[D];江南大學(xué);2008年

7 劉典型;多頁面特殊網(wǎng)頁文字提取與合并技術(shù)研究[D];湖南大學(xué);2010年

8 宋鰲;網(wǎng)頁去噪在交互電視中的應(yīng)用與研究[D];上海交通大學(xué);2011年

9 柳周頻;基于鏈接上下文的網(wǎng)頁預(yù)測[D];吉林大學(xué);2006年

10 姜鑫;基于網(wǎng)頁連通信息的主題爬行技術(shù)研究與實現(xiàn)[D];吉林大學(xué);2007年

,

本文編號:2565868

資料下載
論文發(fā)表

本文鏈接:http://www.wukwdryxk.cn/guanlilunwen/ydhl/2565868.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶48f75***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com
亚洲熟女乱综合一区二区三区| 337p日本欧洲亚洲高清鲁鲁| 信丰县| 色愁愁久久久| 欧美freesex另类重口| 国产精品婷婷| 青青草原综合久久大伊人精品| 波多野结衣中文字幕久久| 亚洲精品无码久久一线| 男人把JIJ放到女人JII里面| 国产精品视频一区二区三区不卡| 永寿县| 精品人妻2| 久热久热国产自在自线| 性高潮久久久久久久| 亚洲婷婷| 欧美精品videossex少妇| 高潮了| 蜜桃精品视频| 国产裸体孕妇孕交视频| japanese极品丰满少妇| 潮喷在线视频| 500篇欲乱小说少妇+小说 | 天堂一区二区三区| 网站正能量直接进入主页可以吗| av最新地址| 一区二区三区亚洲精品国| 爱丫爱丫影院官网| 天天精品| 久热综合| 色涩av| 亚洲欧美在线| 国产精品大白屁股xxxxx| 蜜桃视频黄色| 黄色高潮视频| 丰满少妇av| 国产精品大屁股av在线播放| 合水县| 精品香蕉99久久久久成人网站| 国产人与动人物a级毛片| 永久免费AV无码不卡在线观看|