面向移動應用商店的分布式爬蟲系統(tǒng)設計與實現(xiàn)
【圖文】:
圖2-1百度應用商店應用導航頁逡逑下面以百度應用商店為例,具體分析其網(wǎng)頁結構特征。進入百度應用商店首逡逑頁后,就能看到如圖2-1所示的應用分類導航信息,此版塊將應用商店中的所有逡逑應用按功能作用進行了分類,如社交通訊類、系統(tǒng)工具類等。以這些分類導航鏈逡逑接為入口,點擊進入以后,會看到應用按一定的方式排列呈現(xiàn)在頁面中,并以翻逡逑頁的形式列出了該類別中的所有應用,如圖2-2所示。從應用列表頁中能夠提取逡逑到應用詳細頁面的URL,進而訪問應用詳細頁,應用詳細頁中包含了應用的具逡逑7逡逑
百度應用商店應用列表頁百度李抓姍浮貓負,,按釋》苦眺工皿,帕汽萬瀚鑰勝
【學位授予單位】:北京郵電大學
【學位級別】:碩士
【學位授予年份】:2017
【分類號】:TP391.1;TP393.092
【參考文獻】
相關期刊論文 前10條
1 南磊;;基于Hadoop的圖書推薦系統(tǒng)研究與設計[J];計算機與數(shù)字工程;2016年06期
2 鄒科文;李達;鄧婷敏;李嘉振;陳義明;;網(wǎng)絡爬蟲針對“反爬”網(wǎng)站的爬取策略研究[J];電腦知識與技術;2016年07期
3 馬志強;張澤廣;李昊u&;劉利民;;基于分布式架構的主題信息采集系統(tǒng)[J];計算機工程與設計;2015年04期
4 高榮;;基于Scrapy和casperjs的電子商務網(wǎng)站信息采集系統(tǒng)研究[J];數(shù)字技術與應用;2015年03期
5 楊永光;;代碼簽名在手機應用商店的應用[J];信息安全與通信保密;2014年10期
6 陳薈慧;舒云星;林麗;;Web語料抓取中基于相似度的URL過濾規(guī)則生成算法[J];模式識別與人工智能;2014年07期
7 史寶明;賀元香;吳崇正;;主題搜索引擎中爬蟲搜索策略的研究[J];計算機工程與應用;2014年02期
8 方明科;王煜霞;;一種動態(tài)Web信息提取方法的設計與實現(xiàn)[J];管理工程師;2011年03期
9 孫立偉;何國輝;吳禮發(fā);;網(wǎng)絡爬蟲技術的研究[J];電腦知識與技術;2010年15期
10 陳俊彬;;Web信息抽取策略及其實現(xiàn)方法研究[J];科技情報開發(fā)與經(jīng)濟;2008年23期
相關博士學位論文 前1條
1 何川;分布式信息檢索中的若干重要問題研究[D];北京郵電大學;2012年
相關碩士學位論文 前7條
1 孔維健;基于圖聚類的招投標數(shù)據(jù)挖掘研究與應用[D];中山大學;2015年
2 李婷;分布式爬蟲任務調度與AJAX頁面抓取研究[D];電子科技大學;2015年
3 姚鑫;分布式手機軟件應用搜索爬蟲系統(tǒng)設計與實現(xiàn)[D];北京郵電大學;2015年
4 姚富貴;基于分布式的商品信息網(wǎng)絡爬蟲系統(tǒng)的設計與實現(xiàn)[D];華中科技大學;2014年
5 趙鵬程;分布式書籍網(wǎng)絡爬蟲系統(tǒng)的設計與實現(xiàn)[D];西南交通大學;2014年
6 蘇小魯;基于DOM的HTML網(wǎng)頁正文信息抽取模塊的設計與實現(xiàn)[D];北京郵電大學;2011年
7 王星;新聞網(wǎng)頁抽取技術的研究與實現(xiàn)[D];河北工業(yè)大學;2011年
本文編號:2568839
本文鏈接:http://www.wukwdryxk.cn/guanlilunwen/ydhl/2568839.html