高校學(xué)生的微博情感分析
【學(xué)位單位】:北京工業(yè)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位年份】:2019
【中圖分類】:C81
【部分圖文】:
北京工業(yè)大學(xué)應(yīng)用統(tǒng)計(jì)碩士專業(yè)學(xué)位論文圖 1-2 用戶的微博 IDFigure 1-2 ID number of customer我們利用這些 ID 可以根據(jù)指定的規(guī)則匹配出用戶博文的 API 接口,進(jìn)而解出想要的信息。通常,網(wǎng)頁(yè)將信息儲(chǔ)存為 JSON(JavaScript Object Notation)文,不但易于閱讀和編寫,同時(shí)也易于機(jī)器解析和生成,并有效地提升網(wǎng)絡(luò)傳輸率。獲取的 JSON 文件結(jié)構(gòu)類似于圖 1-3,我們可以通過輸入 JSON 文件的各接點(diǎn)名稱獲取數(shù)據(jù),如按順序輸入“data”,“status”,“1”就能獲取某一篇文的所有信息。
comment_count 評(píng)論數(shù)repost_count 轉(zhuǎn)發(fā)數(shù)created_at 博文推送時(shí)間isLongText 是否為長(zhǎng)微博Source 博文推送來源Text 博文內(nèi)容textLength 博文長(zhǎng)度Id 博主 IDGender 博主性別screen_name 博主昵稱爬取的博文內(nèi)容比較雜亂,數(shù)據(jù)處理過程中存在很多問題。主要集中在:a) 博文存在大量的標(biāo)簽;b) 表情和文字混合;c) 部分博文為純轉(zhuǎn)發(fā)類型,不帶有任何文字或表情;d) 博文不全是文字,部分博文僅有圖片或者視頻,甚至只出現(xiàn)呼叫好友的
圖 2-1 不同學(xué)歷的學(xué)生個(gè)數(shù)比例Figure 2-1 Different proportion of degree1 中可以看出,爬取博主的教育程度接近高校學(xué)生的學(xué)歷具有代表性。圖 2-2 中的性別分布上,女性占了較大比例容和人群是密切相關(guān)的。女性在使用微博發(fā)表自身言論的態(tài)、娛樂八卦等熱點(diǎn)信息,而男性對(duì)該方面缺少明顯的興于從其他平臺(tái)獲取體育,時(shí)政等方面的信息。
【參考文獻(xiàn)】
相關(guān)期刊論文 前7條
1 李婷婷;姬東鴻;;基于SVM和CRF多特征組合的微博情感分析[J];計(jì)算機(jī)應(yīng)用研究;2015年04期
2 羅知林;陳挺;蔡皖東;;一個(gè)基于隨機(jī)森林的微博轉(zhuǎn)發(fā)預(yù)測(cè)算法[J];計(jì)算機(jī)科學(xué);2014年04期
3 高明;金澈清;錢衛(wèi)寧;王曉玲;周傲英;;面向微博系統(tǒng)的實(shí)時(shí)個(gè)性化推薦[J];計(jì)算機(jī)學(xué)報(bào);2014年04期
4 黃星;;微博用語的解讀[J];海南大學(xué)學(xué)報(bào)(人文社會(huì)科學(xué)版);2014年02期
5 張金偉;劉曉平;;基于心理預(yù)警模型的微博情感識(shí)別研究[J];合肥工業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版);2013年11期
6 王冠華;張福珍;;大學(xué)生使用微博的心理原因探析[J];科教文匯(上旬刊);2013年11期
7 謝麗星;周明;孫茂松;;基于層次結(jié)構(gòu)的多策略中文微博情感分析和特征抽取[J];中文信息學(xué)報(bào);2012年01期
相關(guān)博士學(xué)位論文 前1條
1 李義萍;基于微博的青少年心理壓力趨勢(shì)預(yù)測(cè)[D];清華大學(xué);2015年
相關(guān)碩士學(xué)位論文 前2條
1 陳文焰;基于雙數(shù)組Trie的高效索引結(jié)構(gòu)及其并行化的研究[D];昆明理工大學(xué);2018年
2 丁媛媛;基于時(shí)間序列的微博熱點(diǎn)話題識(shí)別與追蹤[D];西安科技大學(xué);2017年
本文編號(hào):2867557
本文鏈接:http://www.wukwdryxk.cn/guanlilunwen/tongjijuecelunwen/2867557.html