a国产,中文字幕久久波多野结衣AV,欧美粗大猛烈老熟妇,女人av天堂

高校學(xué)生的微博情感分析

發(fā)布時(shí)間:2020-11-02 20:53
   隨著信息技術(shù)的快速發(fā)展,互聯(lián)網(wǎng)進(jìn)入了web2.0時(shí)代。在這個(gè)日新月異的網(wǎng)絡(luò)發(fā)展浪潮中,人們溝通的渠道從傳統(tǒng)的電子通訊產(chǎn)品轉(zhuǎn)向方便快捷的社交媒體,如微博和微信。由于微信用戶面對(duì)的是現(xiàn)實(shí)生活中的朋友圈,這導(dǎo)致人們發(fā)送微信內(nèi)容時(shí)往往有所顧慮。而微博用戶面對(duì)的是虛擬網(wǎng)絡(luò),所以博文內(nèi)容拘束性弱,更能反應(yīng)人們的真實(shí)情感和觀點(diǎn)。作為高校學(xué)生常用的社交軟件之一,微博也為大家了解高校學(xué)生生活、學(xué)習(xí)、心理等狀態(tài)提供一種有效的渠道。因此,如何有效地提取和挖掘蘊(yùn)含在海量博文中的情感信息是一項(xiàng)很有意義的研究。目前國(guó)內(nèi)學(xué)者對(duì)于博文的情感分析,主要是針對(duì)某一熱點(diǎn)話題的輿情分析。本文主要是通過博文的情感分析探索某高校學(xué)生的興趣點(diǎn)和心理健康問題,結(jié)合統(tǒng)計(jì)方法和機(jī)器學(xué)習(xí)方法研究該高校學(xué)生微博情感特點(diǎn),并建立異常博文情感的識(shí)別系統(tǒng)。所提的方法可應(yīng)用于國(guó)內(nèi)各高校學(xué)生的博文情感研究。本文數(shù)據(jù)是通過爬蟲技術(shù)從某高校官方微博中隨機(jī)抽取學(xué)生的博文信息。論文結(jié)構(gòu)如下:第二章通過從博文中的關(guān)鍵詞提取,發(fā)現(xiàn)不同學(xué)歷學(xué)生的博文內(nèi)容存在差異,本科生和碩士生的文本常用詞匯十分接近,但博士生與前兩者差異較大。第三章改進(jìn)了文本分詞,構(gòu)建詞向量,使用主成分分析對(duì)詞向量降維并計(jì)算合成詞的與情感詞典中的詞匯相似度,最終量化這類合成詞的感情色彩。第四章構(gòu)建了預(yù)測(cè)博文情感的評(píng)分卡模型。經(jīng)過測(cè)試集驗(yàn)證,模型的AUC值達(dá)到0.86,表明該評(píng)分卡模型對(duì)微博的情感特征評(píng)定具有較高的精確度。第五章分析博文情感分的影響因素,從情感得分挖掘?qū)W生們?cè)谕扑筒煌黝}博文時(shí)的情感差異,發(fā)現(xiàn)微博的內(nèi)容和娛樂美食有關(guān)時(shí),博文情感得分偏高,和科研學(xué)習(xí)有關(guān)時(shí),博文情感分較低。構(gòu)建了異常博文情感觀察系統(tǒng),可用于識(shí)別有嚴(yán)重心理問題或極端情緒的學(xué)生。
【學(xué)位單位】:北京工業(yè)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位年份】:2019
【中圖分類】:C81
【部分圖文】:

數(shù)據(jù),信息儲(chǔ)存,應(yīng)用統(tǒng)計(jì),規(guī)則匹配


北京工業(yè)大學(xué)應(yīng)用統(tǒng)計(jì)碩士專業(yè)學(xué)位論文圖 1-2 用戶的微博 IDFigure 1-2 ID number of customer我們利用這些 ID 可以根據(jù)指定的規(guī)則匹配出用戶博文的 API 接口,進(jìn)而解出想要的信息。通常,網(wǎng)頁(yè)將信息儲(chǔ)存為 JSON(JavaScript Object Notation)文,不但易于閱讀和編寫,同時(shí)也易于機(jī)器解析和生成,并有效地提升網(wǎng)絡(luò)傳輸率。獲取的 JSON 文件結(jié)構(gòu)類似于圖 1-3,我們可以通過輸入 JSON 文件的各接點(diǎn)名稱獲取數(shù)據(jù),如按順序輸入“data”,“status”,“1”就能獲取某一篇文的所有信息。

內(nèi)容,推送,表情,文字


comment_count 評(píng)論數(shù)repost_count 轉(zhuǎn)發(fā)數(shù)created_at 博文推送時(shí)間isLongText 是否為長(zhǎng)微博Source 博文推送來源Text 博文內(nèi)容textLength 博文長(zhǎng)度Id 博主 IDGender 博主性別screen_name 博主昵稱爬取的博文內(nèi)容比較雜亂,數(shù)據(jù)處理過程中存在很多問題。主要集中在:a) 博文存在大量的標(biāo)簽;b) 表情和文字混合;c) 部分博文為純轉(zhuǎn)發(fā)類型,不帶有任何文字或表情;d) 博文不全是文字,部分博文僅有圖片或者視頻,甚至只出現(xiàn)呼叫好友的

學(xué)歷,比例,學(xué)生,女性


圖 2-1 不同學(xué)歷的學(xué)生個(gè)數(shù)比例Figure 2-1 Different proportion of degree1 中可以看出,爬取博主的教育程度接近高校學(xué)生的學(xué)歷具有代表性。圖 2-2 中的性別分布上,女性占了較大比例容和人群是密切相關(guān)的。女性在使用微博發(fā)表自身言論的態(tài)、娛樂八卦等熱點(diǎn)信息,而男性對(duì)該方面缺少明顯的興于從其他平臺(tái)獲取體育,時(shí)政等方面的信息。
【參考文獻(xiàn)】

相關(guān)期刊論文 前7條

1 李婷婷;姬東鴻;;基于SVM和CRF多特征組合的微博情感分析[J];計(jì)算機(jī)應(yīng)用研究;2015年04期

2 羅知林;陳挺;蔡皖東;;一個(gè)基于隨機(jī)森林的微博轉(zhuǎn)發(fā)預(yù)測(cè)算法[J];計(jì)算機(jī)科學(xué);2014年04期

3 高明;金澈清;錢衛(wèi)寧;王曉玲;周傲英;;面向微博系統(tǒng)的實(shí)時(shí)個(gè)性化推薦[J];計(jì)算機(jī)學(xué)報(bào);2014年04期

4 黃星;;微博用語的解讀[J];海南大學(xué)學(xué)報(bào)(人文社會(huì)科學(xué)版);2014年02期

5 張金偉;劉曉平;;基于心理預(yù)警模型的微博情感識(shí)別研究[J];合肥工業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版);2013年11期

6 王冠華;張福珍;;大學(xué)生使用微博的心理原因探析[J];科教文匯(上旬刊);2013年11期

7 謝麗星;周明;孫茂松;;基于層次結(jié)構(gòu)的多策略中文微博情感分析和特征抽取[J];中文信息學(xué)報(bào);2012年01期


相關(guān)博士學(xué)位論文 前1條

1 李義萍;基于微博的青少年心理壓力趨勢(shì)預(yù)測(cè)[D];清華大學(xué);2015年


相關(guān)碩士學(xué)位論文 前2條

1 陳文焰;基于雙數(shù)組Trie的高效索引結(jié)構(gòu)及其并行化的研究[D];昆明理工大學(xué);2018年

2 丁媛媛;基于時(shí)間序列的微博熱點(diǎn)話題識(shí)別與追蹤[D];西安科技大學(xué);2017年



本文編號(hào):2867557

資料下載
論文發(fā)表

本文鏈接:http://www.wukwdryxk.cn/guanlilunwen/tongjijuecelunwen/2867557.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶3630f***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com
在野外被三个男人躁爽白浆公交| 久久久精品妓女影院妓女网| 国偷自产一区二区免费视频 | 亚洲第一AV无码专区| 亚洲乱码中文字幕在线| 亚洲婷婷综合色高清在线| 亚洲精品乱码久久久久66| 特级做A爰片毛片免费69| 黄色av一区| 蜜桃成人| А√天堂8资源中文在线| 亚洲日韩av无码一本到| 内谢少妇XXXXX8老少交| 成人片黄网站A毛片免费观看| 色婷婷五月综合久久中文| 看全色黄大色黄女片18免费| 久久婷婷色| 久久亚洲精品成人无码| 亚洲av无码不卡一区二区三区| 欧美三级不卡在线播放| 久久久久国产精品| 人人妻人人插| 日韩精品无码AV成人观看| 蜜臀久久99精品久久久久久| 国产欧美日韩精品A在线观看| 日韩人妻久久| 国产性猛交xxxx免费看久久| 一区二区国产高清视频在线| 国产精品制服一区二区| 饥渴老熟妇乱子伦视频| 蜜臀一区二区| 国产视频在线| 玩丰满熟妇XXXX视频| 亚洲精品国产成人av| 扒开老师大腿猛进AAA片| 亚洲av成人精品一区二区三区| 无码中文字幕热热久久| 日本免费AⅤ欧美在线观看| 少妇人妻无码精品视频| 欧美v| 亚洲精品国产精品国产自2022|