a国产,中文字幕久久波多野结衣AV,欧美粗大猛烈老熟妇,女人av天堂

基于SVM的微博情感傾向性分析研究

發(fā)布時間:2019-05-12 12:35
【摘要】:隨著Web2.0時代的到來,網(wǎng)絡(luò)的發(fā)展已經(jīng)進(jìn)入人們生活的各個領(lǐng)域,近年來微博的出現(xiàn),讓生活更加豐富。微博影響力的增長,吸引了大批學(xué)者對微博客的深入研究,而情感詞識別和情感分析成為了一個重要的課題。在微博的開放平臺,提供的功能是可以查閱信息,也可以發(fā)布信息給別人來看。與此同時,隨著發(fā)布信息的多元化,隨之產(chǎn)生了新問題,如,情感新詞的出現(xiàn)及對微博句的情感極性分析,新詞的出現(xiàn)給中文分詞產(chǎn)生很多難以識別的“散串”和“碎片”;情感分析時判別感情傾向性微博客的文字,屬于判斷積極的,消極的,中立的法官。對這些文本的情感傾向性,可以對網(wǎng)民的情緒有掌握,不僅有一定的商業(yè)價值,還有益于社會、還可以幫助我們在輿情監(jiān)控、詞庫更新、自然語言處理等領(lǐng)域完善。 每天數(shù)以萬計的中文微博用戶刷新信息,,對微博情感詞的產(chǎn)生以及對極性分析的問題都隨之產(chǎn)生,做好這些工作對了解用戶的態(tài)度很重要和迫切。本文通過從實驗提供的數(shù)據(jù),通過條件隨機(jī)場進(jìn)行情感詞識別,進(jìn)行詞性標(biāo)注,結(jié)合上下文信息特征,構(gòu)建特征向量,對語料數(shù)據(jù)進(jìn)行訓(xùn)練模型構(gòu)建和測試,最后得到情感詞的正確率(Precision)、召回率(Recall)和F-值。對微博情感詞進(jìn)行有效正確的識別是判別微博文本情感傾向性的前提和基礎(chǔ)。本文首先結(jié)合中文信息處理、自然語言等知識,結(jié)合實驗室對情感新詞發(fā)現(xiàn)和情感傾向分析的研究,論述情感傾向相關(guān)的各種關(guān)系,是建立在微博情感傾向性判斷現(xiàn)有所做分析的基礎(chǔ)之上的。本論文的研究最終目的是提高數(shù)據(jù)結(jié)果的正確率、召回率及F-值,為更進(jìn)一步的研究奠定基礎(chǔ)。 實驗數(shù)據(jù)選用項目給定的微博語料,情感詞識別和情感傾向性分析的訓(xùn)練和測試數(shù)據(jù)是不同的,實驗結(jié)果也驗證了該論文中用到的方法是可行的。實驗結(jié)果顯示:該方法在情感詞識別正確率為34.21%,召回率為0.11%,F(xiàn)值為0.002%;結(jié)果識別率整體不高,但也為下一步工作打好了基礎(chǔ)。對情感句極性判別的正確率為84.87%,召回率為65.18%,F(xiàn)值為77.27%,此次研究對中文微博的情感傾向性分析進(jìn)行了初步探索。
[Abstract]:With the advent of the Web2.0 era, the development of the network has entered all areas of people's lives. In recent years, the emergence of Weibo has made life more abundant. The growth of Weibo's influence has attracted a large number of scholars to study Weibo customers in depth, and emotional word recognition and emotional analysis have become an important topic. In Weibo's open platform, the function is to access information, or to post information to others to see. At the same time, with the diversification of published information, new problems arise, such as the emergence of emotional neologisms and the analysis of emotional polarity of Weibo sentences. The emergence of new words produces a lot of "scattered strings" and "fragments" that are difficult to recognize for Chinese word segmentation. The text that distinguishes the emotional tendency of Weibo guest in emotional analysis belongs to the judge of positive, negative and neutral. The emotional tendency of these texts can master the emotions of netizens, not only have certain commercial value, but also benefit the society, but also help us to perfect in the fields of public opinion monitoring, vocabulary updating, natural language processing and so on. Tens of thousands of Chinese Weibo users refresh their information every day, and the generation of Weibo emotional words and the analysis of polarity all arise. It is very important and urgent to do a good job in understanding the attitude of users. Through the data provided by the experiment, emotional word recognition through conditional random field, part-of-speech tagging, combining with the characteristics of context information, the feature vector is constructed, and the training model of corpus data is constructed and tested. Finally, the correct (Precision), recall rate (Recall) and F-value of emotional words are obtained. Effective and correct recognition of Weibo emotional words is the premise and basis for judging the emotional tendency of Weibo text. Based on the knowledge of Chinese information processing and natural language, combined with the laboratory research on the discovery of emotional neologisms and the analysis of emotional tendencies, this paper discusses the various relationships related to emotional tendencies. It is based on the existing analysis of Weibo emotional tendency judgment. The ultimate purpose of this paper is to improve the accuracy, recall rate and F-value of the data results, so as to lay a foundation for further research. The experimental data are different from the Weibo corpus given by the project, and the training and test data of emotional word recognition and emotional tendency analysis are different. The experimental results also verify that the method used in this paper is feasible. The experimental results show that the correct rate of emotional word recognition is 34.21%, the recall rate is 0.11%, and the F value is 0.002%. The results show that the overall recognition rate is not high, but it also lays a good foundation for the next step. The correct rate, recall rate and F value of emotional sentence polarity discrimination were 84.87%, 65.18% and 77.27%, respectively. the emotional tendency of Chinese Weibo was preliminarily explored in this study.
【學(xué)位授予單位】:中原工學(xué)院
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2014
【分類號】:TP391.1;TP393.092

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 鄧森;楊軍鋒;郭明威;郭創(chuàng);;基于模糊SVM和虛擬儀器的模擬電路故障診斷研究[J];計算機(jī)測量與控制;2011年04期

2 郭有貴;曾萍;朱建林;;交-交矩陣變換器SVM的新穎調(diào)制模式(英文)[J];系統(tǒng)仿真學(xué)報;2009年22期

3 吳學(xué)文;索麗生;王志堅;;基于SVM的入庫徑流混沌時間序列預(yù)測模型及應(yīng)用[J];系統(tǒng)仿真學(xué)報;2011年11期

4 程博,吳國平;基于SVM的脫機(jī)手寫漢字識別[J];現(xiàn)代計算機(jī);2005年09期

5 鐘明霞;;基于神經(jīng)網(wǎng)絡(luò)和SVM的微鈣化簇分類方法[J];計算機(jī)時代;2008年05期

6 宋國明;王厚軍;姜書艷;劉紅;;一種聚類分層決策的SVM模擬電路故障診斷方法[J];儀器儀表學(xué)報;2010年05期

7 張淑雅;趙一鳴;李均利;;基于SVM的圖像分類算法與實現(xiàn)[J];計算機(jī)工程與應(yīng)用;2007年25期

8 宋國明;王厚軍;劉紅;姜書艷;;基于提升小波變換和SVM的模擬電路故障診斷[J];電子測量與儀器學(xué)報;2010年01期

9 王志明,蔣加伏,唐賢瑛;基于SVM的小波圖像去噪[J];湖南科技學(xué)院學(xué)報;2005年05期

10 解焱陸,吳禮福,戴蓓劏,李輝;基于SVM評分融合的分類短語音話者確認(rèn)系統(tǒng)[J];數(shù)據(jù)采集與處理;2005年02期

相關(guān)會議論文 前10條

1 滕衛(wèi)平;胡波;滕舟;鐘元;;SVM回歸法在西太平洋熱帶氣旋路徑預(yù)報中的應(yīng)用研究[A];S1 災(zāi)害天氣研究與預(yù)報[C];2012年

2 王紅軍;徐小力;付瑤;;基于SVM的旋轉(zhuǎn)機(jī)械故障診斷知識獲取[A];第八屆全國設(shè)備與維修工程學(xué)術(shù)會議、第十三屆全國設(shè)備監(jiān)測與診斷學(xué)術(shù)會議論文集[C];2008年

3 陳兆基;楊宏暉;杜方鍵;;用于水下目標(biāo)識別的選擇性SVM集成算法[A];中國聲學(xué)學(xué)會水聲學(xué)分會2011年全國水聲學(xué)學(xué)術(shù)會議論文集[C];2011年

4 程麗麗;張健沛;楊靜;馬駿;;一種改進(jìn)的層次SVM多類分類方法[A];第三屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議論文集[C];2007年

5 左南;李涓子;唐杰;;基于SVM的肖像照片抽取[A];第三屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議論文集[C];2007年

6 寧偉;苗雪雷;胡永華;季鐸;張桂平;蔡東風(fēng);;基于SVM的無參考譯文的譯文質(zhì)量評測[A];機(jī)器翻譯研究進(jìn)展——第四屆全國機(jī)器翻譯研討會論文集[C];2008年

7 劉旭;羅鵬飛;李綱;;基于擬合角特征及SVM的雷達(dá)輻射源個體識別[A];全國第五屆信號和智能信息處理與應(yīng)用學(xué)術(shù)會議專刊(第一冊)[C];2011年

8 羅浩;謝軍龍;胡云鵬;;地源熱泵空調(diào)系統(tǒng)故障診斷中SVM的應(yīng)用[A];全國暖通空調(diào)制冷2008年學(xué)術(shù)年會資料集[C];2008年

9 劉閃電;王建東;;權(quán)重部分更新的大規(guī)模線性SVM求解器[A];2009年研究生學(xué)術(shù)交流會通信與信息技術(shù)論文集[C];2009年

10 王艦;湯光明;;基于SVM的圖像隱寫檢測分析[A];第八屆全國信息隱藏與多媒體安全學(xué)術(shù)大會湖南省計算機(jī)學(xué)會第十一屆學(xué)術(shù)年會論文集[C];2009年

相關(guān)碩士學(xué)位論文 前10條

1 張漢女;基于SVM的海岸線提取方法研究[D];東北師范大學(xué);2010年

2 劉軍;基于SVM的半監(jiān)督網(wǎng)絡(luò)入侵檢測系統(tǒng)[D];復(fù)旦大學(xué);2009年

3 張永俊;基于SVM的增量入侵檢測方法研究[D];西安科技大學(xué);2013年

4 田冪;基于概率SVM的腫瘤預(yù)警系統(tǒng)的設(shè)計與實現(xiàn)[D];吉林大學(xué);2013年

5 王碩;基于廣義S變換和SVM的電壓暫降檢測與識別方法研究[D];燕山大學(xué);2013年

6 楊濤;基于SVM的中國醫(yī)藥制造企業(yè)財務(wù)危機(jī)預(yù)警研究[D];廈門大學(xué);2009年

7 周洪利;基于SVM的網(wǎng)絡(luò)信息過濾研究[D];山東師范大學(xué);2008年

8 齊振東;基于SVM的地基土承載力預(yù)測[D];吉林大學(xué);2008年

9 任瓊;基于SVM的余杭生態(tài)公益林類型的遙感分類研究[D];南京林業(yè)大學(xué);2008年

10 楊洋;基于SVM的印刷品缺陷在線檢測[D];華中科技大學(xué);2012年



本文編號:2475396

資料下載
論文發(fā)表

本文鏈接:http://www.wukwdryxk.cn/guanlilunwen/ydhl/2475396.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶0c00f***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com
人妻丰满AV无码久久不卡| 2021久久超碰国产精品最新| 韩日欧美| 色呦呦| gogo亚洲高清大胆美女人体| 国产高清女同学巨大乳在线观看| 无套内谢孕妇毛片免费看看| 亚洲制服丝袜精品久久| 久久男人AV资源网站无码软件| 亚欧成人无码AV在线播放| 久久精品亚洲精品无码| 国产精品v亚洲精品v日韩精品| 五月天一区二区| 影音先锋男人资源av站| 久久久久免费看成人影片| 天天狠天天透天干天天怕∴| 人妻无码人妻有码中文字幕 | 九九热精品视频在线观看| 中文字字幕在线精品乱码| 漂亮人妻洗澡被公强日日躁| 久久精品网站免费观看| 青楼妓女禁脔道具调教sm| 亚洲日韩精品无码专区网址| 亚洲AV日韩AV永久无码色欲| 国模无码一区二区三区不卡| 色欲AV永久无码精品无码 | 日韩毛片在线| 日韩电影免费| 大香蕉狠狠干| 国产精品一区二区三区在线| 夜夜爽av福利精品导航| 日韩婷婷| 亚洲欧美一区二区三区国产精品| 国产精品欧美一区喷水| 天天搞天天干| av动态| 蜜桃av网| 性国产精品| 文水县| 国产v亚洲v天堂a_亚洲| 亲亲抱抱蹭蹭的刺激原声哔哩哔|