a国产,中文字幕久久波多野结衣AV,欧美粗大猛烈老熟妇,女人av天堂

當(dāng)前位置:主頁 > 文藝論文 > 廣告藝術(shù)論文 >

評(píng)價(jià)對(duì)象短語識(shí)別在情感分析領(lǐng)域的研究與實(shí)現(xiàn)

發(fā)布時(shí)間:2018-10-13 13:09
【摘要】:近年來移動(dòng)互聯(lián)網(wǎng)飛速發(fā)展,微博作為新興的社交網(wǎng)絡(luò)媒介迅速崛起,每天產(chǎn)生了海量的用戶社交數(shù)據(jù),微博作為移動(dòng)社交的一種主要載體,內(nèi)容豐富,數(shù)據(jù)價(jià)值很高。對(duì)微博數(shù)據(jù)進(jìn)行評(píng)價(jià)對(duì)象短語的識(shí)別和情感分析能夠?yàn)檎浨楸O(jiān)控、企業(yè)廣告投放、用戶行為預(yù)測(cè)和信息決策提供重要參考。微博情感分析主要包含兩個(gè)要素:評(píng)價(jià)對(duì)象短語識(shí)別和情感傾向性分析。由于微博內(nèi)容話題分散,識(shí)別博文評(píng)論對(duì)象成為微博情感分析研究的熱點(diǎn)和難點(diǎn),研究表明未登錄詞識(shí)別是導(dǎo)致中文評(píng)價(jià)對(duì)象短語識(shí)別率低的重要因素之一。因此,研究基于未登錄詞識(shí)別的微博評(píng)價(jià)短語抽取方法是一項(xiàng)非常重要而有意義的工作。本文從特征選擇、分類器選取和特征模版選擇三個(gè)方面設(shè)計(jì)未登錄詞識(shí)別模型的特征向量以提高識(shí)別率,再將該算法應(yīng)用于評(píng)價(jià)對(duì)象短語識(shí)別中,并通過微博實(shí)際語料驗(yàn)證了實(shí)驗(yàn)的有效性。本文的主要工作如下:1、首先提出了一種基于文本詞序列、凝聚度、左右自由度等統(tǒng)計(jì)特征,作為未登錄詞識(shí)別的特征;再通過樸素貝葉斯、決策樹、邏輯回歸、支持向量機(jī)(SVM)和人工神經(jīng)網(wǎng)絡(luò)這五種分類算法對(duì)未登錄詞進(jìn)行識(shí)別,并比較識(shí)別結(jié)果,選擇未登錄詞識(shí)別效果較好的人工神經(jīng)網(wǎng)絡(luò)分類算法作為未登錄詞的判定模型。2、本文接著引入BIO三個(gè)符號(hào),使用條件隨機(jī)場(chǎng)CRFs將評(píng)價(jià)短語識(shí)別問題轉(zhuǎn)化為序列標(biāo)注問題。在識(shí)別評(píng)價(jià)對(duì)象短語時(shí),選擇合適的特征模版,并將人工神經(jīng)網(wǎng)絡(luò)訓(xùn)練產(chǎn)生的未登錄詞應(yīng)用于評(píng)價(jià)對(duì)象短語識(shí)別過程。3、選取新浪微博某一天的數(shù)據(jù)作為本文實(shí)驗(yàn)的數(shù)據(jù)來源,經(jīng)過人工標(biāo)注,進(jìn)行評(píng)價(jià)對(duì)象短語識(shí)別實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果表明,將自動(dòng)識(shí)別的微博文本中的未登錄詞加入基于CRFs的評(píng)價(jià)對(duì)象短語識(shí)別算法后,顯著提高了評(píng)價(jià)對(duì)象短語抽取的準(zhǔn)確率和召回率。
[Abstract]:In recent years, with the rapid development of mobile Internet, Weibo, as a new social network medium, has a rapid rise, every day has produced a huge amount of social data for users. As a main carrier of mobile social networking, Weibo is rich in content and high in data value. The identification and affective analysis of Weibo data can provide important reference for government public opinion monitoring, enterprise advertising, user behavior prediction and information decision-making. Weibo's affective analysis mainly consists of two elements: target phrase recognition and affective orientation analysis. Due to the scattered content of Weibo, identifying the subject of comment on blog has become a hot and difficult point in the affective analysis of Weibo. The research shows that the recognition of unrecorded words is one of the important factors leading to the low recognition rate of Chinese evaluation object phrases. Therefore, it is very important and meaningful to study the extraction method of Weibo evaluation phrase based on unrecorded word recognition. In this paper, the feature vectors of the unrecorded word recognition model are designed from three aspects: feature selection, classifier selection and feature template selection, to improve the recognition rate, and then the algorithm is applied to the evaluation object phrase recognition. The validity of the experiment is verified by Weibo's actual corpus. The main work of this paper is as follows: 1. First, a statistical feature based on text word sequence, cohesion, left and right degrees of freedom is proposed as the feature of unrecorded word recognition, and then through naive Bayes, decision tree, logic regression, Support vector machine (SVM) and artificial neural network (Ann) are the five classification algorithms to identify unrecorded words, and compare the recognition results. An artificial neural network classification algorithm with good recognition effect for unrecorded words is selected as the decision model of unrecorded words. (2) then, three symbols of BIO are introduced, and the conditional random field CRFs is used to transform the evaluation phrase recognition problem into the sequence tagging problem. When identifying the target phrase, the appropriate feature template is selected, and the unrecorded words generated by artificial neural network training are applied to the process of identifying the evaluation object phrase. 3. The data of one day of Sina Weibo is chosen as the data source of this paper. After manual tagging, the experiment of evaluating object phrase recognition is carried out. The experimental results show that the accuracy and recall rate of phrase extraction of evaluation objects can be significantly improved by adding the unrecorded words in Weibo text which is automatically recognized into the evaluation object phrase recognition algorithm based on CRFs.
【學(xué)位授予單位】:東華大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2017
【分類號(hào)】:TP391.1;TP18

【參考文獻(xiàn)】

相關(guān)期刊論文 前10條

1 葉成緒;楊萍;劉少鵬;;基于主題詞的微博熱點(diǎn)話題發(fā)現(xiàn)[J];計(jì)算機(jī)應(yīng)用與軟件;2016年02期

2 李文坤;張仰森;陳若愚;;基于詞內(nèi)部結(jié)合度和邊界自由度的新詞發(fā)現(xiàn)[J];計(jì)算機(jī)應(yīng)用研究;2015年08期

3 唐波;陳光;王星雅;王非;陳小慧;;微博新詞發(fā)現(xiàn)及情感傾向判斷分析[J];山東大學(xué)學(xué)報(bào)(理學(xué)版);2015年01期

4 霍帥;張敏;劉奕群;馬少平;;基于微博內(nèi)容的新詞發(fā)現(xiàn)方法[J];模式識(shí)別與人工智能;2014年02期

5 周紅照;侯明午;顏彭莉;張葉青;侯敏;滕永林;;語義特征在評(píng)價(jià)對(duì)象抽取與極性判定中的作用[J];北京大學(xué)學(xué)報(bào)(自然科學(xué)版);2014年01期

6 陳飛;劉奕群;魏超;張?jiān)屏?張敏;馬少平;;基于條件隨機(jī)場(chǎng)方法的開放領(lǐng)域新詞發(fā)現(xiàn)[J];軟件學(xué)報(bào);2013年05期

7 鄭敏潔;雷志城;廖祥文;陳國龍;;中文句子評(píng)價(jià)對(duì)象抽取的特征分析研究[J];福州大學(xué)學(xué)報(bào)(自然科學(xué)版);2012年05期

8 林江豪;陽愛民;周詠梅;陳錦;蔡澤鍵;;一種基于樸素貝葉斯的微博情感分類[J];計(jì)算機(jī)工程與科學(xué);2012年09期

9 顧正甲;姚天f ;;評(píng)價(jià)對(duì)象及其傾向性的抽取和判別[J];中文信息學(xué)報(bào);2012年04期

10 徐遠(yuǎn)方;李成城;;基于SVM和詞間特征的新詞識(shí)別研究[J];計(jì)算機(jī)技術(shù)與發(fā)展;2012年05期

相關(guān)會(huì)議論文 前4條

1 王倩;何婷婷;聞彬;宋樂;張茂元;;基于依存關(guān)系的中文情感要素抽取技術(shù)研究[A];中國計(jì)算機(jī)語言學(xué)研究前沿進(jìn)展(2007-2009)[C];2009年

2 姚天f ;聶青陽;李建超;李林琳;婁德成;陳珂;付宇;;一個(gè)用于漢語汽車評(píng)論的意見挖掘系統(tǒng)[A];中文信息處理前沿進(jìn)展——中國中文信息學(xué)會(huì)二十五周年學(xué)術(shù)會(huì)議論文集[C];2006年

3 倪茂樹;林鴻飛;;基于關(guān)聯(lián)規(guī)則和極性分析的商品評(píng)論挖掘[A];第三屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集[C];2007年

4 王芳;萬常選;;基于可信度的中文完整詞自動(dòng)識(shí)別[A];第四屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集(上)[C];2008年

相關(guān)碩士學(xué)位論文 前4條

1 李文坤;面向微博的新詞發(fā)現(xiàn)和話題檢測(cè)技術(shù)研究[D];北京信息科技大學(xué);2015年

2 侯立斌;中文事件抽取與缺失角色填充的研究[D];蘇州大學(xué);2012年

3 朱洪;面向互聯(lián)網(wǎng)中文輿情信息的情感傾向分析[D];國防科學(xué)技術(shù)大學(xué);2011年

4 徐東興;基于Gate框架的信息抽取系統(tǒng)的研究與實(shí)現(xiàn)[D];華東師范大學(xué);2007年

,

本文編號(hào):2268739

資料下載
論文發(fā)表

本文鏈接:http://www.wukwdryxk.cn/wenyilunwen/guanggaoshejilunwen/2268739.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶d6398***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com
叼嘿视频| 精品成人乱色一区二区| 久久2| 少妇无码一区二区二三区| 日韩人妻无码精品-专区| AV大片在线无码永久免费| 日本精品久久久久中文字幕| 国内精品久久久久影院日本| 亚洲精品不卡AV在线播放| 久久18禁高潮出水呻吟娇喘| 精品高朝久久久久9999| 国产午夜福利在线播放| 少妇极品熟妇人妻无码| 亚洲AV无码成人精品区天堂 | 欧洲无乱码一二三区| av天堂加勒比| 亚洲www.| 国产嫩bbwbbw高潮| 大香蕉综合网| 日韩a√| 精品成人一区二区| 欧美啪啪啪啪| 国产精品18禁| 九九九免费视频| 少妇高潮av久久久久久| 激情丁香| 久久艹精品| 男人的天堂色偷偷| 一本色道久久综合亚洲精品图片| 久久人人爽人人爽爽久久小说| www日| 嫩草嫩草嫩草嫩草| 久久男女| av免费| 九龙县| 亚洲AV无码乱码国产精品FC2| 少妇极品熟妇人妻无码| 中文字幕AV无码免费一区| 国产精品久久久久电影院| 亚洲爆乳精品无码一区二区| 永久AV狼友网站在线观看|