a国产,中文字幕久久波多野结衣AV,欧美粗大猛烈老熟妇,女人av天堂

貝葉斯統(tǒng)計(jì)在文本挖掘的若干研究

發(fā)布時(shí)間:2020-12-19 00:40
  隨著信息時(shí)代的發(fā)展,越來(lái)越多非結(jié)構(gòu)化的文本信息不斷出現(xiàn),我們需要新的工具來(lái)整理、搜索和理解這些文本信息,以便獲取有價(jià)值的信息。文本挖掘(text mining)是解決這一系列問(wèn)題的有效工具。在文本挖掘中,最常使用的是文本分類(lèi)(Text classification)。文本分類(lèi)是文本挖掘中有監(jiān)督的學(xué)習(xí)過(guò)程,目的是基于文檔內(nèi)容將文檔分配到一個(gè)或者多個(gè)預(yù)定義類(lèi)別。由于文本信息構(gòu)造復(fù)雜性、變化多樣性和高維性,這給文本分類(lèi)任務(wù)有效地提取文本特征帶來(lái)了極大的挑戰(zhàn)。概率主題模型(probabilistic topic models)是文本挖掘中提取文本特征的有效工具。主要是通過(guò)貝葉斯統(tǒng)計(jì)方法發(fā)現(xiàn)文本中的隱藏語(yǔ)義結(jié)構(gòu),進(jìn)而獲取有效的特征。因此,文本分類(lèi)和概率主題模型是文本挖掘中非常有意義的研究課題。本文不僅關(guān)注文本分類(lèi),并探索了基于貝葉斯非參數(shù)的概率主題模型在文本分類(lèi)中特征表示及其特征選擇,主要工作如下:(1)波利亞罐子(Polya urn)模型是廣泛應(yīng)用于統(tǒng)計(jì)和文本挖掘的基本模型,大多數(shù)訓(xùn)練模型的算法都非常緩慢和復(fù)雜,因此通常很難適應(yīng)大數(shù)據(jù)集。本文對(duì)波利亞罐子模型的極大似然估計(jì)(MLE)提出了一種新... 

【文章來(lái)源】:華東師范大學(xué)上海市 211工程院校 985工程院校 教育部直屬院校

【文章頁(yè)數(shù)】:112 頁(yè)

【學(xué)位級(jí)別】:博士

【文章目錄】:
摘要
ABSTRACT(英文摘要)
主要符號(hào)對(duì)照表
第一章 引言
    §1.1 研究背景
    §1.2 研究現(xiàn)狀
        §1.2.1 特征表示與特征選擇
        §1.2.2 機(jī)器學(xué)習(xí)分類(lèi)方法
        §1.2.3 深度學(xué)習(xí)分類(lèi)方法
        §1.2.4 主題模型的研究現(xiàn)狀
    §1.3 研究的主要內(nèi)容
第二章 波利亞罐子模型及其在文本分類(lèi)上的應(yīng)用
    §2.1 引言
    §2.2 波利亞罐子模型
    §2.3 參數(shù)估計(jì)
        §2.3.1 極大似然估計(jì)
        §2.3.2 一個(gè)新的計(jì)算算法
        §2.3.3 極大似然估計(jì)的漸進(jìn)性質(zhì)
    §2.4 隨機(jī)模擬
    §2.5 波利亞罐子模型在文本分類(lèi)上的應(yīng)用
        §2.5.1 數(shù)據(jù)描述
        §2.5.2 文本預(yù)處理
        §2.5.3 分類(lèi)方法和評(píng)估準(zhǔn)則
        §2.5.4 結(jié)果比較
    §2.6 定理證明
        §2.6.1 定理3.1的證明
        §2.6.2 定理3.2的證明
第三章 基于分層狄利克雷過(guò)程的圖挖掘主題模型
    §3.1 引言
    §3.2 相關(guān)模型分析
        §3.2.1 隱狄利克雷分配模型
        §3.2.2 圖挖掘模型
        §3.2.3 分層狄利克雷過(guò)程
    §3.3 基于分層狄利克雷過(guò)程的圖挖掘主題模型
    §3.4 后驗(yàn)推斷
    §3.5 實(shí)例分析
        §3.5.1 數(shù)據(jù)描述
        §3.5.2 實(shí)驗(yàn)設(shè)計(jì)
        §3.5.3 評(píng)估準(zhǔn)則
        §3.5.4 結(jié)果分析
        §3.5.5 閾值的選擇
    §3.6 后驗(yàn)分布的推導(dǎo)及相關(guān)定理證明
        §3.6.1 基于分層狄利克雷過(guò)程的圖挖掘主題模型的后驗(yàn)分布推導(dǎo)
        §3.6.2 定理4.1的證明
第四章 基于隱馬爾可夫模型的Pitman-Yor先驗(yàn)概率主題模型
    §4.1 引言
    §4.2 模型及估計(jì)方法
        §4.2.1 符號(hào)
        §4.2.2 Pitman-Yor過(guò)程和相關(guān)的貝葉斯非參數(shù)過(guò)程
    §4.3 相關(guān)的模型
        §4.3.1 隱馬爾可夫主題模型
        §4.3.2 分層Pitman-Yor過(guò)程主題模型
    §4.4 基于隱馬爾可夫模型的Pitman-Yor先驗(yàn)概率主題模型
        §4.4.1 模型構(gòu)建
    §4.5 基于隱馬爾可夫模型的Pitman-Yor先驗(yàn)概率主題模型的變量推斷
        §4.5.1 后驗(yàn)推斷
        §4.5.2 參數(shù)估計(jì)
        §4.5.3 迭代算法的收斂性
    §4.6 實(shí)例分析
        §4.6.1 數(shù)據(jù)集
        §4.6.2 實(shí)驗(yàn)設(shè)置
        §4.6.3 結(jié)果分析
    §4.7 變量推斷的相關(guān)證明
第五章 基于句子的分層Pitman-Yor主題模型
    §5.1 引言
    §5.2 相關(guān)的工作回顧
        §5.2.1 基于句子的隱狄利克雷分配模型
        §5.2.2 Pitman-Yor過(guò)程及分層Pitman-Yor過(guò)程
    §5.3 基于句子的分層Pitman-Yor主題模型
    §5.4 基于句子的分層Pitman-Yor主題模型的后驗(yàn)推斷
    §5.5 實(shí)列分析
        §5.5.1 文本建模
        §5.5.2 文本分類(lèi)
第六章 結(jié)論與展望
參考文獻(xiàn)
致謝
在學(xué)期間的研究成果及發(fā)表的論文



本文編號(hào):2924913

資料下載
論文發(fā)表

本文鏈接:http://www.wukwdryxk.cn/guanlilunwen/tongjijuecelunwen/2924913.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶(hù)80806***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com
中文亚洲AV片在线观看无码 | 亚洲色图偷拍| 亚洲日韩片无码中文字幕| jizzyou中国少妇高潮| 久久www免费人成精品| 缙云县| 女人的天堂av| 久久黄色一级片| 黄色www.| 午夜三区| 久久精品一区二区三区四区| av日韩| 九色在线78m| 天天综合天天添夜夜添狠狠添| 性欧美1819sex性高清大胸| 黄色成年人网站| 日本尺码1码2码3码| 在线播放一区| www男人天堂| 亚美欧韩色一二三区| 在线色网站| 色婷婷导航| 亚洲激情人妻| 亚洲色图美腿丝袜| 欧美产精品一线二线三线| 国语自产偷拍精品视频偷少妇| 网色| 在线午夜| 久青草影院| 俺来也俺去啦久久综合网| 精品国产一二三产区区别h| 97国产| 日韩精品国产一区二区在线看| 奇米99| 久久爱| 99久久国产精品免费消防器材| 久久精品国产成人午夜福利| 一本一本大道香蕉久在线播放| 色婷婷亚洲一区二区综合| 亚洲国产综合人成综合网站| 无码人妻丰满熟妇精品区|