基于ARIMA模型和神經(jīng)網(wǎng)絡(luò)對(duì)論文下載量進(jìn)行預(yù)測
發(fā)布時(shí)間:2020-10-11 10:45
中國的論文發(fā)表量目前世界第一,又隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,商業(yè)數(shù)據(jù)庫和開源數(shù)據(jù)庫的增加,論文的傳播速度也隨之加快。鋪天蓋地的良莠不齊的文獻(xiàn)如何更加科學(xué)的評(píng)價(jià)其質(zhì)量,成為了文獻(xiàn)計(jì)量學(xué)的一個(gè)研究熱點(diǎn)。以往的評(píng)價(jià)指標(biāo)有諸多弊端,論文下載檢測系統(tǒng)的完善使得論文下載量成為評(píng)價(jià)論文指標(biāo)的一個(gè)重要標(biāo)準(zhǔn)。以往學(xué)者們主要論述了論文下載量指標(biāo)應(yīng)該納入評(píng)價(jià)論文好壞的體系,論文下載次數(shù)和論文引用次數(shù)的關(guān)系,和用一些統(tǒng)計(jì)學(xué)方法展現(xiàn)了論文下載量的一些規(guī)律。本文運(yùn)用推斷統(tǒng)計(jì)學(xué)中時(shí)間序列和神經(jīng)網(wǎng)絡(luò)來預(yù)測論文的下載量。本文搜集了plos期刊中Biology板塊2003年06月到2014年05月份關(guān)于論文下載量的SQL server數(shù)據(jù),然后經(jīng)過數(shù)據(jù)的預(yù)處理之后最終選定用2003年1 1月到2014年05月分的數(shù)據(jù)進(jìn)行實(shí)例驗(yàn)證。利用SQL server軟件對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,利用EXCEL軟件對(duì)數(shù)據(jù)做描述性統(tǒng)計(jì),所有散點(diǎn)圖大致走向均相同證明該數(shù)據(jù)具有普遍代表性;用SAS軟件對(duì)數(shù)據(jù)進(jìn)行時(shí)間序列分析,建立ARIMA模型和預(yù)測,利用BIC準(zhǔn)則選出最優(yōu)估計(jì)模型,并且參數(shù)估計(jì)和殘差的白噪聲檢驗(yàn)都通過了統(tǒng)計(jì)學(xué)檢驗(yàn),擁有統(tǒng)計(jì)學(xué)意義,并且得出了5個(gè)月的預(yù)測數(shù)據(jù),平均預(yù)測誤差為19.43%,預(yù)測散點(diǎn)圖顯示預(yù)測值和真實(shí)值及其接近,并且均在90%的置信區(qū)間內(nèi);利用matlab軟件對(duì)數(shù)據(jù)進(jìn)行BP神經(jīng)網(wǎng)絡(luò)建模和預(yù)測,預(yù)測值和真實(shí)值的走向趨勢基本一致,并且BP神經(jīng)網(wǎng)絡(luò)預(yù)測的評(píng)價(jià)誤差只有4.32%,證明預(yù)測結(jié)果較為理想。綜合考察BP神經(jīng)網(wǎng)絡(luò)預(yù)測結(jié)果比時(shí)間序列預(yù)測結(jié)果更好。
【學(xué)位單位】:大連理工大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位年份】:2015
【中圖分類】:TP183;C81
【部分圖文】:
身川備味g
身川備味g
【參考文獻(xiàn)】
本文編號(hào):2836479
【學(xué)位單位】:大連理工大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位年份】:2015
【中圖分類】:TP183;C81
【部分圖文】:
身川備味g
身川備味g
【參考文獻(xiàn)】
相關(guān)期刊論文 前1條
1 楊春華;王桂枝;馬紅月;;換個(gè)角度看服務(wù):從下載量看圖書館學(xué)論文的價(jià)值與需求[J];圖書與情報(bào);2010年04期
相關(guān)碩士學(xué)位論文 前1條
1 溫文;基于改進(jìn)BP神經(jīng)網(wǎng)絡(luò)的產(chǎn)品質(zhì)量合格率預(yù)測研究[D];華南理工大學(xué);2014年
本文編號(hào):2836479
本文鏈接:http://www.wukwdryxk.cn/guanlilunwen/tongjijuecelunwen/2836479.html
最近更新
教材專著