基于金融文本情感的股票波動預(yù)測
發(fā)布時間:2020-12-06 10:16
股票市場的情緒可以在一定程度上反映投資者的行為并影響其投資決策。市場新聞作為一種非結(jié)構(gòu)性數(shù)據(jù),能夠體現(xiàn)并引導(dǎo)市場的大環(huán)境情緒,與股票價格一同成為至關(guān)重要的市場參考數(shù)據(jù),能夠為投資者的投資決策提供有效幫助。文中提出了一種可以準(zhǔn)確、快速地建立針對海量新聞數(shù)據(jù)的多維情緒特征向量化方法,利用支持向量機(jī)(Support Victor Machine,SVM)模型來預(yù)測金融新聞對股票市場的影響,并通過bootstrap來減輕過擬合問題。在滬深股指上進(jìn)行實驗的結(jié)果表明,相比于傳統(tǒng)模型,所提方法能夠?qū)㈩A(yù)測準(zhǔn)確度提高約8%,并在3個月的回測實驗中獲得了6.52%的超額收益,證明了其有效性。
【文章來源】:計算機(jī)科學(xué). 2020年05期 第79-83頁 北大核心
【文章頁數(shù)】:5 頁
【部分圖文】:
不同懲罰因子C對預(yù)測準(zhǔn)確率的影響(消極預(yù)測)
同樣地,特征詞數(shù)量會影響預(yù)測的準(zhǔn)確率以及模型訓(xùn)練速度,過多的特征詞會影響模型訓(xùn)練以及分類的速度,并增加數(shù)據(jù)的噪聲;過少的特征詞會降低分類準(zhǔn)確度。圖4、圖5顯示了不同數(shù)量的特征詞對預(yù)測結(jié)果的影響。圖5 不同特征詞數(shù)量下預(yù)測精度的比較(消極)
圖4 不同特征詞數(shù)量下預(yù)測精度的比較(積極)可以看到,特征詞數(shù)量在100~400時預(yù)測精度不斷增加,在400~800時預(yù)測精度并沒有顯著增長,并且隨著特征詞數(shù)量的增加,模型的訓(xùn)練時間以及對驗證文本的處理時間顯著增加。因此,結(jié)合訓(xùn)練結(jié)果的準(zhǔn)確率和模型訓(xùn)練速度,本文將特征詞數(shù)量定為600,超參C的值為10。
【參考文獻(xiàn)】:
期刊論文
[1]基于詞頻統(tǒng)計規(guī)律的文本數(shù)據(jù)預(yù)處理方法[J]. 池云仙,趙書良,羅燕,高琳,趙駿鵬,李超. 計算機(jī)科學(xué). 2017(10)
[2]基于SVM的主題爬蟲技術(shù)研究[J]. 李璐,張國印,李正文. 計算機(jī)科學(xué). 2015(02)
本文編號:2901209
【文章來源】:計算機(jī)科學(xué). 2020年05期 第79-83頁 北大核心
【文章頁數(shù)】:5 頁
【部分圖文】:
不同懲罰因子C對預(yù)測準(zhǔn)確率的影響(消極預(yù)測)
同樣地,特征詞數(shù)量會影響預(yù)測的準(zhǔn)確率以及模型訓(xùn)練速度,過多的特征詞會影響模型訓(xùn)練以及分類的速度,并增加數(shù)據(jù)的噪聲;過少的特征詞會降低分類準(zhǔn)確度。圖4、圖5顯示了不同數(shù)量的特征詞對預(yù)測結(jié)果的影響。圖5 不同特征詞數(shù)量下預(yù)測精度的比較(消極)
圖4 不同特征詞數(shù)量下預(yù)測精度的比較(積極)可以看到,特征詞數(shù)量在100~400時預(yù)測精度不斷增加,在400~800時預(yù)測精度并沒有顯著增長,并且隨著特征詞數(shù)量的增加,模型的訓(xùn)練時間以及對驗證文本的處理時間顯著增加。因此,結(jié)合訓(xùn)練結(jié)果的準(zhǔn)確率和模型訓(xùn)練速度,本文將特征詞數(shù)量定為600,超參C的值為10。
【參考文獻(xiàn)】:
期刊論文
[1]基于詞頻統(tǒng)計規(guī)律的文本數(shù)據(jù)預(yù)處理方法[J]. 池云仙,趙書良,羅燕,高琳,趙駿鵬,李超. 計算機(jī)科學(xué). 2017(10)
[2]基于SVM的主題爬蟲技術(shù)研究[J]. 李璐,張國印,李正文. 計算機(jī)科學(xué). 2015(02)
本文編號:2901209
本文鏈接:http://www.wukwdryxk.cn/jingjilunwen/jinrongzhengquanlunwen/2901209.html
最近更新
教材專著