财经类新闻对股波动影响的研究基于深度学习算法的分析【字数:9743】
目录
摘要3
关键词3
Abstract3
Key words3
研究背景与意义4
二、文献综述4
(一)国外文献回顾4
(二)国内文献回顾5
三、研究设计7
(一)变量的选取与定义7
1.被解释变量:沪深300指数 7
2.解释变量:财经类新闻文本标题7
(二)数据来源7
(三)财经新闻数据获取和预处理7
(四)描述性统计9
(五)模型介绍10
四、数据处理与实证结果分析11
(一)财经新闻的向量化及标签赋予11
1.财经新闻的向量化11
2.财经新闻的标签赋予13
(二)LSTM模型的搭建及统计检验13
1.LSTM模型搭建13
2.模型统计检验15
(三)模型模拟检测15
五、结论与建议15
致谢15
参考文献16
财经类新闻对股市波动影响的研究——基于深度学习算法的分析
引言
一、 研究背景与意义
随着现代社会信息技术的发展,互联网的不断普及,以及网络速度的飞跃性提升。网络成为人们信息来源的主要途径。截至2019年8月30日,中国互联网人口达到8.54亿,互联网普及率达到61.2%,而其中89.8%的人都使用手机app及电脑在 *51今日免费论文网|www.51jrft.com +Q: #351916072#
新闻网站上获取新闻资讯。中国人获取新闻的方式已经从传统的印刷媒体如电视和报纸转变为互联网。同时随着5G技术的不断发展,世界上任何角落发生的故事,瞬间就可以通过互联网传播到世界另外的每一个角落。在5G时代的今天,财经类新闻与股票价格之间有什么关系?这两者又是如何相互影响的呢?关注金融新闻能够提高投资者们的收益率吗?股票价格的波动性和预测一直是金融领域的热点,传统的预测股价方法一般是利用结构性交易数据对股价进行预测,比如利用最高价、成交量、收益率等数据。并使用传统的计量学算法或是传统的机器学习算法如RNN神经网络,其研究也取得了一定的成果。随着近年来机器学习算法的不断发展,有的学者通过利用文本挖掘技术将分析数据扩大到文本数据,并取得了一定的成效,比如刘欣(2014)使用三种类型的数据,即股票交易数据、财经新闻文本和金融情绪词汇,以股票数据和新闻的文本数据为解释变量,并使用支持向量机来进行预测。以往学者的研究表明,股票市场波动的20%是由于财经类新闻的发布所引起的,因此如果能通过分析财经类新闻来提高对股票市场波动的预测,那无疑可以提高股票市场的运行效率同时增加投资者的收益。
二、 文献综述
(一)国外文献回顾
财经类新闻对股票市场的影响的文献中,国外学者由于其股票市场起步较早,因此相关的研究也相应较多同时相比国内更加深入一些。笔者通过对国外学者的相关文献进行梳理发现,国外早期的学者主要通过统计新闻发布数量以及分析新闻文本中的积极和消极词汇来进行分析,“Niederhoffer(1971)通过研究在影响力较大的新闻发布时股票市场波动的变化程度,他的研究结果显示,重大新闻的发布对股票市场存在一定的影响”。Wuthrich(1998)收集了美国主要的几个顶级财经新闻网站的新闻,统计了与股票波动相关的特殊词的词频,并建立了相关的评分模型,采用了机器学习的算法决策树对股票的变动进行了预测。
同时,也有学者借鉴情感分析对财经新闻对股市波动的影响进行研究,如Tetlock(2007)提取了华尔街日报19841999年中每日发布的新闻中有关情绪的词汇,并分析该当天的股价和情绪词之间的联系,其研究表明,情绪词与股票市场波动的影响是较为明显的,同时在出现极端情绪词时,股票的交易额会大大增加。而 Tetlock(2008)继续推进了他的研究,他通过手机华尔街日报19802000年每天发布的新闻内容,并从中提取出了关于标普500指数的相关情感词,并建立了相应的情绪指标。Tetlock通过建立多元回归模型对情绪指标进行了分析,其结果表明这之间确实存在一定的关系,同时其中的负面情绪对股市波动的影响更大。
(二)国内文献回顾
相对于西方国家,由于国内资本市场起步较晚,因此导致国内相应研究起步较晚。国内关于财经新闻对股市影响的研究中,以往的学者中,一部分学者以统计新闻发布的数量进行研究,一部分学者通过利用文本挖掘技术进行研究,还有一部分学者通过SVM等其他方法来进行研究。虽然研究方法和角度或有区别,但结论均说明财经新闻对股票市场有影响
梁循和赵伟(2009)通过统计财经新闻发布的新闻数量来预测股价,其实验结果表明股票价格与财经新闻的发布量呈现显著的正相关。饶育蕾(2010)通过搜索200多家上市公司的新闻,同时着重关注新闻发布的数量。他的结论与梁赵的结论相似,即受到高度关注的上市公司的股价更高,并发现这个结论也适用于短期内新股的价格走势。孔翔宇等(2016)对财经新闻中的关键词进行提取,在此基础上建立模型对当日指数的日内涨跌情况进行了拟合;在测试集上选取了60个交易日进行验证,准确率超过60%,在此基础上建立的股指期货策略也可以产生盈利。
杨娟(2012)利用支持向量机把搜集的财经新闻分为三类,并利用CBOW进行特征提取进行研究,其结果表明不同类型的财经新闻对股票波动影响程度不同。刘欣(2014)使用三种类型的数据,即股票交易数据、财经新闻文本和金融情绪词汇,以股票数据和新闻的文本数据为解释变量,并使用支持向量机来进行预测。刘向强(2017)采集了国内网络媒体2014年至2015年上市公司的新闻报道的数据,对股票收益率与媒体关注度之间的关系进行了分析,其研究结果表明:经常被媒体报道的公司在未来7天的收益率通常比未被媒体报道的或是报道较少的公司低,媒体对公司股票收益率的影响十分明显。
原文链接:http://www.jxszl.com/jmgl/jjymy/606778.html