1 / 5
文档名称:

通过股市新闻和股票价格预测股票市场.docx

格式:docx   大小:20KB   页数:5页
下载后只包含 1 个 DOCX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

通过股市新闻和股票价格预测股票市场.docx

上传人:cengwaifai1314 2019/9/17 文件大小:20 KB

下载得到文件列表

通过股市新闻和股票价格预测股票市场.docx

文档介绍

文档介绍:最新【精品】范文 参考文献  专业论文通过股市新闻和股票价格预测股票市场通过股市新闻和股票价格预测股票市场【摘 要】文章结合股市新闻和股票历史价格,首先将股市新闻作为多重核的一个子核,利用中文分词软件对股市新闻进行分割,并从中选取 1000 个有代表性的词语处理后作为股市新闻子核的特征空间;然后选取 11 个指标对股票历史价格进行了处理并将其作为另外一个子核的特征空间;最终利用线性加权的方法对两个特征子空间进行合成,并进行仿真。【关键词】股票市场预测;中文分词;多重核学学****交互验证;网络搜索一、研究背景股票市场是当今金融市场主要部分之一,金融市场的投资者与预测者都想通过分析市场信息从而获得更多利润。通过有效市场假说(EMH),我们知道股票价格包含且反映了市场信息,但是,一些研究行为金融学的学者质疑了 EMH 的准确性,因为投资者会被各种市场信息和他们的心理所影响,从而造成不合理的投资举措。为了将多重信息整合到同一个系统当中,我们运用了多重核学****方(MKL),采用两个子核:一个运用股市新闻,另一个运用近期历史价格。在研究了子核的权重后,我们可以得到合成核,从而我们的改进的模型给出了一个比传统更准确的预测。二、模型设计(一)信息来源我们的系统是以两个信息为来源设计的:股市新闻和事前价格。所以系统的输入应该有如下几个特征:(1)时间戳记:每个股市新闻与一个时间戳记联系,它表示这个新闻的发行时间;(2)逐笔交易数据:交易数据往往记录在一个短时间段中;(3)同时:因为系统需要用价格变动来标记股市新闻,股市新闻和历史价格必须是同一时间段的信息; (二)股市新闻信息的预处理最新【精品】范文 参考文献  专业论文股市新闻可以理解为一种需要我们进行预处理的原始数据资源,其预处理的主要步骤如下:(1)中文分词:我们用中文分词软件对股市新闻数据进行分词。该中文分词软件可以对文字信息合理地划分,但是许多金融领域的一些特殊术语不能被该软件准确地分词,因此我们用金融字典对分词软件的输出进行二次加工;(2)词语过滤:首先删去中文停止词,例如:和、或等。然后过滤掉其他不重要的词语,只留下典型的具有代表性的词语,例如:名词、动词和形容词;(3)特征词语精选:不是余下的词语都可以作为特征词语留下,Feldman 只选择了过滤后余下的 10%作为特征词语。于是我们根据卡方分布选择了过滤后总共 7052 中的前 1000 个词语作为我们系统的特征词语;(4)赋予权重:最后为 1000 个词语赋权,我们计算作为每个词语的权重。(三)历史价格的预处理原始的逐笔交易数据通过以下步骤来进行预处理:(1)排序:因为交易不可能按照它们的时间戳记来排序,所以我们必须先按照时间戳记来对整个记录进行排序。(2)插入添加:因为连续交易之间的时间间隔不一样,有些时间段甚至不可能有记录,所以存在一个问题:在那些空时间段中,我们需要加入什么价格值。有两种方法解决这个问题:一是线性时间权重通过 Dacorogna 来排序;二是最近的收盘价格。该方法将逐笔交易数据以同一分钟为基础分开,将每分钟最相近的价格放在一起。如果某一分钟没有记录,那么上一分钟的记录将为代替。尽管两种方法都可以实现,我们选择了第二种方法,因为它的实现过程较为简单。(四)结合股市新闻和历史价格 。为了使计算机能使用这两种信