基于神经网络算法LSTM模型对股票指数进行预测

article/2024/12/22 1:06:01

资源下载地址:https://download.csdn.net/download/sheziqiong/86813208
资源下载地址:https://download.csdn.net/download/sheziqiong/86813208

神经网络算法对股票的预测

背景

在复杂的股票市场环境中,神经网络算法在股票预测中已经得到了广泛使用,这是由于其自身具有较好的学习性能和高度的模拟能力,相对于传统的经济计量学方法,神经网络在金融时间序列预测方面更具优势。
近年来,国内外学者对于在股票市场的神经网络预测问题做了很多的研究工作。Shapiro…将神经网络、遗传算法和粗糙集组合成集成算法对股票市场价格趋势进行综合预测,但是文中没有作对比验证,而且模型中没有考虑到金融时间序列的依赖关系,预测结果并不客观;Ozbayoglu 等旧 1 通过对比人工神经网络和贝叶斯方法在金融市场的预测性能,发现这两种算法均有效,但是人工神经网络的预测效果更佳;Bildirici 等"1 将 BP 神经网络与条件异方差模型相结合,对 1987 年到 2008 年的伊斯坦布尔市场的股票数据做训练及预测,实证表明,这种结合模型的预测精度更加可靠,但是面对海量数据,此模型提取特征比较困难;Hammda 等 H1 采用多层 BP 神经网络对约旦股票市场的指数价格的趋势做预测,研究发现多层 BP 神经网络具有预测精度高、泛化能力强的优点,但文中没有解决 BP 神经网络容易陷入局部最小的问题;,得出该组合模型预测精度较高。考虑到股票市场的数据繁杂及其具有长期依赖性等问题以上模型在时间序列预测上还存在一些问题,而递归神经网络 RNN(Recurrent Neural Networks)可以改善这些问题。孙瑞奇 ¨4 J 将 BP 神经网络、RNN 和 LSTM 模型分别对美股和上证指数做预测,实验得出 LSTM 模型的预测精度最高;金雪军等 ¨ 纠采用深度 LSTM 模型研究美国的扩张性货币政策对中国膨胀的影响。综上可知,利用 LSTM 模型对于股票价格预测的研究极少。
本文针对 RNN 存在的梯度问题和神经网络的过拟合问题,提出 LSTM 模型对股票指数进行预测。通过修改 LSTM 模型的目标函数,从而提高了 LSTM 模型对金融时间序列预测性能。LSTM 模型误差低,对股票指数有更佳的预测效果。

模型构建

LSTM 神经元结构

LSTM 神经网络最早由 Hochreiter 和 Schmidhuber(1997)提出,由于能更好地发现长期依赖关系而被广泛用于处理序列信息,如语音识别、机器翻译等。LSTM 每个神经元的结构见图 l(Grave,2012)013],其内部包括一个记忆储存(Cell)和三个门控(Gates)设置,Cell 记录神经元状态,输人门(Input Gate)和输出门(Output Gate)用来接收、输出参数和修正参数,遗忘门(Forget Gate)用来控制上一单元状态的被遗忘程度。

在这里插入图片描述

LSTM 神经网络的构建

深层神经网络存在两种可能影响模型训练效果的问题,一是梯度消失导致神经网络难以收敛,二是过拟合导致测试集失效。研究表明,Batch.Normalization(BN)能有效解决梯度消失问题,Dropout 技术通过阻止神经元共适应能够缓解过拟合问题。因此,本文在设计 LSTM 神经网络时特别添加了 Dropout 层以优化神经网络结构。具体来说,本文 LSTM 神经网络的主体结构包括 2 层 LSTM 神经层和一层全连接层,第一个 LSTM 层包括 64 个节点,第二个 LSTM 层 16 个节点,其后加人 Dropout 层并将失活概率设为 0.2。本文构建的深层 LSTM 神经网络计算图结构见图 2,虚线方框内表示神经网络结构。

在这里插入图片描述
在这里插入图片描述

训练方法和损失函数

本文采用 Mini—Batch 方法训练 LSTM 网络。本文目标是预测股指未来收盘价,故选取均方误差(Mean Square Error,MsE)预测损失。优化器方面,本文采用 Adam 优化器(Adaptive MomentEstimation,适应性矩估计)① 进行优化训练。Adam 优化器由 Kingma 和 Sa(2015)…1 提出,是目前最常用的算法(Sabour 等 2017‘151;Wang 等 2018‘怕 1)。与其他自适应学习率算法相比,Adam 算法收敛速度更快、学习效果更为有效。本文基于 Python 语言环境,并以 PyTorch 作为深度学习框架进行训练及预测。最后求训练集和测试集的 MAE 平均绝对误差/MSE 最小均方误差/MAPE 百分比误差绝对值的平均值。

在这里插入图片描述
在这里插入图片描述

MAPE:范围[0,+∞),MAPE 为0%表示完美模型,MAPE 大于 100 %则表示劣质模型。MAPE 的值越小,说明预测模型拥有更好的精确度.

在这里插入图片描述

实验

本文针对 6322 组数据,即包括股票的开盘价格,收盘价,最低价和最高价四种数据。将收盘价作为输出变量,其他 5 个指标作为模型的输入变量。

在模型拟合数据之前,使用 Python3.7 中的 sklearn 函数库对数据集做转换处理。首先,为了使时间序列数据趋于稳定,对数据做滞后一次差分处理;然后将预测收盘价转化为有监督学习问题,也就是将数据组合成输入和输出模式,将上次时间步长的观测值用作预测当前时间步长观测值的输入;最后对原始数据进行归一化处理,将其转换到[0,1]之间。

将处理后的数据按顺序分成训练集和测试集,其中前 5422 个数据做训练集,后 1000 个数据做测试集,训练模型 50 次 epoch,在数据测试完成之后,将预测值做反转换处理,以便计算预测性能指标。

个的 LSTM——遗忘层——16 个 LSTM——遗忘层——4 层全连接层

在这里插入图片描述

MAE 平均绝对误差/MSE 最小均方误差/MAPE 百分比误差绝对值的平均值

在这里插入图片描述

资源下载地址:https://download.csdn.net/download/sheziqiong/86813208
资源下载地址:https://download.csdn.net/download/sheziqiong/86813208


http://chatgpt.dhexx.cn/article/WYb0GTXE.shtml

相关文章

【定量分析、量化金融与统计学】统计推断基础(4)---假设检验(T或者Z检验)

目录 一、前言 二、假设检验的基本概念 1.假设检验的概念与目的: 2.原假设 三、假设检验的实例步骤: 例子: 一个问题: 四、不同种类的假设检验: one-sample T检验: Two-sample T检验:…

【数学➡️量化】两个必须知道的金融中的数学应用!!

引言 相信如果是数学系的本科生,想工作向量化转行的这个路上难免遇到许多的“水土不服”——怀疑自己的数学是否能派上用场,一边觉得自己论应用比不过金工的同学,一边觉得论编程比不过计算机的同学… 但其实,不用怀疑自己&#x…

金融计量模型(三):工具变量法

文章目录 工具变量法内生性Simultaneous causality案例:供求问题 Omitted VariablesErrors in Variables其他原因 工具变量法的基本想法多个工具变量 工具变量法 内生性 在线性回归: y i x i ′ β u i y_ix_i\betau_i yi​xi′​βui​ 中&#xf…

高级计量经济学(part1)--什么是计量经济学

学习笔记,仅供参考,有错必纠 参考自:陈强. 高级计量经济学[M]. 什么是计量经济学 顾名思义,”计量经济学" ( E conometrics, 也译为“ 经济计量学)就是运用概率统计的方法对经济变量之间的(因果)关系…

【定量分析、量化金融与统计学】统计推断基础(1)---总体、样本、标准差、标准误

目录 一、前言 二、总体与样本 1.总体(population)的概念 2.总体的性质与参数 首先是:平均数(mean) 标准差(standard deviation,SD)σ希腊字母sigma 3.样本(sample…

【精算研究01/10】 计量经济学的性质和范围

一、说明 计量经济学是使用统计方法来发展理论或测试经济学或金融学中的现有假设。计量经济学依赖于回归模型和零假设检验等技术。计量经济学也可以用来预测未来的经济或金融趋势。 图片来源:https://marketbusinessnews.com 二、 计量经济之简介 计量经济学是对经济…

信息计量学

目录 第一章 绪论 1.1由来和发展 1.1.1产生背景 1.2概念和内容体系 1.2.1 概念 1.2.2内容体系 1.3与相关学科 1.3.1与数学 1.3.2与文献计量学 1.3.3与科学学 1.4发展趋势和前景 1.4.1进展 1.4.2趋势 第二章 文献信息增长规律 2.1 文献信息流的特性及增长规律研究…

统计学在金融中的应用

统计分析是在一堆独立的、自身没有实际意义的数据中寻找可能存在的趋势、分布、概率等有意义的信息。统计学的目标是探索和把握数据内在的规律。统计学的应用,简单来说就是通过搜集相关数据并进行整理和分析,然后根据数据做出决策。掌握统计学&#xff0…

【定量分析、量化金融与统计学】多元回归模型与回归推理

之前说过了一元线性回归并给出了程序,今天来说说多元回归模型(Multiple Regression Model) 目录 一、多元回归模型的简介 二、求解多元回归模型:我们使用最小二乘法为例 三、评判方法 四、推理和回归 五、模型的优化 1.排…

金融计量学实验报告一

一、实验数据 中国石油天然气集团公司是以油气业务、工程技术服务、石油工程建设、石油装备制造、金融服务、新能源开发等为主营业务的综合性国际能源公司能源公司(代码601857), 数据来源中国石油上市公司在2011/1月到2021/12月的月度收盘价数据,数据来源为大智慧软件下载并…

金融计量学1

第一题 请使用 sysuse nlsw88.dta, clear 命令调入 Stata 数据文件 nls88.dta, 并完成如下统计分析: (1). 统计如下变量的平均值、标准差、中位数、最小值和最大值,并列表呈现出来,并输出为 Excel 或 Word 文档,名称为 Table01.xlsx 或 Table01.docx: age grade wage ho…

金融计量学第2课堂-金融时间序列线性模型

量化策略开发,高质量社群,交易思路分享等相关内容 一、相关性和平稳性 1、相关性 (1)皮尔森相关系数 皮尔森相关系数是最常见、最常用的一个相关系数计算方法。作为衡量两个随机变量x和y线性相关程度的重要指标,在这…

【金融计量学】面板数据(自用笔记,第一次写)

一、简介 面板数据的分类:平衡/非平衡面板数据;动态/静态面板数据。 面板数据中包含两种效应: 1. 个体效应:不随时间推移而明显变化的因素,如消费者的收入、产品的价格、个人消费习惯、社会制度等。 2. 时间效应&#…

金融计量学第1节课:股指收益率序列统计特征

量化策略开发,高质量社群,交易思路分享等相关内容 导论与介绍 大家好,我是Le Chiffre 今天我们来为大家分享金融计量学系列内容,在松鼠量化3年多分享的内容中,大部分以量化策略为主,至今为止,…

Word可折叠多级标题

在修改文章格式时应按照期刊的格式规范,如要使用可折叠的多级标题时,可参考如下方法。 1、规范下图的标题 2、按图顺序点击相应按钮,新建样式 3、依次修改红圈内容。注意:如果是一级标题,相应地,样式基准…

word文档如何设置多级标题

1、设置一级标题 光标放在‘一级标题’内容那,点击‘标题1’ 点击‘多级列表’图标 选中一个列表样式 一级标题设置完毕 当再次设置一级标题的时候,可以通过选中已经设置好的一级标题,然后点击‘格式刷’将样式复制 2、设置二级标题…

处理word 多级标题编号不联动的问题

修改文档时遇到的问题,各种百度没有解决,后来领导指导下弄好了,做个纪录。 问题如下所示 解决办法:需要在开始-多级编号处,将2级标题与3级标题设置成同一样式。 接下来开始演示 目前2级标题是这个样式 3级标题是这…

Mac Office Word设置多级标题

目录 定义新的多级列表 将级别链接到样式 问题解决:在样式中没有对应标题 附:毕业论文格式搞一手 定义新的多级列表 在一个新建文档中,点击顶栏中的多级列表标志,选择定义新的多级列表 注:如果找不到这个符号&…

【WORD】01 多级标题自动编号

需求 在Word中,希望实现多级标题,自动编号,改变章节顺序后,自动改变章节编号这一功能。经过搜索后,摸索出设置方法,设置效果如图。 操作步骤 首先明确标题样式,如图所示 点击段落–>多级…

从根儿上解决Word中标题多级标题编号不联动问题

在日常工作中总是时不时会出现word标题编号相关的问题,不胜其烦。最近终于有时间去排查,找出了解决办法。 以下为我个人总结出的两个问题,如果大家也曾经被困扰过,希望能帮到你们。 一、多余编号 大家请看下图: 如果…