金融时间序列预测方法合集:CNN、LSTM、随机森林、ARMA预测股票价格(适用于时序问题)、相似度计算、各类评判指标绘图(数学建模科研适用)

2023-07-08 10:08:33

在这里插入图片描述

项目设计集合(人工智能方向):助力新人快速实战掌握技能、自主完成项目设计升级,提升自身的硬实力(不仅限NLP、知识图谱、计算机视觉等领域):汇总有意义的项目设计集合,助力新人快速实战掌握技能,助力用户更好利用 CSDN 平台,自主完成项目设计升级,提升自身的硬实力。

在这里插入图片描述

  1. 专栏订阅:项目大全提升自身的硬实力

  2. [专栏详细介绍:项目设计集合(人工智能方向):助力新人快速实战掌握技能、自主完成项目设计升级,提升自身的硬实力(不仅限NLP、知识图谱、计算机视觉等领域)

金融时间序列预测方法合集:CNN、LSTM、随机森林、ARMA预测股票价格(适用于时序问题)、相似度计算、各类评判指标绘图(数学建模科研适用)

码源见文章顶部或文末链接

https://download.csdn.net/download/sinat_39620217/87988639

1.使用CNN模型预测未来一天的股价涨跌-CNN(卷积神经网络)

使用CNN模型预测未来一天的股价涨跌

数据介绍

open 开盘价;close 收盘价;high 最高价

low 最低价;volume 交易量;label 涨/跌

训练规模

特征数量×5;天数×5 = 5 × 5

卷积过程

最大池化过程

代码流程

  1. 获取股票数据
  2. 数据归一化
  3. 数据预处理(划分成5×5)
  4. 数据集分割(训练集和测试集)
  5. 定义卷积神经网络
  6. 评估预测模型

模型架构

2.基于LSTM预测股票价格(长短期记忆神经网络)

基于LSTM预测股票价格(简易版)

数据集:

沪深300数据

数据特征:

只选用原始数据特征(开盘价、收盘价、最高价、最低价、交易量)

时间窗口:

15天

代码流程:

读取数据->生成标签(下一天收盘价)->分割数据集->LSTM模型预测->可视化->预测结果评估

LSTM网络结构:

函数介绍:

1、generate_label 生成标签(下一天收盘价)

2、generate_model_data 分割数据集

3、evaluate 结果评估

4、lstm_model LSTM预测模型

5、main 主函数(含可视化)

可视化输出:

训练集测试集拟合效果:

评估指标:

1、RMSE:55.93668241713906

2、MAE:44.51361108752264

3、MAPE:1.3418267677320612

4、AMAPE:1.3420384401412058

3.基于随机森林预测股票未来第d+k天相比于第d天的涨/跌Random-Forest(随机森林)

基于随机森林预测股票未来第d+k天相比于第d天的涨/跌(简易版)

参考论文:Predicting the direction of stock market prices using random forest

论文流程:

算法流程:

获取金融数据->指数平滑->计算技术指标->数据归一化->随机森林模型预测

函数介绍:

1、get_stock_data 通过Tushare获取原始股票数据

2、exponential_smoothing、em_stock_data 股票指数平滑处理

3、calc_technical_indicators 计算常用的技术指标

4、normalization 数据归一化处理并分割数据集

5、random_forest_model 随机森林模型并返回准确率和特征排名

决策树:

(1)ID3: 基于信息增益大的数据特征划分层次

(2)C4.5: 基于信息增益比=信息增益/特征熵划分层次

(3)CART: 基于Gini划分层次

基于Bagging集成学习算法,有多棵决策树组成(通常是CART决策树),其主要特性有:

(1)样本和特征随机采样

(2)适用于数据维度大的数据集

(3)对异常样本点不敏感

(4)可以并行训练(决策树间独立同分布)

算法输出:

注意:算法仅用于参考学习交流,由于是研一时期独立编写(以后可能进一步完善),所公开的代码并非足够完善和严谨,如以下问题:

  1. 模型涉及参数未寻优(可考虑网格搜索、随机搜索、贝叶斯优化)

    1. 指数平滑因子

    2. 随机森林模型树数量、决策树深度、叶子节点最小样本数等

    3. 未来第k天的选择

    4. 归一化方法

  2. 随机森林模型其实本身不需要数据归一化(如算法对数据集进行归一化也需要考虑对训练集、验证集、测试集独立归一化)

  3. 股票预测考虑的数据特征:

    1. 原始数据特征(open/close/high/low)

    2. 技术指标(Technical indicator)

    3. 企业公开公告信息

    4. 企业未来规划

    5. 企业年度报表

    6. 社会舆论

    7. 股民情绪

    8. 国家政策

    9. 股票间影响等

4.模型输出结果

5.随机森林参数优化参考表

4.基于ARMA预测股票价格-ARMA(自回归滑动平均模型)

基于ARMA预测股票价格(5分钟数据)

1.检测数据平稳化

2.差分/对数等数据处理

3.使用ARMA模型预测

备注:部分代码参考网络资源

5.金融时间序列相似度计算

5.1.皮尔逊相关系数( pearson_correlation_coefficient)

1.1 由于不同股票价格范围差距过大,在进行股票时间序列相似度匹配过程中通常考虑对数差处理,其公式如下所示:

1.2经过对数差处理后的金融时间序列可表示:

1.3皮尔逊相关系数计算公式:

1.4结果

1.4.1相关性较强

1.4.2相关性较弱

5.2.动态时间规整(dynamic_time_wrapping)

2.1 计算两个金融时间序列的时间点对应数据的欧氏距离

2.2 更新时间点对应数据的距离

2.3 动态时间规整距离

2.4 伪代码

2.5 动态时间规整距离输出图举例

2.6 动态时间规整最优匹配对齐

2.7结果

2.7.1动态时间规整距离较短

2.7.1动态时间规整距离较长

5.3.余弦相似度(cosine similarity)

6.金融时间序列(其他)

6.1.计算特征方差(calc_variance.py)

open 161211.21669504658
close 161415.73886306392
high 166077.6958545937
low 156622.3645795179
......

6.2.绘制混淆矩阵(confuse_matrix.py)

6.3.特征间相关性(corr.py)

6.4.绘制预测模型性能——柱状图(result_bar.py)

6.5.绘制预测模型性能——折线图(result_plot.py)

6.6.相似金融时间序列绘制(similarity_time_series.py)

6.7.计算分类的评价指标(evaluation.py)

(1)准确率Accuracy

(2)精确率Precision

(3)召回率Recall

(4)特异度Specificity

(5)综合评价指标F-measure

(6)马修斯相关系数MCC(Matthews Correlation Coefficient)

6.8.窗口数据归一化(normalization.py)

(1)z-score标准化(std)

(2)最大最小归一化(maxmin)

6.9.股票数据下载(download.py)

(1)tushare接口

(2)JQdata接口

6.10.roc曲线绘制(roc.py)

6.11.混淆矩阵绘制(confusion_matrix.py)

6.12.卡尔曼滤波(kalmanfilter.py)

6.13.蜡烛图 (candle.py)

码源见文章顶部或文末链接

https://download.csdn.net/download/sinat_39620217/87988639

更多推荐

Linux配置成代理服务器

Linux配置成代理服务器什么是代理服务器把Linux配置成代理服务器开放的代理服务器升级需要账号密码的代理服务器Linux系统使用代理服务器临时通过代理访问永久通过代理访问Windows系统使用代理服务器什么是代理服务器代理服务器(ProxyServer)是一种位于计算机网络中的中间服务器,它充当了客户端和目标服务器

redis的数据类型

redis数据类型redis的五种数据类型是:1、string(字符串);2、hash(哈希);3、list(列表);4、set(集合);5、sortset(有序集合)。其中,string(字符串)是redis中最基本的数据类型,一个key对应一个value,string可以包含任何数据字符串string字符串是所有编

GaussDB数据库SQL系列-层次递归查询

目录一、前言二、GuassDB数据库层次递归查询概念三、GaussDB数据库层次递归查询实验示例1、创建实验表2、sys_connect_by_path(col,separator)3、connect_by_root(col)4、WITHRECURSIVE四、递归查询的优缺点1、优点2、缺点五、总结一、前言层次递归查询

rust输入输出

一、获取命令行参数很多语言获取命令行参数,是通过主函数的参数获得的。但Rust主函数是个无参数函数,命令行参数只能通过std::env::args()函数获得。std::env::args()返回一个迭代器,其中包含了程序名和后面所有参数。实例fnmain(){letargs=std::env::args();fora

企业工程项目管理系统源码(三控:进度组织、质量安全、预算资金成本、二平台:招采、设计管理)

工程项目管理软件(工程项目管理系统)对建设工程项目管理组织建设、项目策划决策、规划设计、施工建设到竣工交付、总结评估、运维运营,全过程、全方位的对项目进行综合管理工程项目各模块及其功能点清单一、系统管理1、数据字典:实现对数据字典标签的增删改查操作2、编码管理:实现对系统编码的增删改查操作3、用户管理:管理和查看用户角

【算法练习Day1】二分查找&&移除元素

​​📝个人主页:@Sherry的成长之路🏠学习社区:Sherry的成长之路(个人社区)📖专栏链接:练题🎯长路漫漫浩浩,万事皆有期待文章目录二分查找解决方法一:左闭右开[left<=right),right=nums.size()-1;解决方法二:左闭右闭(left<right),right=nums.size(

【JS】—垃圾回收机制

一、指令材料1.定义JavaScript(JS)的垃圾回收机制是一种自动管理内存的过程,它有助于释放不再使用的内存,以避免内存泄漏和提高程序的性能。JavaScript的垃圾回收机制是一种自动管理内存的方式,以确保不再被引用的对象可以被垃圾回收,释放内存。2.分类2-1.引用计数算法引用计数算法通过跟踪每个对象被引用的

AI数字人虚拟主播,跟传统主播相比有哪些优势,究竟谁更胜一筹?

在今年,AI人工智能技术得到了快速发展,AI数字人开始大面积进入我们的生活,我们经常可以在各大直播间刷到AI数字人虚拟主播。这些主播光从表面上来看,完全跟真人一模一样,一样的容貌、一样的身形、一样的声音,几乎很难让人分辨出真假,或许正因为此,这种AI数字人虚拟主播才如此受欢迎。那这种跟真人如此神似的AI数字人主播,未来

Nginx常用模块

Nginx常用模块文章目录Nginx常用模块1.Nginx常用模块1.1.Nginx目录索引/下载模块1.1.1.配置autoindex语法1.1.2.autoindex配置实例1.1.3上传资源1.1.4.autoindex_exact_size配置语法1.1.5.修改配置文件1.1.6.再次访问1.1.7.修改日期

将树莓派转身为强大的Web服务器:使用Nginx和cpolar实现远程访问

文章目录1.Nginx安装2.安装cpolar3.配置域名访问Nginx4.固定域名访问5.配置静态站点安装Nginx(发音为“engine-x”)可以将您的树莓派变成一个强大的Web服务器,可以用于托管网站或Web应用程序。相比其他Web服务器,Nginx的内存占用率非常低,可以在树莓派等资源受限的设备上运行。同时结

网络安全深入学习第一课——热门框架漏洞(RCE-命令执行)

文章目录一、RCE二、命令执行/注入-概述三、命令执行-常见函数四、PHP命令执行-常见函数1、exec:2、system3、passthru4、shell_exec5、反引号backquote五、PHP命令执行-常见函数总结六、命令执行漏洞成因七、命令执行漏洞利用条件八、命令执行漏洞分类1、代码层过滤不严2、系统的漏

热文推荐