网站首页 > 技术文章 正文
前言
本文主要依靠LSTM模型实现双色球预测,具体环境配置请依照上文进行设置:基于LSTM的双色球预测(一)
建立配置文件
在本地项目predict_Lottery_ticket-master内新建python文件,命名为config.py,主要用于配置采集数据地址和数据存放地址,内部代码如下:
# -*- coding: utf-8 -*-
URL = "https://datachart.500.com/ssq/history/"
path = "newinc/history.php?start={}&end="
BOLL_NAME = [
"红球号码_1",
"红球号码_2",
"红球号码_3",
"红球号码_4",
"红球号码_5",
"红球号码_6",
"蓝球"
]
train_data_path = "data/data.csv"
建立LSTM模型
在本地项目predict_Lottery_ticket-master内新建python文件,命名为train_model.py,主要使用data内的彩票数据进行LSTM模型的建立,内部代码如下:
# -*- coding:utf-8 -*-
import os
import numpy as np
import pandas as pd
from config import *
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import LSTM, Dense
from tensorflow.keras.optimizers import Adam
from tensorflow.keras.utils import to_categorical
from tensorflow.keras.callbacks import EarlyStopping
import tensorflow as tf
# os.environ["CUDA_VISIBLE_DEVICES"] = "0"
# gpu_options = tf.compat.v1.GPUOptions(per_process_gpu_memory_fraction=1)
# sess = tf.compat.v1.Session(config=tf.compat.v1.ConfigProto(gpu_options=gpu_options))
DATA = pd.read_csv(train_data_path)
if not len(DATA):
raise Exception("请执行 get_train_data.py 进行数据下载!")
def transform_data(name):
""" 数据转换
:param name: 要训练的球号
:return:
"""
data_list = DATA[name].tolist()
data_list_len = len(data_list)
end_index = int(np.float(data_list_len / float(4)) * 4)
data_list.reverse()
fl = []
for index, _ in enumerate(data_list[0: end_index - 4]):
l_ = []
for i in range(4):
l_.append(data_list[index + i])
fl.append(l_)
return np.array(fl)
def create_model_data(name):
""" 创建训练数据
:param name: 要训练的球号
:return:
"""
data = transform_data(name)
x_data = data[:, 0:3].reshape([-1, 3, 1])
y_data = data[:, 3:].ravel()
return x_data, y_data
def train_model(x_data, y_data, b_name):
""" 模型训练
:param x_data: 训练样本
:param y_data: 训练标签
:param b_name: 球号名
:return:
"""
n_class = 0
if b_name[0] == "红":
n_class = 33
elif b_name[0] == "蓝":
n_class = 16
x_data = x_data - 1
y_data = to_categorical(y_data - 1, num_classes=n_class)
print("The x_data shape is {}".format(x_data.shape))
print("The y_data shape is {}".format(y_data.shape))
model = Sequential()
model.add(LSTM(32, input_shape=(3, 1), return_sequences=True))
model.add(LSTM(32, recurrent_dropout=0.2))
model.add(Dense(n_class, activation="softmax"))
model.compile(optimizer=Adam(), loss='categorical_crossentropy', metrics=["accuracy"])
callbacks = [
EarlyStopping(monitor='accuracy', patience=10000, verbose=2, mode='max',restore_best_weights='true')
]
model.fit(x_data, y_data, batch_size=2596, epochs=100000, verbose=1,callbacks=callbacks)
if not os.path.exists("model"):
os.mkdir("model")
model.save("model/lstm_model_{}.h5".format(b_name))
if __name__ == '__main__':
for b_n in BOLL_NAME:
print("[INFO] 开始训练: {}".format(b_n))
x_train, y_train = create_model_data(b_n)
train_model(x_train, y_train, b_n)
其中如果安装的是TensorFlow-GPU版本,那么红框中的代码主要用于调用GPU进行模型训练,如果安装的是TensorFlow-CPU版本,那么,红框内部的代码,注释掉即可;
对于我们来说,日常主要修改下面train_model.py部分代码即可
其中EarlyStopping主要用于模型达到预期效果后提前终止训练,后面跟的则是什么条件下提前终止训练,“monitor='accuracy'”指的是终止指标为准确率,“patience=10000”则是多少轮训练后终止指标未发生变化,这里可以根据大家自己的训练时间和期望进行调整
EarlyStopping(monitor='accuracy', patience=10000, verbose=2, mode='max',restore_best_weights='true')
而model.fit则是模型的训练函数,其中咱们主要调整的为训练集大小batch_size和训练轮数epochs,batch_size之所以设置为2596,是因为截止到9.17号,训练集内一共有2596条数据(也就是到双色球20090期),整体数据集较小,所以笔者就将全部数据投入训练,大家也可以根据自己的需求,去调整batch_size的大小;
model.fit(x_data, y_data, batch_size=2596, epochs=100000, verbose=1,callbacks=callbacks)
epochs则是训练轮数,因为彩票的预测,笔者发现随着轮数的增加,准确率和损失函数逐渐降低,所以设置为了十万轮,通常情况下,准确率能维持在60%以上,损失函数则在0.9左右,大家也可以继续增加训练轮数,注意不要过拟合即可;
代码全部修改完成后,点击运行,即可开始训练了(前提是已经跑出来了训练数据),聪明的小伙伴就可以尝试进行预测了,第三篇,杂学家会重点讲下预测环节,和解答大家的一些疑惑,有问题的小伙伴请积极评论提问~杂学家都会进行解答哦~
以上就是本篇的全部内容了,我们下篇再见~
猜你喜欢
- 2024-10-15 【Python时序预测系列】基于多层LSTM实现单变量时间序列预测
- 2024-10-15 「深度学习」深度学习之LSTM 基于深度学习 lstm 的情感分析 京东商城数据
- 2024-10-15 使用2D卷积技术进行时间序列预测 卷积二维
- 2024-10-15 【Python时序预测系列】粒子群算法优化LSTM实现单变量时序预测
- 2024-10-15 【Python时序预测系列】一文搞明白时序数据输入到LSTM模型的格式
- 2024-10-15 用AI预测北京雾霾?有Keras在手,LSTM可分分钟解决
- 2024-10-15 基于Keras的LSTM多变量时间序列预测
- 2024-10-15 【Python时序预测系列】SARIMA+LSTM组合模型实现单变量时序预测
- 2024-10-15 人工智能深度学习-TensorFlow基于LSTM的预测实例
- 2024-10-15 分享丨“LSTM之父”新作:一种新方法,迈向自我修正的神经网络
你 发表评论:
欢迎- 最近发表
-
- 在 Spring Boot 项目中使用 activiti
- 开箱即用-activiti流程引擎(active 流程引擎)
- 在springBoot项目中整合使用activiti
- activiti中的网关是干什么的?(activiti包含网关)
- SpringBoot集成工作流Activiti(完整源码和配套文档)
- Activiti工作流介绍及使用(activiti工作流会签)
- SpringBoot集成工作流Activiti(实际项目演示)
- activiti工作流引擎(activiti工作流引擎怎么用)
- 工作流Activiti初体验及在数据库中生成的表
- Activiti工作流浅析(activiti6.0工作流引擎深度解析)
- 标签列表
-
- oraclesql优化 (66)
- 类的加载机制 (75)
- feignclient (62)
- 一致性hash算法 (71)
- dockfile (66)
- 锁机制 (57)
- javaresponse (60)
- 查看hive版本 (59)
- phpworkerman (57)
- spark算子 (58)
- vue双向绑定的原理 (68)
- springbootget请求 (58)
- docker网络三种模式 (67)
- spring控制反转 (71)
- data:image/jpeg (69)
- base64 (69)
- java分页 (64)
- kibanadocker (60)
- qabstracttablemodel (62)
- java生成pdf文件 (69)
- deletelater (62)
- com.aspose.words (58)
- android.mk (62)
- qopengl (73)
- epoch_millis (61)
本文暂时没有评论,来添加一个吧(●'◡'●)