计算机系统应用教程网站

网站首页 > 技术文章 正文

基于LSTM的双色球预测(二) 双色球预测系统分析

btikc 2024-10-15 08:56:01 技术文章 3 ℃ 0 评论

前言

本文主要依靠LSTM模型实现双色球预测,具体环境配置请依照上文进行设置:基于LSTM的双色球预测(一)

建立配置文件

在本地项目predict_Lottery_ticket-master内新建python文件,命名为config.py,主要用于配置采集数据地址和数据存放地址,内部代码如下:

# -*- coding: utf-8 -*-

URL = "https://datachart.500.com/ssq/history/"
path = "newinc/history.php?start={}&end="

BOLL_NAME = [
    "红球号码_1",
    "红球号码_2",
    "红球号码_3",
    "红球号码_4",
    "红球号码_5",
    "红球号码_6",
    "蓝球"
]

train_data_path = "data/data.csv"

建立LSTM模型

在本地项目predict_Lottery_ticket-master内新建python文件,命名为train_model.py,主要使用data内的彩票数据进行LSTM模型的建立,内部代码如下:

# -*- coding:utf-8 -*-

import os
import numpy as np
import pandas as pd
from config import *
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import LSTM, Dense
from tensorflow.keras.optimizers import Adam
from tensorflow.keras.utils import to_categorical
from tensorflow.keras.callbacks import EarlyStopping
import tensorflow as tf

# os.environ["CUDA_VISIBLE_DEVICES"] = "0"
# gpu_options = tf.compat.v1.GPUOptions(per_process_gpu_memory_fraction=1)
# sess =  tf.compat.v1.Session(config=tf.compat.v1.ConfigProto(gpu_options=gpu_options))

DATA = pd.read_csv(train_data_path)
if not len(DATA):
    raise Exception("请执行 get_train_data.py 进行数据下载!")


def transform_data(name):
    """ 数据转换
    :param name: 要训练的球号
    :return:
    """
    data_list = DATA[name].tolist()
    data_list_len = len(data_list)
    end_index = int(np.float(data_list_len / float(4)) * 4)
    data_list.reverse()
    fl = []
    for index, _ in enumerate(data_list[0: end_index - 4]):
        l_ = []
        for i in range(4):
            l_.append(data_list[index + i])
        fl.append(l_)
    return np.array(fl)


def create_model_data(name):
    """ 创建训练数据
    :param name: 要训练的球号
    :return:
    """
    data = transform_data(name)
    x_data = data[:, 0:3].reshape([-1, 3, 1])
    y_data = data[:, 3:].ravel()
    return x_data, y_data


def train_model(x_data, y_data, b_name):
    """ 模型训练
    :param x_data: 训练样本
    :param y_data: 训练标签
    :param b_name: 球号名
    :return:
    """
    n_class = 0
    if b_name[0] == "红":
        n_class = 33
    elif b_name[0] == "蓝":
        n_class = 16
    x_data = x_data - 1
    y_data = to_categorical(y_data - 1, num_classes=n_class)
    print("The x_data shape is {}".format(x_data.shape))
    print("The y_data shape is {}".format(y_data.shape))
    model = Sequential()
    model.add(LSTM(32, input_shape=(3, 1), return_sequences=True))
    model.add(LSTM(32, recurrent_dropout=0.2))
    model.add(Dense(n_class, activation="softmax"))
    model.compile(optimizer=Adam(), loss='categorical_crossentropy', metrics=["accuracy"])
    callbacks = [
        EarlyStopping(monitor='accuracy', patience=10000, verbose=2, mode='max',restore_best_weights='true')
    ]
    model.fit(x_data, y_data, batch_size=2596, epochs=100000, verbose=1,callbacks=callbacks)
    if not os.path.exists("model"):
        os.mkdir("model")
    model.save("model/lstm_model_{}.h5".format(b_name))


if __name__ == '__main__':
    for b_n in BOLL_NAME:
        print("[INFO] 开始训练: {}".format(b_n))
        x_train, y_train = create_model_data(b_n)
        train_model(x_train, y_train, b_n)

其中如果安装的是TensorFlow-GPU版本,那么红框中的代码主要用于调用GPU进行模型训练,如果安装的是TensorFlow-CPU版本,那么,红框内部的代码,注释掉即可;


对于我们来说,日常主要修改下面train_model.py部分代码即可


其中EarlyStopping主要用于模型达到预期效果后提前终止训练,后面跟的则是什么条件下提前终止训练,“monitor='accuracy'”指的是终止指标为准确率,“patience=10000”则是多少轮训练后终止指标未发生变化,这里可以根据大家自己的训练时间和期望进行调整

EarlyStopping(monitor='accuracy', patience=10000, verbose=2, mode='max',restore_best_weights='true')

而model.fit则是模型的训练函数,其中咱们主要调整的为训练集大小batch_size和训练轮数epochs,batch_size之所以设置为2596,是因为截止到9.17号,训练集内一共有2596条数据(也就是到双色球20090期),整体数据集较小,所以笔者就将全部数据投入训练,大家也可以根据自己的需求,去调整batch_size的大小;

model.fit(x_data, y_data, batch_size=2596, epochs=100000, verbose=1,callbacks=callbacks)

epochs则是训练轮数,因为彩票的预测,笔者发现随着轮数的增加,准确率和损失函数逐渐降低,所以设置为了十万轮,通常情况下,准确率能维持在60%以上,损失函数则在0.9左右,大家也可以继续增加训练轮数,注意不要过拟合即可;


代码全部修改完成后,点击运行,即可开始训练了(前提是已经跑出来了训练数据),聪明的小伙伴就可以尝试进行预测了,第三篇,杂学家会重点讲下预测环节,和解答大家的一些疑惑,有问题的小伙伴请积极评论提问~杂学家都会进行解答哦~

以上就是本篇的全部内容了,我们下篇再见~

本文暂时没有评论,来添加一个吧(●'◡'●)

欢迎 发表评论:

最近发表
标签列表