LSTM模型具有恒定的精度且不可变

import numpy as np import pandas as pd from pandas.tseries.offsets import DateOffset from sklearn.preprocessing import MinMaxScaler, StandardScaler, RobustScaler from sklearn import preprocessing import keras %tensorflow_version 2.x import tensorflow as tf from tensorflow import keras from tensorflow.keras.models import Sequential from tensorflow.keras.layers import Dense, Flatten from tensorflow.keras.layers import LSTM from tensorflow.keras.layers import Dropout from keras.optimizers import Adam import warnings warnings.filterwarnings("ignore") %matplotlib inline from plotly.offline import iplot import matplotlib.pyplot as plt import chart_studio.plotly as py import plotly.offline as pyoff import plotly.graph_objs as go df_ventas = pd.read_csv('/content/drive/My Drive/proyectoPanimex/DEOPE.csv', parse_dates=['Data Emissão'], index_col=0, squeeze=True) #df_ventas = df_ventas.resample('M').sum().reset_index() df_ventas = df_ventas.drop(columns= ['weekday', 'month'], axis=1) df_ventas = df_ventas.reset_index() df_ventas = df_ventas.rename(columns= {'Data Emissão':'Fecha','Un':'Cantidad'}) df_ventas['dia'] = [x.day for x in df_ventas.Fecha] df_ventas['mes']=[x.month for x in df_ventas.Fecha] df_ventas['anio']=[x.year for x in df_ventas.Fecha] df_ventas = df_ventas[:-48] df_ventas = df_ventas.drop(columns='Fecha') df_diff = df_ventas.copy() df_diff['cantidad_anterior'] = df_diff['Cantidad'].shift(1) df_diff = df_diff.dropna() df_diff['diferencia'] = (df_diff['Cantidad'] - df_diff['cantidad_anterior']) df_supervised = df_diff.drop(['cantidad_anterior'],axis=1) #adding lags for inc in range(1,31): nombre_columna = 'retraso_' + str(inc) df_supervised[nombre_columna] = df_supervised['diferencia'].shift(inc) df_supervised = df_supervised.dropna() df_supervisedNumpy = df_supervised.to_numpy() train = df_supervisedNumpy scaler = MinMaxScaler(feature_range=(0, 1)) X_train = scaler.fit(train) train = train.reshape(train.shape[0], train.shape[1]) train_scaled = scaler.transform(train) X_train, y_train = train_scaled[:, 1:], train_scaled[:, 0:1] X_train = X_train.reshape(X_train.shape[0], 1, X_train.shape[1]) #LSTM MODEL model = Sequential() act = 'tanh' actF = 'relu' model.add(LSTM(200, activation = act, input_dim=34, return_sequences=True )) model.add(Dropout(0.15)) #model.add(Flatten()) model.add(LSTM(200, activation= act)) model.add(Dropout(0.2)) #model.add(Flatten()) model.add(Dense(200, activation= act)) model.add(Dropout(0.3)) model.add(Dense(1, activation= actF)) optimizer = keras.optimizers.Adam(lr=0.00001) model.compile(optimizer=optimizer, loss=keras.losses.binary_crossentropy, metrics=['accuracy']) history = model.fit(X_train, y_train, batch_size = 100, epochs = 50, verbose = 1) hist = pd.DataFrame(history.history) hist['Epoch'] = history.epoch hist

2条回答

网友

1楼 · 编辑于 2024-06-01 20:00:21

您的输出激活应该是linear用于连续预测，或者softmax用于分类。同时将你的学习率乘以100。你的损失应该是mean_absolute_error。你也可以很容易地将你的lstm神经元除以10。tanh应替换为relu或类似内容

对于您的准确性问题，使用准确性是没有意义的，因为您没有尝试分类。对于度量，可以使用mae。你试图知道预测离实际目标有多远，在一个连续的尺度上。准确度适用于类别，而非连续数据

网友

2楼 · 编辑于 2024-06-01 20:00:21

一个Dense(1, activation='softmax')将永远冻结，什么也学不到
一个Dense(1, activation='relu')很可能会冻结，什么也学不到
ADense(1, activation='sigmoid')是分类（二进制）问题的理想选择，对于值介于0和1之间的回归有一定的好处
ADense(1, activation='tanh')对于值介于-1和1之间的回归有点好
ADense(1, activation='softplus')对于值介于0和+infinite之间的回归有点好
ADense(1, actiavation='linear')通常适用于无限制的回归（但强烈建议在此之前对数据进行标准化）

对于回归，您不能使用精度，但度量'mae'和'mse'不提供“相对”差异，它们提供“绝对”平均差异，一个是线性的，另一个是平方的

相关问题更多 >

编程相关推荐

热门问题

热门文章