当我使用正常精度和K倍交叉验证运行决策树算法时，得到了两个完全不同的结果

from scipy.signal import butter, lfilter import numpy as np import pandas as pd import pandas from sklearn import preprocessing from scipy.fftpack import fft import pickle import numpy from pandas import Series from numpy.random import randn import pandas as pd import numpy as np from pandas import DataFrame from sklearn.metrics import accuracy_score from sklearn.tree import DecisionTreeClassifier xx = pandas.read_csv("data1.dat", delimiter=",") y = pandas.read_csv("label.dat", delim_whitespace=True) x = xx.as_matrix() y = numpy.array(y).astype(numpy.int) from sklearn.model_selection import train_test_split X_train, X_test, y_train, y_test = train_test_split(x, y, test_size=0.2, random_state=42) from sklearn.preprocessing import StandardScaler sc = StandardScaler() X_train = sc.fit_transform(X_train) X_test = sc.transform(X_test) clf2 = DecisionTreeClassifier(random_state=42) clf2.fit(X_train, y_train) y_predict_2 = clf2.predict(X_test) print("DTC Accuracy : ") print(accuracy_score(y_test, y_predict_2)*100)

1条回答

网友

1楼 · 发布于 2024-09-26 18:10:46

尝试洗牌数据，减少交叉验证次数

import numpy as np
import pandas as pd
from sklearn.model_selection import cross_val_score
from sklearn.utils import shuffle
from sklearn.tree import DecisionTreeClassifier

xx = pandas.read_csv("data1.dat", delimiter=",")
y = pandas.read_csv("label.dat", delim_whitespace=True)

x = xx.as_matrix()
y = y.values.astype(np.int32).reshape(-1, 1)

x, y = shuffle(x, y, random_state=42)

DTC = DecisionTreeClassifier(random_state=42)
scores = cross_val_score(DTC, x, y, cv=3, scoring='accuracy')
print(scores.mean()*100)

相关问题更多 >

编程相关推荐

热门问题

热门文章