class_label= random.sample(
[0 for i in range(1500)]+[1 for i in range(500)])
df = pd.dataframe(dict(
class_label= class_label,
feature_1=list(range(2000))))
import random
import string
import numpy as np
import pandas as pd
def get_random_string(length):
letters = string.ascii_lowercase
result_str = ''.join(random.choice(letters) for i in range(length))
return result_str
arr=[]
label=[]
for i in range(2000):
if i<1500:
label.append(0)
else:
label.append(1)
arr.append(get_random_string(8))
df=pd.DataFrame([arr,label]).T
df.columns=['f1','label']
df.head()
我们可以在这里使用numpy,并使用^{} 从列长度的
range
中抽取随机样本:或者另一个想法是:
试试这个:
输出:
Source
相关问题 更多 >
编程相关推荐