Python基于存档生成数据

2024-09-29 00:18:40 发布

您现在位置:Python中文网/ 问答频道 /正文

我在做一个运筹学项目。在

我创建了一个启发式方法,我需要集中测试我的方法来评估它的性能。在

我有过去的数据,以3个字段的形式

日期、金额、类型

我想要的是生成新的数据,类似于现有的数据。“+/-我正在随机做这个”。在

我有一种方法或库来生成原始数据,类似于通过分析旧数据的统计数据和趋势来生成现有数据。在


Tags: 数据项目方法类型原始数据性能金额趋势
1条回答
网友
1楼 · 发布于 2024-09-29 00:18:40

根据我的评论,你可以用熊猫。例如,首先生成一些虚拟数据:

data = [{'date': 'dummy', 'amount':1, 'type': 'a'},
        {'date': 'dummy' , 'amount':2, 'type': 'a'},
        {'date': 'dummy', 'amount':1, 'type': 'b'},
        {'date': 'dummy', 'amount':1, 'type': 'b'},
        {'date': 'dummy', 'amount':2, 'type': 'c'}]

导入适当的库:

^{pr2}$

将数据导入熊猫数据框:

df = pd.DataFrame(data, columns=['date', 'amount', 'type'])

输出:

    date  amount type
0  dummy       1    a
1  dummy       2    a
2  dummy       1    b
3  dummy       1    b
4  dummy       2    c

然后应用随机“+/-”数据方法:

df['new  amount'] = df['amount'].apply(lambda amount: amount + (-random.random())**random.randint(1, 2))

结果:

    date  amount type  new  amount
0  dummy       1    a     1.021583
1  dummy       2    a     1.496697
2  dummy       1    b     0.685394
3  dummy       1    b     1.764432
4  dummy       2    c     2.219713

当然,这个过程必须根据您的具体需要进行更改。您还可以使用pandas进行统计分析,从而想出其他方法来转换数据。在

相关问题 更多 >