如何使用pandas清理多个数据

2条回答

网友

1楼 · 编辑于 2024-09-28 17:15:18

尝试使用os：

import os

path = "C:/Users/username"
files = [file for file in os.listdir(path) if file.endswith(".tsv")]

for file in files:
    df = pd.read_csv(os.path.join(path, file), 
                     comment='#', 
                     header=None, 
                     sep='\t',
                     names=['index','count','text','tag'])
    df.to_csv(os.path.join(path, file))

注意：如您问题中所述，这将用修改的df覆盖现有文件

网友
2楼 · 编辑于 2024-09-28 17:15:18

import glob for file in glob.glob('foldername/*'): df = pd.read_csv(file, comment='#', header=None, sep='\t',names=['index','count','text','tag']) df.to_csv(f'./tmp/{file}')
我假设代码将在相同的数据文件夹中执行，请注意，您可以将.与glob.glob('.')中的数据文件夹关联起来
结果将保存在tmp文件夹中

编程相关推荐

尝试连接到Red5服务器时出现java问题
java实现Runnable的类被认为是ExecutorServices的“Runnable任务”？
java struts2类中的多个@validation
java未能应用插件[class'org.gradle.api.plugins.scala.ScalaBasePlugin']：gradle v2。13
如何使用Java流仅收集长度最大的元素？
从spring引导应用程序连接到firestore的java引发空指针异常
java从SQLite插入和获取真实数据类型会为连续插入获取空值吗？
当存在未知数量的空格时，使用java替代正向查找
部署如何为当今的浏览器部署java小程序（小程序、嵌入、对象）？
@OneToMany和@ManyToOne@Formula之间的java双向关系返回null

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何使用pandas清理多个数据

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >