对Python的glob的限制？

网友

1楼 · 编辑于 2024-10-01 15:31:10

出现的一个问题不是Python本身，而是ArcPy和/或MS handling of CSV files（我认为是后者）。当循环迭代时，它创建一个schema.ini文件，在这个文件中，循环中处理的每个CSV文件的信息将被添加和存储。随着时间的推移，schema.ini变得相当大，我相信这就是性能问题出现的时候。在

我的解决方案，虽然可能不够优雅，但是在每个循环中都要删除schema.ini文件，以避免这个问题。这样做允许我处理10k+CSV文件，尽管速度相当慢。说实话，我们最终还是使用了GRASS和BASH脚本。在

网友

2楼 · 编辑于 2024-10-01 15:31:10

如果它对100个文件有效，但对10000个文件失败，那么检查arcpy.AddJoin_management是否关闭{}。在

一个进程在任何时候打开的文件数是有限制的（您可以通过运行ulimit -n）来检查这个数目。在

网友

3楼 · 编辑于 2024-10-01 15:31:10

尝试在shell上对这10000个条目执行ls*，shell也会失败。不如浏览一下目录，把这些文件一个接一个地交给你？在

#credit - @dabeaz - generators tutorial

import os
import fnmatch

def gen_find(filepat,top):
    for path, dirlist, filelist in os.walk(top):
        for name in fnmatch.filter(filelist,filepat):
            yield os.path.join(path,name)

# Example use

if __name__ == '__main__':
    lognames = gen_find("NCCCSM*.csv",".")
    for name in lognames:
        print name

相关问题更多 >

编程相关推荐

热门问题

热门文章