我正在寻找一种逻辑方法来比较来自用户的csv项目列表和我用glob生成的文件路径数组。然而,它并不一定要这样发生,我只需要采取一个csv项目列表文件,并在他们的工作。在
CsvScrape = glob.glob('C:\Ryans_Copy_Test\*\*DATA.CSV')
for scrape_items in CsvScrape:
print scrape_items
CsvReader = csv.reader(open(CsvBrowse, 'rb'), dialect=csv.excel)
for reader_items in CsvReader:
print reader_items
现在还不算多,但我计划生成一个*数据.CSV文件,然后将我的csv项目列表与它们匹配。。我遇到了一些问题,比如我如何做一个适当的比较(我要去掉文件路径信息的全局列表,然后比较这些项等等)如何告诉用户他们输入的项目名找不到,等等。。在
我在解释我的目标时遇到了一些困难,所以如果我需要详细说明某个特定的项目,请告诉我。在
谢谢。在
如果glob返回完整路径名:
scrape_items = map(os.path.basename, scrape_items)
您的
reader_items
可能是一个列表的列表:reader_items = [row[0] for row in reader_items]
使用集合查找不存在的内容:
not_in_csv = set(reader_items).difference(scrape_items)
项目名称与csv文件名的接近程度如何?你需要正则表达式来做这项工作还是它只是一个项目_名称数据.CSV?因为在这种情况下,你只会说:
相关问题 更多 >
编程相关推荐