在python中处理xls、xlsx和csv文件的统一抽象
tablereader的Python项目详细描述
#表格阅读器
tablereader是一个统一的抽象,用于在python中处理xls、xlsx和csv文件。它还根据请求将csv表读取为unicode。
如果您熟悉标准库中的csv.dictreader,可以将tablereader视为使用类固醇的dictreader。
fromtablereaderimportTableReaderreader=TableReader("some_input.xlsx",sheet="The Data")forrowinreader:printrow['valuecolumn']
如果您有CSV并且需要Unicode支持:
reader=TableReader("unicode_input.csv",force_type="unicodecsv")forrowinreader:printrow['valuecolumn']
如果要在读取行时去掉前导和尾随空格,可以:
reader=TableReader("input_with_whitespaces.csv",strip_whitespaces=True)forrowinreader:printrow['valuecolumn']
如果由于某种原因,您有一个以行结尾的错误类型的文件(通常在共享xls时发现),则覆盖自动检测:
reader=TableReader("wrong_named.xls",force_type="xlsx")forrowinreader:printrow['valuecolumn']
有时标题不在第一行。因此,指定一些标题行搜索文本,整行将用作列名,返回之后的所有行:
fromtablereaderimportOffsetTableReaderreader=OffsetTableReader("wrong_named.xls","BEGIN_DATA")forrowinreader:printrow['valuecolumn']
这个库已经在cpython 2.6、2.7和3.4以及pypy2.4.1上进行了测试。