Python注释文件读取器
ascii-data-file的Python项目详细描述
访问文本格式文件中数据的模块
在数据分析中,数据通常存储在文本格式的文件中,其中的值在文本行的列中写入。在
文件可能包含注释,通常以#
开头,未使用的或uniteresting列或多个文件可以包含感兴趣的数据。在
因此,使用python快捷方式可以:
- 一个接一个地读一个或多个文件
- 或者并排放置一些文件(例如,将列附加在一起)
- 过滤掉注释行或空行。在
此模块提供了一个环绕文件迭代器的函数,允许按如下方式读取文件:
forone_lineindata_file('myfile.txt',comment_prefix='#'):print(one_line)
入门
以下说明将为您提供一个项目副本,并在本地计算机上运行。在
安装
该模块没有外部依赖性,可以很容易地与Python的distutils
工具一起安装。在
获取^{cd
到下载文件的目录,并执行以下命令:
这将打开、构建、安装和测试模块。在
测试
您可以使用pytest
在线测试库
依赖关系
构建模块时没有依赖关系。在
使用
data_file
函数定义如下:
data_file(file_path:Union[str,Sequence[str]],returned_columns:Union[str,slice,Sequence[int]]='*',comment_prefix:str="#",separator:Union[None,str]=None,returned_type:type=float,multi_files_behavior:str='append',skip_empty_lines:bool=True,skip_error_lines:bool=True,error_line_warning:bool=True,error_line_error:bool=False)->Generator
它返回一个过滤掉注释行的生成器
参数包括:
file_path
(str或str列表),必需:要打开的文件的路径returned columns
('*'
或切片或int列表),default=''*'
:选择要返回的列。 要么'*'
表示全部,要么是索引列表,要么是切片。在comment_prefix
(str),default=“#”:注释行开始处要查找的字符。在returned_type
(type),default=float
:要返回的数据类型。在multi_files_behavior
(str),默认值为“append”:当输入中给定多个文件时要做什么。append
或{} skip_empty_lines
(bool),默认值=True:是否跳过空行skip_error_lines
(bool),默认值=True:是否跳过处理中有错误的文件error_line_warning
(bool),默认值=True:如果没有跳过错误行,是否发出警告error_line_error
(bool),默认值=True:如果没有跳过错误行,那么在读取该行时是否引发一个运行时错误。在
有关用法的示例,请查看存储库中的test_ascii_data_file.py文件。在
作者
- Greg Henning-ghenning.at。iphc法国
许可证
这个项目是根据CeCILL自由软件许可协议授权的。在
更多信息请参见LICENSE。在
- 项目
标签: