用于分析作业公告并生成结构化文件的python包
pycola的Python项目详细描述
pycola:python模块解析作业公告并生成结构文件
Kaggle:面向良好挑战的数据科学
https://www.kaggle.com/shivamb/1-bulletin-structuring-engine-cola
安装
pipinstallpycola
用法
提取器类用于生成结构化csv文件它接受一个用户输入配置:
“输入路径”:公告文本文件的路径
“output_file name”:输出文件的名称
frompycola.bulletin_parserimportExtractor## define the input pathconfig={"input_path":"Bulletins/","output_filename":"structured_file.csv"}## create the Extractor Class objectextr=Extractor(config)## call the extraction functionextr.extraction()
文件
http://www.shivambansal.com/blog/network/cola/BulletinStructuringEngine.html
希瓦姆·班萨尔