用于分析作业公告并生成结构化文件的python包

pycola的Python项目详细描述


pycola:python模块解析作业公告并生成结构文件

Kaggle:面向良好挑战的数据科学

https://www.kaggle.com/shivamb/1-bulletin-structuring-engine-cola

安装

pipinstallpycola

用法

提取器类用于生成结构化csv文件它接受一个用户输入配置:

“输入路径”:公告文本文件的路径
“output_file name”:输出文件的名称

frompycola.bulletin_parserimportExtractor## define the input pathconfig={"input_path":"Bulletins/","output_filename":"structured_file.csv"}## create the Extractor Class objectextr=Extractor(config)## call the extraction functionextr.extraction()

文件

http://www.shivambansal.com/blog/network/cola/BulletinStructuringEngine.html

希瓦姆·班萨尔

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java获取错误为“org.apache.poi.hssf.usermodel.HSSFRow无法转换为org.apache.poi.ss.usermodel.Row”   java静态字段在每次使用时是否都被调用/加载?   在文本字段中设置文本光标,Java   java WheelView不会在ScrollView中滚动   weblogic中ejb 3远程接口的java RMI调用   java jdbc创建表时出错   二叉搜索树Java:用泛型扩展类   如何将char[]数组的内容添加到新的char[]字母中?JAVA   java JPA规范:筛选子实体   java RCP通信   sql如何使用java将复杂的NativeQuery结果映射到DTO对象   java在Spring boot应用程序中捕获带方面的带注释参数   java HtmlUnit将参数发送到javascript文件   java将元素划分为一个组   使用java检查数据库中重复值的最佳实践   java ActiveMq Producer将JMS消息发送到目标队列需要更长的时间   Java:为什么PrintWriter或PrintStream类不抛出异常?   java JavaFX两个表视图之间的单一选择