未提供项目说明

mapling的Python项目详细描述



映射

地图绘制可以在文本中找到一些东西,比如地名。它返回一个csv文件,其中包含一行。对于每个文件,它会创建一个突出显示的html页面。只需将映射指向一个装满文档的文件夹。映射使用textract从许多类型的文件中提取文本,包括csv、doc、docx、pdf、html、txt和许多其他文件。在

用法:$ mapling texts/ --gazetteer=gazetteer/gazetteer.txt --model=de_core_news_sm --html 要安装spaCy model$ python -m spacy download de_core_news_sm

  • 第一种方法是使用地名录。Mapling需要一个txt文件,每个地名对应一行。 添加--gazetter参数和文件的路径。这种方法允许您搜索文本中出现的特定术语(不仅仅是位置)。 $ mapling /dir/with/txt_files --gazetteer="/home/me/gazetter.txt"

  • 第二种方法使用空间命名实体识别模型。使用添加--model参数 已安装空间模型的名称。如果您的型号未安装或未安装 有一个ner管道,你会得到如何修复的指示。这种方法将返回大量的实体和位置,比您自己列出的要多。这有助于确定文本中出现的地点、人员和组织。 $ mapling /dir/with/txt_files --model=de_core_news_md

  • 最后,映射可以创建可视化。添加--html参数 $ mapling /dir/with/txt_files --model=de_core_news_md --html

要安装:

pip install mapling

在未来,地图绘制还将与Word Historical Gazetteer一起工作,以纠正、地理编码和绘制您的地名。在

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
数据库在使用TDengine时,如何保持Java客户端的高可用性?   javajavax。命名。无法将引用转换为javax。sql。数据源错误   理解Java中的溢出问题   java如何将数据请求与数据更新过程同步?   java在使用多部分上传图像时如何在客户端获取进程   java如何在FusionCharts中使用json数组?   java哈希映射“无法解析”。可以执行方法,但不能打印   java如何让用户更改JtextArea的背景色   java我们应该如何使用@XMLRootElement配置响应对象而不使用out   java BigQuery BigQueryException更新或删除   java使用新对象更新ArrayList+删除旧对象   java Alarmmanager立即启动   javascript实时Html推送通知   安卓如何从java代码更改视图大小   java Kafka 1.1多个消费群体滞后   多线程Java使用FileWriter写入同一文件引入多线程   java Jdbc连接池,按用户名进行连接缓存   java错误使用OpenGL?