使用nltk基于其他图书生成图书

bookgen的Python项目详细描述


BookGen

使用nltk分析两本书并生成一本新书的python库。

安装

pip install bookgen

用法

frombookgenimportBookGenbook=BookGen("word_base_book.txt","sentence_base_book.txt")# book.download() will download the nltk extras required, only needed onceprint(book.run())

说明

bookgen将解析第一本指定书籍中的单词类,如下所示:

{"NOUN": ["Mountain", "Valley"], "VERB": ["take", "went"]}

这些是由nltk通用标记集排序的。

第二本书是句子的基础。它将被解析成代表整本书的单词类型列表。

["NOUN", "VERB", "PREP", "NOUN", "CONJ", "VERB", "."]

然后,它基于第二本书从第一本书的单词中生成一个单词列表。

["Nathan", "went", "to", "Valley", "and", "peed", "."]

这与一些大写修复程序合并并返回。

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java如何在导入到Google工作表时使用ApachePOI显示系列标签   java在Swing表上修改数据生成SQL   java TCP数据包在网络级别合并   java自动连线bean在线程位置为空   javasocket。禁用无线连接时getOutputStream()阻塞   JSON上的javascript字符串数组。stringify输出unicode字符   java在Oracle数据库中存储不同类型数据的最佳体验   Spring MVC中模板引擎后的java进程输出   不知从哪里来的java空字符串。   如何加载java。使用Adobe Flex的客户端的属性文件?   java如何替换多层括号之间的所有内容?   {JSONObject必须以java'开头   java使用commandButton或commandLink返回并管理HTML控件值   java Android大文本视图动态   java JMock需要自定义类   java Android应用程序在emulator中工作,但在设备中失败   java连接到derby数据库时使用什么文件路径格式?   java在一个函数调用中返回两个结果?