摄取文本并输出由马尔可夫链生成的句子

helga-markovif的Python项目详细描述


https://badge.fury.io/py/helga-markovify.pnghttps://travis-ci.org/narfman0/helga-markovify.png?branch=master

摄取文本的小体并输出由马尔可夫链生成的句子。 赫尔加现在会监听你的irc频道,并在途中接收对话, 学会说你的行话。你可以从“日志”摄取开始,或者 任何其他摄入技术。

安装

安装和配置helga后,请使用:

pip install helga-markovify

markovify添加到您的设置并重新启动helga。要使用Twitter时间线, 您还必须将以下内容添加到设置(使用凭据):

TWITTER_CONSUMER_KEY = 'asad'
TWITTER_CONSUMER_SECRET = 'sdfs'
TWITTER_ACCESS_TOKEN = 'fghf'
TWITTER_ACCESS_SECRET = 'ghjg'

用法

注意:请在文本中使用标点符号。这是个棘手的问题 练习,但是区分句子是很重要的。

命令语法:

ingest <topic> <learning_type> <learning_type_source>
generate <topic>
drop <topic>

参数

topic:类似于标记,因此helga可以以不同的方式响应

learning_type:赫尔加将如何摄取。可以是文本,原始数据的url, 指向dpaste的url或twitter帐户。

learning_type_source:对应的数据,例如,如果学习类型是明文 是“文本”,url是“url”,twitter屏幕名是“twitter”,helga_日志阅读器 “logs”的参数(建议您变老并使用当前频道)

ingest命令从引用的 语料库.你可以从任何来源教机器人,它可以是twitter或者 文本。混合搭配很好。

generate命令从语料库生成一个句子。

drop命令从存储中删除特定主题。如果一个语料库变成 由于任何原因损坏,用户可能会丢弃它并重新摄取数据以填充 又来了。

设置

MARKOVIFY_ADD_PUNCTUATION:是否应该在行后添加句点。你总是 想要好的标点符号来表示好的句子,这是一个相当安全的“真的” 默认情况下。

MARKOVIFY_CHANNEL_LISTEN:接收当前频道抖动。有点贵, 可能不是很好的隐私问题,但那是lol火车到达的地方。

MARKOVIFY_CHANNEL_GENERATE:regex helga侦听生成的响应 默认频道颤音

MARKOVIFY_TOPIC_DEFAULT:频道数据的默认摄取主题

TWITTER_CONSUMER_KEY TWITTER_CONSUMER_SECRET TWITTER_ACCESS_TOKEN TWITTER_ACCESS_SECRET: 如果使用twitter,则需要从配置的twitter应用程序中获取这些信息。

示例

以下是使用Helga Markovify的不同方法。大多数是 摄取/学习数据的不同方式。

网址

!markovify ingest zen url https://hg.python.org/peps/raw-file/tip/pep-0020.txt
!markovify generate zen
helga> Sparse is better than ugly.

文本

!markovify ingest hitler text "Mein Kampf is the best Kampf."
!markovify ingest hitler text "Don't be stupid, be a smarty. Come and join the nazi party."
!markovify ingest hitler text "Make America hate again."
!markovify ingest hitler text "Kampf America is hate nazi smarty. Hate party again filler sentence. America is the best at being terrible."
!markovify generate hitler
helga> Mein Kampf is the best at being terrible.

粘贴

!markovify ingest zen dpaste http://dpaste.com/1JF2P4S
!markovify generate zen
helga> If the implementation is hard to explain, it may be a good idea.

推特

!markovify ingest narf twitter narfman0
!markovify generate narf
helga> You won't believe this one weird trick to get the target populace hooked.
!markovify generate narf
helga> FOSS: it only takes one highly incentivized dealer to get 4057$ a month doing nothing!

通道日志

!markovify ingest channel logs --channel #bots --start_date 1999-01-01
!markovify generate channel
helga> dropbox serving it does ASAP

helga, thoughts?
helga> it could be a crackhead, who wants to haskell bees

删除语料库

如果你不知怎么搞砸或弄坏了一个语料库,你可能会完全放弃它:

!markovify drop zen

待办事项

  • 特拉维斯
  • 谈论特定主题
  • 保留历史记录,也称为对话
  • 加权循环式对话

许可证

版权所有(c)2016 Jon Robison

有关许可信息,请参见附带的许可证

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java为游戏添加声音。需要帮助   java在获取数据时忽略模型类中的forign键映射   java为什么Microsoft JDBC驱动程序忽略failoverPartner主机名   java可以下载mozswing文件   java等价于ObjectOutputStream,不仅保存其状态,还保存整个对象?   Java Android LiveData根据其他LiveData调用房间查询   java如何使用jackson jsonNode实现这一点并获得所需的输出   在web服务器上作为web应用程序运行java应用程序?   groovy中java类的元类属性   返回空指针的java图形对象   标头中包含用户名和密码的java SOAP客户端请求   具有堆栈实现和递归的Hanoi算法塔(Java)   java当我运行这两个类时,我的老鼠不会移动   使用图像进行java相似图像搜索   Java8并行流机制   使用单例对象作为枚举元素的java Scala枚举,是否有可能对它们进行迭代?   java Webview更改高度大小   不可序列化对象和函数的java Spark Scala编程   java my app在eclipse中运行良好,而不是在jar中