摄取文本并输出由马尔可夫链生成的句子
helga-markovif的Python项目详细描述
摄取文本的小体并输出由马尔可夫链生成的句子。 赫尔加现在会监听你的irc频道,并在途中接收对话, 学会说你的行话。你可以从“日志”摄取开始,或者 任何其他摄入技术。
安装
安装和配置helga后,请使用:
pip install helga-markovify
将markovify添加到您的设置并重新启动helga。要使用Twitter时间线, 您还必须将以下内容添加到设置(使用凭据):
TWITTER_CONSUMER_KEY = 'asad' TWITTER_CONSUMER_SECRET = 'sdfs' TWITTER_ACCESS_TOKEN = 'fghf' TWITTER_ACCESS_SECRET = 'ghjg'
用法
注意:请在文本中使用标点符号。这是个棘手的问题 练习,但是区分句子是很重要的。
命令语法:
ingest <topic> <learning_type> <learning_type_source> generate <topic> drop <topic>
参数
topic:类似于标记,因此helga可以以不同的方式响应
learning_type:赫尔加将如何摄取。可以是文本,原始数据的url, 指向dpaste的url或twitter帐户。
learning_type_source:对应的数据,例如,如果学习类型是明文 是“文本”,url是“url”,twitter屏幕名是“twitter”,helga_日志阅读器 “logs”的参数(建议您变老并使用当前频道)
ingest命令从引用的 语料库.你可以从任何来源教机器人,它可以是twitter或者 文本。混合搭配很好。
generate命令从语料库生成一个句子。
drop命令从存储中删除特定主题。如果一个语料库变成 由于任何原因损坏,用户可能会丢弃它并重新摄取数据以填充 又来了。
设置
MARKOVIFY_ADD_PUNCTUATION:是否应该在行后添加句点。你总是 想要好的标点符号来表示好的句子,这是一个相当安全的“真的” 默认情况下。
MARKOVIFY_CHANNEL_LISTEN:接收当前频道抖动。有点贵, 可能不是很好的隐私问题,但那是lol火车到达的地方。
MARKOVIFY_CHANNEL_GENERATE:regex helga侦听生成的响应 默认频道颤音
MARKOVIFY_TOPIC_DEFAULT:频道数据的默认摄取主题
TWITTER_CONSUMER_KEY TWITTER_CONSUMER_SECRET TWITTER_ACCESS_TOKEN TWITTER_ACCESS_SECRET: 如果使用twitter,则需要从配置的twitter应用程序中获取这些信息。
示例
以下是使用Helga Markovify的不同方法。大多数是 摄取/学习数据的不同方式。
网址
!markovify ingest zen url https://hg.python.org/peps/raw-file/tip/pep-0020.txt !markovify generate zen helga> Sparse is better than ugly.
文本
!markovify ingest hitler text "Mein Kampf is the best Kampf." !markovify ingest hitler text "Don't be stupid, be a smarty. Come and join the nazi party." !markovify ingest hitler text "Make America hate again." !markovify ingest hitler text "Kampf America is hate nazi smarty. Hate party again filler sentence. America is the best at being terrible." !markovify generate hitler helga> Mein Kampf is the best at being terrible.
粘贴
!markovify ingest zen dpaste http://dpaste.com/1JF2P4S !markovify generate zen helga> If the implementation is hard to explain, it may be a good idea.
推特
!markovify ingest narf twitter narfman0 !markovify generate narf helga> You won't believe this one weird trick to get the target populace hooked. !markovify generate narf helga> FOSS: it only takes one highly incentivized dealer to get 4057$ a month doing nothing!
通道日志
!markovify ingest channel logs --channel #bots --start_date 1999-01-01 !markovify generate channel helga> dropbox serving it does ASAP helga, thoughts? helga> it could be a crackhead, who wants to haskell bees
删除语料库
如果你不知怎么搞砸或弄坏了一个语料库,你可能会完全放弃它:
!markovify drop zen
待办事项
- 特拉维斯
- 谈论特定主题
- 保留历史记录,也称为对话
- 加权循环式对话
许可证
版权所有(c)2016 Jon Robison
有关许可信息,请参见附带的许可证