艺术文本生成的python库

olip的Python项目详细描述


#olipy

olipy是一个用于生成艺术文本的python库。与大多数
软件包不同,它们有一个统一的目的。奥利皮更像是一套艺术用品。每个模块都是为了帮助您实现不同的美学效果而设计的。

以下是如何从命令行快速开始的方法:

```
例如脚本。
olipy.apollo
```

textblob作为依赖项,但是"textblob"有额外的依赖项(文本语料库),而
不是由"pip"安装的。安装额外依赖项的说明位于"textblob"站点上,但它们可以归结为运行
[此python
脚本](https://raw.github.com/sloria/textblob/master/download\u corpora.py)。

有趣的是
数据和算法。您可以在安装了"olipy"软件包的虚拟环境中运行这些脚本。

*"olipy.apollo":生成宇航员与任务控制之间的对话。在对话中演示queneau程序集。
*`olipy.board_games`:生成棋盘游戏名称和
描述。演示复杂的queneau程序集。
*`olipy.corrupt`"通过添加
递增的变音符号来破坏"键入的任何文本。演示
`gibbrish.corrupter`类。
*`olipy.dinoros`:生成恐龙名称。演示单词部分上的queneau
程序集。
*`olipy.ebooks`:使用
电子书算法从公共域文本中选择一些行。演示
`olipy.gutenberg.projectgutenbergext`
和`olipy.ebooks.ebooksquotes`类。
*`olipy.gibberish`:打印出140个字符串,这些字符串在美观上
令人满意(?)胡言乱语。演示"gibbrish.gibbrish"类。
*"olipy.mashteroids":为较小的
行星生成名称和IAU引用。在句子中演示queneau汇编。
*`olipy.sonnet`:使用queneau汇编生成莎士比亚十四行诗。
*`olipy.typewriter`:重新键入键入的内容,并添加键入类型。
*`olipy.words`:生成外观普通且晦涩难懂的英语单词。

#《模块指南》模块指南


《alphabet.py


unicode字符(字母表、形状等)的有趣组列表。从olipy.alphabet导入alphabet
《打印(alphabet.default().random\choice())
《从olipy.alphabet导入alphabet
《从alphabet.alphabet.default().random\choice())
《从olipy.alphabet导入alphabet打印(alphabet.default().random.random\choice())

《从olipy.alphaphabet.alphabet.alphabet.alpha买乱乲乳?ℜ???????ℨ??????????????????????????
print(Alphabet.default().random_choice())
# ┌┐└┘├┤┬┴┼═║╒╓╔╕╖╗╘╙╚╛╜╝╞╟╠╡╢╣╤╥╦╧╨____
`````


这个模块被gibbrish.py大量使用。


这个模块使从Darius
Kazemi的[语料库项目](https://github.com/dariusk/corpora)加载数据集变得很容易,同时也可以加载特定于olipy--mo的附加数据集超大单词
列出了语料库项目认为超出范围的单词。(这些新的
数据集将在本文档末尾讨论。)

项目的完整数据副本打包在一起,因此您不必安装任何额外的数据集。但是,
以其他方式安装corpora项目数据可以为您提供自更新olipy包以来创建的数据集。


corpora模块的接口是allison parrish的
[`pycorpora`]项目(https://github.com/aparrish/pycorpora/)使用的接口。
数据集显示为包含python数据的python模块
结构:

```
来自Olipy Import Corpora
用于Corpora.Geography.Large嫒u Cities["Cities"]:
打印(City)
akron
albequerque
Anchorage
·································要导入特定的语料库,请从olipy导入项目类别:

```
从olipy导入政府
打印(政府.nsa_projects["codenames"][0]打印"技巧")


从olipy导入人类
打印(人类.职业["职业"][0]打印"会计")
```

此外,corpora支持类似于corpora项目节点包提供的api:

````
from olipy import corpora

特定类别
corpora.get_u categories("words")["literature","word_u sidelines"…]


/>corpora.get_file("anims","birds戋orctica")返回dict w/data

er.com/horse_电子书](@horse_电子书)。基于Allison的
[https://twitter.com/zzt_ebooks](@zzt_ebooks)算法
parrish.

`````
从olipy.ebooks导入电子书]):
print(quote)
他们以各种方式攻击他——光着脸邀请他共进晚餐
班纳特夫人
························你可以把它作为命令行参数。


它的主要用途是使用选定的Unicode代码图表组合生成美观的乱字



```````
frofroolipy.gibberish impimport乱字
prinprint(gibberish.random().tweet().encode("utf8")
prinprint(gibberish.random().tweet().tweet().tweet().encode("utf8")
prinprinprinprint(gibbrish.random.random().tweet().tweet().encode(utf8.utf8)prinprinprinprint(prinprinprint(gibberish.grabbrish.randosh.gra__৯ৰ৪ড়ঐবননত৲ফঌ?৴ৄু০েএঠৰ??গনি৶ঘ?উঙ?ঙছতাৃীফ৮৬৸উকফ?ইমঢ৭ূণঌঊ??ীঁিৃ??৺?৺ভ?৭?ৡৰল?ঢ়ৎ?যথখৱঌ
# ঈঔ৫ঽ?৩়দ復復復復復復復復復復復復復復復復復復復復復復復復憓处理来自古登堡计划的文本的模块。去除页眉和页脚,并分析文本。

````
来自olipy import corpora
来自olipy.gutenberg import projectgutenbergtext
text=corpora.words.literary.nonfication.literal戋singes['text']
text=projectgutenbergtext(text)
打印(len(text.parages))
1258
```

iA.py

处理来自Internet存档的文本的模块。

````
从olipy.ia导入random
导入文本

为iA集合中的特定标题打印到Web阅读器的URL。
item=text("YorkChronicle1946poqu")
打印(item.reader_url(10))
https://archive.org/details/yorkchronicle1946poqu/page/n10

从特定标题中选择一个随机页面,并打印一个URL到该页面的可重复使用图像。
identifier="tnm戋u radio戋u catalog戋u fall戋u winter戋u h戋u 20180117戋u 0150"
item=text(identifier)
page=random.randint(0,item.pages-1)
打印(item.image_url(page,scale=8))
https://ia600106.us.archive.org/bookreader/bookreaderimages.php?ZIP=/30/items/tnm_收音机设备/tnm_收音机设备/tnm_收音机设备/tnm_收音机设备/tnm_收音机设备/tnm_收音机设备/tnm_收音机设备/u收音机设备/tnm_收音机设备/tnm_收音机设备/tnm_收音机设备/tnm_收音机设备/tnm_收音机设备/tnm_收音机设备/u收音机设备/u收音机设备/tnm_收音机设备/tnm_收音机设备/tnm_收音机设备/tnm_收音机设备/tnm_收音机设备/tnm_收音机设备/tnm_收音机设备/tnm_收音机设备/tnm_收音机设备/tnm_收音机设备/tnm_收音机设备/tnm收音机设备/u收音机设备/u收音机设备U形下降__ Winter_1963_-20180117_0150_0007.jp2&;scale=8
```

letterforms."))
# ヱ ??Ⓥ? ??┯⒠┌?a⫪? ??ߙ?ᥱ?ߓ?┍ጠ?.
```

## markov.py

A module for generating new token lists from old token lists using a
Markov chain.

Olipy's primary purpose is to promote alternatives to
Markov chains (such as Queneau assembly and电子书算法),
但有时你真的需要一个马尔可夫链。queneau汇编通常比单词级以上(从句子中构造
段落)和单词级以下(从音素中构造
单词)的markov链要好,但是,当
组合单词序列时,markov链通常更好。


markov.py最初是由allison"a.a."parrish编写的。


````
max=100)
g.add(文本)
print(".join(g.assemble())
Project Gutenberg TM商标。你能这样吗,恩,你自己的积蓄,就像花园,俱乐部一样。争吵发生在他和茶几上的论文之间。在羔羊节,对于一个流浪者的遗物或四年前的遗物,只有亚当和海盗带着。在他家里写他新买的紫色衣服和那个年轻人,你可能对圣诞体育和艺术没有什么严肃的意义,而不是提及"心脏"——允许——但我出去了,而且更方便……mr.
```

mosaic.py


将Unicode字符拼成对称的马赛克。
gibberish.py使用此模块作为其技术之一。Includes
information on Unicode characters whose glyphs appear to be mirror
images.

```
from olipy.mosaic import MirroredMosaicGibberish
mosaic = MirroredMosaicGibberish()
print(mosaic.tweet())
# ▛▞ ▙▞▙▟▚▟ ▚▜
# ▛▞▞ ▞▛▜▚ ▚▚▜
#  ▞▙  ▞▚  ▟▚ 
# ▙▚▚ ▚▙▟▞ ▞▞▟
# ▙▚ ▛▚▛▜▞▜ ▞▟

print(gibberish.tweet())
# ????????????
#  ?????????? 
# ????????????
#  ?????????? 
# ????????????

```

## queneau.py

A module for Queneau assembly, a technique pioneered by Raymond
Queneau in his 1961 book "Cent mille milliards de poèmes" ("One
hundred million million poems"). queneau assembly从具有相同结构的现有文本集合中随机创建新的文本。

```
##随机性。py

并向靠近结尾的另一组选项加权。


这里有一个从小写字母到大写字母的渐变:

````
从olipy.randominess import gradient
import string
print("."join(gradient.gradient(string.lowercase,string.uppercase,(40))
rkwyobijqqozkfdcshihyingrqkbrddewphytorb
`````

``WanderingMonsterTable`

`WanderingMonsterTable`类允许您从四个桶中的一个进行加权随机选择。从"common"bucket中随机选择将显示65%的时间,从"uncomment"bucket中选择将显示20%的时间,从"稀有"bucket中选择将显示11%的时间,从"非常稀有"bucket中选择将显示4%的时间。时间。(它使用的概率与第一版《高级地牢与龙》相同。)

`````
非常罕见=["flumph","ygorl,熵之王"],



for i in range(5):
>print monsters.choice()
>```
从nltk.tokenize.treebank导入TreebankWordTokenizer
s=''好的松饼在纽约要花3.88美元。电子邮件:muffins@example.com''
treebankwordtokenizer().tokenize
['good'、'muffins'、'cost'、'$'、'3.88'、'in'、'new'、'york'、'email'、':'、'muffins'、'@'、'example.com']
wordtokenizer().tokenize
['good'、'muffins'、'cost'、'$'、'3.88'、'in'、'new'、'york'、'email:','muffins@example.com']
```

typewriter.py
----

最初是为[@a_dull_bot]编写的(https://botsin.space/@adullbot)。

`````
来自olipy.typewriter import typewriter
typewriter=typewriter()
typewriter.type("只工作不玩耍,聪明的孩子变傻。")
"只工作不玩耍,聪明的孩子变傻。"
`````

几个单词列表和数据集不在
语料库项目中。这些数据集(以及标准语料库
项目数据集)可以通过"语料库"模块访问。写这样的代码:


````
/>
美国五十个州。

###`语料库.language.languages`

iso-639-1中定义的语言名称

\corpora.language.unicode代码表`


截至2013年7月,命名小行星的"编号"和IAU"引文"。"发现"字段包含
发现环境。"建议作者"字段(如果存在)已从原始IAU引文的末尾以简单的启发式方式分离出来。然后,使用nltk的punkt标记器和一组自定义缩写,将"引文"字段标记成句子。


数据源:
http://www.minorplanetcenter.net/iau/lists/numberedmps.html
http://ssd.jpl.nasa.gov/sbdb.cgi


仅列出前1000个小行星的名称。


大致按出现频率排序。


包括:

*`抽象名词'如"工作"和"爱情"
*`具体名词'如"脸"和"房子"
*`形容词名词'--也可以用作形容词的名词--如"机会"和"光明"

`语料库.单词.常用动词`

大致按出现频率排序。

*`现在时'动词,如"get"和"want"。
*`过去时'动词,如"said"和"found"。
*`动名词'形式,如"holding"和"leaving"。

他参与了一个项目。(http://www.nkuitse.com/freli/)

与往常一样,这个列表的前面有更常见的单词。


每行一个json对象。

数据源:
http://boardgamegeek.com/wiki/page/bgg_xml_api2



迭代。非虚构。阿波罗11号登月任务的记录,以对话形式呈现,用nltk的punkt标记器标记成句子。每行一个json对象。

数据源:
阿波罗11号飞行日志:http://history.nasa.gov/ap11fj/
阿波罗11号表面日志:http://history.nasa.gov/alsj/
"旨在成为所有对阿波罗计划感兴趣的人的资源,无论是过路人还是学者。"ly capacity."

-Style(2007年以前)将Gutenberg项目文件名转换为新样式的电子书ID。例如,"/etext95/3boat10.zip"被映射到
308号(参见http://www.gutenberg.org/ebooks/308)。几乎没有人需要这个。

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
安卓如何在java字符串中获取RATE的值   java ANT在哪里输出编译器错误?   在java中,while循环在何处启动对象   javacom。谷歌。格森。内部的LinkedTreeMap无法强制转换到我的类   java单选按钮。isSelected()方法未返回正确的响应   嵌入式系统中applet中的java相对码基字段   如何在eclipse中将Java应用程序附加到jvm探查器?   java为什么Android应用程序崩溃?   在java中拖放上传后保持文件夹结构   爪哇多领导人选举问题   java Springs RestTemplate如何处理postForEntity()中的错误响应   Java如何用前导零递增整数字符串?   java Android将文本作为图像共享给其他应用程序   Java搜索替换   java isDirectory()不适用于UNIX目录   java我们可以得到显示测试类是否通过或失败的TestNG报告吗   Java类对象排序和分组   简单Java幂递归   java在处理MethodArgumentNotValidException时如何访问请求对象?