如何标记fi中的一行文本

2024-10-02 04:20:55 发布

您现在位置:Python中文网/ 问答频道 /正文

假设文件莎士比亚.txt包含单行线。朱丽叶在《罗密欧》和 朱丽叶: “哦,罗密欧,罗密欧!你为什么是罗密欧?”在

然后运行命令$ shakesort将产生以下输出

art
o
romeo
thou
wherefore

目前我的代码:

^{pr2}$

我的问题是它返回整个文件的前7个字符串,而不是指定的令牌。我该怎么从完整的那7个词中指定出来呢莎士比亚.txt(包含数百万个单词)而不创建一个新文件并列出这些单词?在


Tags: 文件字符串代码命令txt单词artpr2
1条回答
网友
1楼 · 发布于 2024-10-02 04:20:55

像这样:

    uniqwords = {}
    with open('shakespeare.txt') as f:
        for ln in f:
            words = ln.split()
            for word in words:
                word = word.replace('?', '').replace('!', '').replace(',', '').lower()
                uniqwords.setdefault(word, 0)

    for word in sorted(uniqwords.keys()):
        print word

相关问题 更多 >

    热门问题