从列表中删除以某些表达式开头的字符串问题的回答

从列表中删除以某些表达式开头的字符串

回答此问题可获得 20 贡献值，回答如果被采纳可获得 50 分。

我有一个与twitter标签相关联的字符串列表。我想删除以某些前缀开头的整个字符串。你知道吗 例如： <pre><code>testlist = ['Just caught up with #FlirtyDancing. Just so cute! Loved it. ', 'After work drinks with this one @MrLukeBenjamin no dancing tonight though @flirtydancing @AshleyBanjo #FlirtyDancing pic.twitter.com/GJpRUZxUe8', 'Only just catching up and @AshleyBanjo you are gorgeous #FlirtyDancing', 'Loved working on this. Always a pleasure getting to assist the wonderful @kendrahorsburgh on @ashleybanjogram wonderful new show !! #flirtydancing pic.twitter.com/URMjUcgmyi', 'Just watching #FlirtyDancing & \n@AshleyBanjo what an amazing way to meet someone.. It made my heart all warm & fuzzy for these people! both couples meet back up.. pic.twitter.com/iwCLRmAi5n',] </code></pre> 我想删除图片URL、标签和@ 到目前为止，我已经尝试了一些方法，即使用<code>startswith()</code>方法和<code>replace()</code>方法。你知道吗 例如： <pre><code>prefixes = ['pic.twitter.com', '#', '@'] bestlist = [] for line in testlist: for word in prefixes: line = line.replace(word,"") bestlist.append(line) </code></pre> 这似乎摆脱了pic.twitter.com，但不是URL末尾的一系列字母和数字。这些字符串是动态的，每次都有一个不同的结束URL…这就是为什么如果它们以那个前缀开头，我想去掉整个字符串。你知道吗 我也尝试过标记所有内容，但是<code>replace()</code>仍然无法摆脱整个单词： <pre><code>import nltk for line in testlist: tokens = nltk.tokenize.word_tokenize(line) for token in tokens: for word in prefixes: if token.startswith(word): token = token.replace(word,"") print(token) </code></pre> 我开始对<code>startswith()</code>方法和<code>replace()</code>方法失去希望，我觉得用这两种方法我可能找错了方向。你知道吗 有没有更好的办法？如何删除以#、@、和开头的所有字符串图：推特？你知道吗

0 条评论
分类：Python问答

默认排序时间排序

1 个回答

匿名 1天前

　擅长：python、mysql、java

从列表中删除以某些表达式开头的字符串

1 个回答

相关Python问题