标记列表列表

1条回答

网友

1楼 · 发布于 2024-10-01 15:37:47

您将数组传递给word_tokenize函数，它期望string or bytes-like object。如果你用绳子喂它，它会工作的。简单的例子。在

purex_words = [['I miss having someone to talk to all night..'], ['Pergunte-me qualquer coisa'],

['RT@Caracolinhos13:Tenho a tl cheia dessa merda de quem vos visitou nas\xc3\xbaltimas horas']，['RT@B24pt:#carloshaddeam']，[“Tudo tem um fim”]， [“RT@thechgama:stalkear as curtidas\xc3\xa9 um caminho sem volta”]，['Como consegues fumar 3 purexs seguidas？\xe2\x80\x94 Eram 2 purex e混合物…']]

^{pr2}$

你可以先把单子弄平再把句子循环起来。注意，我在您的列表中添加了一个外部[]。在

flat_list = [item for sublist in purex_words for item in sublist]
for sentence in flat_list:
    print(word_tokenize(sentence))

结果是这样的。在

['I', 'miss', 'having', 'someone', 'to', 'talk', 'to', 'all', 'night..']
['Pergunte-me', 'qualquer', 'coisa']
['RT', '@', 'Caracolinhos13', ':', 'Tenho', 'a', 'tl', 'cheia', 'dessa', 'merda', 'de', 'quem', 'vos', 'visitou', 'nas', '\\xc3\\xbaltimas', 'horas']
['RT', '@', 'B24pt', ':', '#', 'CarlosHadADream']
['Tudo', 'tem', 'um', 'fim']
['RT', '@', 'thechgama', ':', 'stalkear', 'as', 'curtidas', '\\xc3\\xa9', 'um', 'caminho', 'sem', 'volta']
['Como', 'consegues', 'fumar', '3', 'purexs', 'seguidas', '?', '\\xe2\\x80\\x94', 'Eram', '2', 'purex', 'e', 'mix', '...']

相关问题更多 >

编程相关推荐

热门问题

热门文章

标记列表列表

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >