如何创建在不同句子中提取的标记列表?

2024-09-29 23:18:55 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个函数,它返回元素列表和列表中每个元素的len。我使用这个函数来提取我过去列表中的元素,这些元素存在于词典中

我面临的问题是,下面的脚本返回一个元素列表中存在的所有单词的列表,但我想返回一个单词列表,这些单词在我过去列表中的每个elt的词典中都存在。因此,我将有一个列表,这些列表将只包含出现在我的字典中的每个特定元素的单词,而不是所有元素的一个大集合

我的脚本如下,我尝试了两件事:列表理解和循环,但这两种解决方案总是打印出所有单词的列表,而不是单词列表:

def polarity_word(texte, listpos, listneg):

    lemme_sent, len_sent = lemmatisation(texte) # list of element(sentences lemmatized) 
    list_pos = []
    list_neg = []
    intersection = [w for w in listpos for elt in lemme_sent if w in elt ]
    
    #other way
    for elt in lemme_sent:
        for w in elt.split():
            if w in listpos:
                list_pos.append([w])
    
    # test data:
    lemme_sent =[ 'je vie manger et boire', 'je être bel et lui très beau']
    len_sent = [5, 7]
    list_pos = ['luire','manger','vie','soleil','boire', 'demain', 'soir', 'bel', 'temps', 'beau']
    
    print(intersection) 

预期答案

[['vie', 'manger','boire'],['bel', 'beau']]

相反,我有

[vie, manger','boire','bel','beau']

Tags: in元素列表forlen单词listsent

热门问题