Python - 基于关键词和相关ID尝试对文章进行分类

2024-06-16 15:41:56 发布

您现在位置:Python中文网/ 问答频道 /正文

我试图根据包含以下两列的db表对文章进行分类:

id   keywords
1    cat, kitten, tiger
2    dog, puppy, jackal

如果我有一篇文章,我如何确定哪些关键字出现在其中,因此我需要使用哪个id来对文章进行分类?我的代码如下:

cur.execute("SELECT keywords, id FROM Keywords")
keywords = cur.fetchall()
keywords = [k[0] for k in keywords]
if any(word in article for word in keywords):
    matched = [word for word in keywords if word in article]
    print("Matched keywords: %s" % ', '.join(matched))

Tags: inidfordbifarticle文章分类
1条回答
网友
1楼 · 发布于 2024-06-16 15:41:56

如果关键字是以逗号分隔的关键字列表,则需要拆分该字符串。尝试以下操作:

cur.execute("SELECT keywords, id FROM Keywords")
result = cur.fetchall()
keywords = []
for row in result:
    keywords += row[0].split(',')
if any(word in article for word in keywords):
    matched = [word for word in keywords if word in article]
    print("Matched keywords: %s" % ', '.join(matched))

相关问题 更多 >