我试图根据包含以下两列的db表对文章进行分类:
id keywords
1 cat, kitten, tiger
2 dog, puppy, jackal
如果我有一篇文章,我如何确定哪些关键字出现在其中,因此我需要使用哪个id来对文章进行分类?我的代码如下:
cur.execute("SELECT keywords, id FROM Keywords")
keywords = cur.fetchall()
keywords = [k[0] for k in keywords]
if any(word in article for word in keywords):
matched = [word for word in keywords if word in article]
print("Matched keywords: %s" % ', '.join(matched))
如果关键字是以逗号分隔的关键字列表,则需要拆分该字符串。尝试以下操作:
相关问题 更多 >
编程相关推荐