(初学者到)NLP:我正在尝试理解如何对文本中的单词进行分类,以识别与主题相关的所有单词

2024-05-19 09:14:30 发布

您现在位置:Python中文网/ 问答频道 /正文

我用BeautifulSoup浏览了一个网站,现在我想分析所有我浏览过的文本,并创建一个长长的列表,列出出现在该文本中的食物

示例文本

如果你是一个素食主义者,并且永远为你不能吃馄饨而哀叹,那么这些家伙就是为你准备的!馅料是用硬豆腐屑简单混合而成,用盐、姜、白胡椒和葱调味。它非常简单,但是很令人满意。 一定要把豆腐沥干,尽可能地把它晾干,这样馅料就不会太湿了。你甚至可以更进一步,给它一个新闻:线与纸巾盘子,把一些纸巾放在上面,并称豆腐下来与另一个盘子。 这些馄饨最好的地方是馅料完全煮熟了,所以你可以通过品尝来调整调味料。只要确保馅料比你自己吃的要咸一点就行了。馄饨皮的调味料不多。 这些家伙一闪而过,因为你所做的就是做馄饨皮。一旦你把它们放入沸水中,它们浮到水面上,你就可以走了。把他们扔进辣味的酱油醋调料里,你就上天堂了

我想从中创建一个长列表,其中列出: 馄饨、豆腐、醋、白胡椒、洋葱、盐

我不知道如果没有现成的食物清单我怎么能做到这一点。因此,任何建议都是很好的。寻找一些可以做到这一点,没有太多的手动干预自动(我对NLP和深度学习非常陌生,因此您推荐的任何文章/方法都非常有用!)

谢谢


Tags: 文本示例列表网站食物家伙豆腐beautifulsoup

热门问题