python中个人词典中命名实体的识别

2024-10-01 22:30:02 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个很大的数据库,里面有很多条目(大部分是电影),只有描述作为信息。ID为1的条目的描述(例如)可以是:

'Forrest Gump is a 1994 American epic romantic-comedy-drama film based on the 1986 novel of the same name by Winston Groom. The film was directed by Robert Zemeckis and stars Tom Hanks, Robin Wright, Gary Sinise, Mykelti Williamson, and Sally Field.'

现在我还有一些基本上是字典的txt文档,其结构如下:

actors.txt

Mickey Mouse
Tom Hanks
...

directors.txt

Donald Duck
Robert Zemeckis
...

我想做的是分析每个条目的描述并从字典中解析命名实体。所以如果文本包含'Tom Hanks',我想识别ID为1的条目中有Tom Hanks作为演员,以此类推。输出应该是这样的:

^{pr2}$

或者任何易于操作的格式。在


Tags: andthe目的txtid数据库by字典
1条回答
网友
1楼 · 发布于 2024-10-01 22:30:02

您所要做的就是使用SOLR,在它的模式中设置一些新的字段类型(如text_actors),这些字段类型链接到适当的字典,编写适当的模式,然后导入数据库。据我所知,这可以帮助您开发一个可搜索的数据库,您可以从中查询所有结果并填充您自己的数据库。在

相关问题 更多 >

    热门问题