将一个字符串分成主谓和宾语的三元组(三个字段的元组)。

2024-10-03 09:09:51 发布

您现在位置:Python中文网/ 问答频道 /正文

例如:

示例RDF字符串。在

lt;Tom_Wilkinson(男演员)>;lt;actedIn>;“在_ _卧室的卧室”,“爱国者(2000年电影)”,“黑色骑士(电影)”,“最后一个吻的最后一个吻”,“卡桑德拉斯的梦想梦想”;<;bornOnDate>;“1948-12-12-12”;<;isCalled>;“汤姆·威尔金森(Schauspieler)”,“汤姆威尔金森(Schauspieler)”,“经用的,用的都是通过的,用的是通过的,用的是通过的方式,用的是用的方式,用的是”的方式,用的是用的方式,用的方式,用的方式,用的方式,用的方式,用的方式,用的方式,用的,用1493ן,“トム・ウィルキンソン”,“汤姆·威尔金森”,"ום וילקינסון" , "ム・ウィルキンソン"; . 在

给定字符串的三元组-

<Tom_Wilkinson_(actor)> <actedIn> "In_the_Bedroom"     
<Tom_Wilkinson_(actor)> <actedIn> "The_Patriot_(2000_film)" 
<Tom_Wilkinson_(actor)> <actedIn> "Black_Knight_(film)" 
<Tom_Wilkinson_(actor)> <actedIn> "The_Last_Kiss" 
<Tom_Wilkinson_(actor)> <actedIn> "Cassandras_Dream"
<Tom_Wilkinson_(actor)> <bornOnDate> "1948-12-12"
<Tom_Wilkinson_(actor)> <isCalled> "Tom Wilkinson (Schauspieler)"

注意-对象之间可以有空格。比如说“汤姆·威尔金森(Schauspieler)”是一个包含空格的物体。在


Tags: the字符串ltgt电影方式actortom
2条回答

尝试使用RDFLib。 看起来他们有examples on parsing ntriples

编辑:格式实际上是n3。参见parse()上的these docs

您提供的输入实际上是一些RDF的Turtle(或N3)序列化。它的格式通常如下所示,并指定了一些@base

@base <http://stackoverflow.com/q/23192184/1281433> .

<Tom_Wilkinson_(actor)> <actedIn> "In_the_Bedroom" , "The_Patriot_(2000_film)" ,
                                  "Black_Knight_(film)" , "The_Last_Kiss" ,
                                  "Cassandras_Dream";
                        <bornOnDate> "1948-12-12";
                        <isCalled> "Tom Wilkinson (Schauspieler)" ,
                                   "טום וילקינסון" , "トム・ウィルキンソン" ,
                                   "Tom Wilkinson" , "ום וילקינסון" ,
                                   "ム・ウィルキンソン" .

如果添加适当的@base声明,那么就可以使用任何可以读取Turtle并以N-Triples形式序列化的库来读取输入和写入输出。例如,使用Jena的^{}可以转换为许多不同的格式,包括N-Triples:

^{pr2}$ ^{3}$

因为您用Python标记了它,您可能会发现RDFlib比Jena更有用,但这里真正的问题应该是如何进行转换,而不是库请求(因为库请求与堆栈溢出无关)。在

相关问题 更多 >