在python中获取到标记之间的字符串

网友

1楼 · 编辑于 2024-06-03 02:02:00

我建议您阅读文本文件，然后使用（'，'）将其拆分为一个列表。您可以使用循环遍历元素

制作另一个列表以保存新提取的元素

extracted= []
for rawstring in list:
    for character in rawstring:
        if character == 'firstmarker':
            index1 = rawstring.index(character)
        elif character == 'secondmarker':
            index2 = rawstring.index(character) 
    extracted.append(rawstring[index1+1:index2])

现在，您将拥有提取列表中的所有内容用两个记号笔代替“第一个记号笔”和“第二个记号笔”

网友

2楼 · 编辑于 2024-06-03 02:02:00

您可以使用正则表达式获取所需的数据，如下所示

import re

source = '*rdfs:label         "Henry Dunant"@de , "Henry Dunant"@en , "Henri Dunant"@fr ;*'
match = re.search(r'"[\w ]+"@en', source).group()
print(match)

有关python中正则表达式的更多信息，请参阅re documentation

网友

3楼 · 编辑于 2024-06-03 02:02:00

如果您只想得到一个单词，可以尝试以下代码：

str_text = "rdfs:label         \"Henry Dunant\"@de , \"Henry Dunant\"@en , \"Henri Dunant\"@fr ;"
splitted_text = str_text.split("\"")
word = ""
for ind, fragment in enumerate(splitted_text):
    if fragment[:3]=="@en":
        word=splitted_text[ind-1]
print(word)

结果:

Henry Dunant

相关问题更多 >

编程相关推荐

热门问题

热门文章

在python中获取到标记之间的字符串

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >