查找字符串中特定单词的位置

doc = tree.getroot() for ArticleTitle in doc.iter('ArticleTitle'): file1 = (ET.tostring(ArticleTitle, encoding='utf8').decode('utf8')) filename = file1[52:(len(file1))] Article= filename.split("<")[0] # print(Article) # print(type(Article)) title= Article.split() gene_list = ["ABCD1","ADA","ALDOB","APC","ARSB","ATAD3B","AXIN2","BLM","BMPR1A","BRAF","BRCA1"] for item in title: for item1 in gene_list: if item == item1: str_title= ' '.join(title) print(str_title) print("Gene Found: " + item) index= title.index(item) print("Index of the Gene :" +str(index)) result = 0 for char in str_title: result +=1 print(result)

2条回答

网友

1楼 · 编辑于 2024-09-30 05:20:58

我可以用正则表达式

l=["ABCD1","ADA","ALDOB","APC","ARSB"]
l='|'.join(l)
test_string='Healthy people 2000: a call to action for ADA members.'
pos=0
for i in test_string.split():
    m=re.search(l,i)
    if m:
        gene=m.group(0)
        start=test_string.find(gene)
        end=start+len(gene)
        print(start,end,gene,pos)
    pos+=1

输出

(42, 45, 'ADA', 8)

在字符串中没有实际位置的较短解可以是

l=["ABCD1","ADA","ALDOB","APC","ARSB"]
l='|'.join(l)
test_string='Healthy people 2000: a call to action for ADA members.'

[(m.start(),m.group(0),m.end()) for m in re.finditer(l,test_string)]

网友

2楼 · 编辑于 2024-09-30 05:20:58

我们也可以使用Flashtext

from flashtext import KeywordProcessor

kpo = KeywordProcessor(case_sensitive=True)

gene_list = ["ABCD1","ADA","ALDOB","APC","ARSB","ATAD3B","AXIN2","BLM","BMPR1A","BRAF","BRCA1"] 

for word in gene_list:
    kpo.add_keyword(word)

kpo.extract_keywords("Healthy people 2000: a call to action for ADA members.",span_info=True)
#o/p  > [('ADA', 42, 45)]

相关问题更多 >

编程相关推荐

热门问题

热门文章