如何在文本文件中多次出现的某些单词后提取3000个字符？

import os sourcepath=os.listdir('try/') for filename in sourcepath: inputfile='try/'+filename with open(inputfile, 'r') as f: text=f.read() index=text.index('Accounting Principles') right=text[index: index+3000] print(right) import os sourcepath=os.listdir('try/') for filename in sourcepath: inputfile='try/'+filename with open(inputfile, 'r') as f: text=f.read() index=text.index('IFRS') right=text[index: index+3000] print(right)

2条回答

网友

1楼 · 编辑于 2024-06-01 13:28:06

您可以使用re.sub在"Accounting Principles"或"IFRS"的任何位置创建一个标记，然后遍历整个\u字符串

marked_data = re.sub('Accounting\sPrinciples|IFRS', '*', open('filename.txt').read())
new_data = [marked_data[i:i+3000] for i in range(len(marked_data)-3000)]

网友

2楼 · 编辑于 2024-06-01 13:28:06

这个程序查找“会计原则”或“国际财务报告准则”的每个实例，并打印匹配的字符串以及超出其结尾的30个字符。你知道吗

import re

with open('x.in') as fp:
    text = fp.read()

for m in re.finditer("Accounting Principles|IFRS", text):
    print(text[m.start():m.end()+30])

相关问题更多 >

编程相关推荐

热门问题

热门文章