从tex中提取某些段落

网友

1楼 · 编辑于 2024-09-25 06:29:54

This将帮助您列出目录中的所有文件。在

那么对于每个文件

遍历所有行
查看当前行是否以结论开头：
在那一行上做一个子串，得到单词结论之后的所有内容：

网友

2楼 · 编辑于 2024-09-25 06:29:54

应使用正则表达式提取所需的数据：

import re
import os, os.path

PATH = 'path/to/your/files/'

conclusions = []
for file in os.listdir(path):
    with open(os.path.join(PATH, file)) as f:
        data = f.read()

    conclusion = re.search('CONCLUSION: (.*?)([A-Z]{2,})', data).group(1)
    conclusions.append(conclusion)

这将查找'CONCLUSION: '头，然后扫描之后的数据，在下一个标题之后停止，该标题将始终是您指定的大写单词。在

网友

3楼 · 编辑于 2024-09-25 06:29:54

我不擅长正则表达式，也不太确定这是否是最好的方法，但它确实有效：）

import os
import re
path = 'path/to/your/files/'
for i in os.listdir(path):
    with open(path+i) as f:
        content = f.read()
        pattern = re.compile('CONCLUSION:\s*([\s\w.]*)\n[A-Z\s]*:')
        print pattern.findall(content)[0]

相关问题更多 >

编程相关推荐

热门问题

热门文章

从tex中提取某些段落

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >