Python和regex从带有罗马数字的docx中提取标题我有一个很大的docx文件,其中穿插着以下内容: PART I PART II PART III PART IIIA # part 3, section A PART IV PART V PART ...2024-10-02 已阅读: n次
将非结构化数据从BeautifulGroup解析为结构化数据集我有一组包含非结构化数据的7个文件,我正试图用Python将它们解析成7个不同的数据集,这些数据集是我使用beautifulsoup获得的。数据的呈现方式有很多种,我正努力通过正则表达式或其他解析包找 ...2024-10-02 已阅读: n次