擅长:python、mysql、java
<p>如果每个酒店在您的文件中声明了每个字段(即,如果所有酒店的行数相同,即使其中一些是空的),您可以尝试使用一个简单的正则表达式来提取每个由引号(“xxx”)包围的值,然后按数字分组(例如,将每5个字段分组为一行,然后添加换行符)。在</p>
<p>一个简单的正则表达式应该是<code>["'][^"']*["']</code>(EDIT:这是因为我看到一些文件(例如Phone)使用单引号,其余的使用引号)。在</p>
<p>要进行搜索,请使用<code>findall</code>:</p>
<pre><code>compPattern = re.compile(pattern)
results = compPattern.findall(compPattern)
</code></pre>