擅长:python、mysql、java
<p><em>NB:您不需要调用<code>close()</code>,因为<code>with</code>语句可以帮您完成。</em></p>
<p>{cd3>每个函数都可以使用<cd3}:</p>
<pre><code>import re
def parse_inhalt(content):
td_list = re.findall(r"<td>(?:(?!</td>).)+</td>", content)
vol_content = td_list[1]
vol = re.findall(r";([^)]+)", vol_content)[0]
return content.replace("&nbsp;", vol)
</code></pre>
<p>代码很简单:</p>
<ul>
<li>提取<code>td_list</code>中的每个细胞</li>
<li>获取包含卷的第二个单元格的内容</li>
<li>查找“;”和“)”之间包含的<em>卷</em>(不包括那些字符)</li>
<li>将<code>&nbsp;</code>替换为<em>卷</em></li>
</ul>
<p>例如:</p>
^{pr2}$
<p>你会得到:</p>
<pre><code><tr>
<td><p>L4</p></td>
<td><p>(4.750x2.300x500; 5,5m³)</p></td>
<td><p> 5,5m³</p></td>
<td><p> 1.364 kg</p></td>
</tr>
</code></pre>
<p>可以使用以下方法删除空间:</p>
<pre><code>vol = re.findall(r";\s*([^)]+)", vol_content)[0]
</code></pre>