擅长:python、mysql、java
<p>首先,我们要处理的麻烦是,您的“维度”列有时是无的,有时是一个字符串元素的列表。因此,当元素为非null时,提取该元素:</p>
<pre><code>df['dimensions2'] = df['dimensions'].apply(lambda col: col[0] if col else None)
</code></pre>
<p>接下来,获取每行中的所有字母字符串,不包括测量值:</p>
<pre><code>>>> df['dimensions2'].str.findall(r'\b([a-z]+)')
0 [long]
1 None
2 [long, wide, thick]
3 [high, long, wide]
</code></pre>
<p>注意,我们使用<code>\b</code>单词边界(从“30ft”中排除“ft”),为了避免将<code>\b</code>误解为反斜杠,我们必须在正则表达式上使用r''rawstring</p>