回答此问题可获得 20 贡献值,回答如果被采纳可获得 50 分。
<p>所以我有一个数据帧,看起来像这样:</p>
<pre><code>df = pd.DataFrame({'feature1':[34,45,52],'feature2':[1,0,1],'unparsed_features':["neoclassical, heavy, $2, old, bronze", "romanticism, gold, $5", "baroque, xs, $3, new"]})
df
feature1 feature2 unparsed_features
0 34 1 neoclassical, heavy, $2, old, bronze
1 45 0 romanticism, gold, $5
2 52 1 baroque, xs, $3, new
</code></pre>
<p>我试图将列<code>unparsed_features</code>分成6列(权重、年龄、颜色、大小、价格和周期),但正如您所见,顺序混乱,不仅如此,一些字段也丢失了。在</p>
<p>我对每一列可能是什么有一个大致的想法,如下所示:</p>
^{pr2}$
<p>理想情况下,我希望我的数据帧如下所示:</p>
<pre><code>df
feature1 feature2 unparsed_features weight price age \
0 34 1 neoclassical, heavy, $2, old, bronze heavy $2 old
1 45 0 romanticism, gold, $5 $5
2 52 1 baroque, xs, $3, new $3 new
size colour period
0 bronze neoclassical
1 gold romanticism
2 xs baroque
</code></pre>
<p>我知道第一步是用逗号分隔字符串,但之后我就不知所措了。在</p>
<p><code>df['unparsed_features'].str.split(',')</code></p>
<p>谢谢你的帮助。在</p>