擅长:python、mysql、java
<p>由于<code>CSV</code>文件是不规则的,所以有很多空位置,其中包含“nan”对象。同时,这些列将被编入索引</p>
<p>我会用熊猫来读书</p>
<pre><code>import pandas as pd
df = pd.read_csv("not_regular_format.csv", header=None)
</code></pre>
<p>然后,初始化并清空字典以存储结果,并使用它构建输出DataFram,最终将其内容发送到<code>CSV</code>文件</p>
<pre><code>target={}
</code></pre>
<p>现在您需要在第二列中找到<code>actor_list2</code>,这是索引为<code>0</code>的列,如果它存在,开始在字典<code>target</code>中的下一行和列<code>1</code>和<code>2</code>中存储名称和分数</p>
<pre><code>rows_index = df[df[1] == 'actor_list2'].index
if len(rows_index) > 0:
i = rows_index[0]
while True:
i += 1
name = df.iloc[i, 1]
score = df.iloc[i, 2]
if pd.isna(name): # the names sequence is finished and 'nan' object exists.
break
target[name] = [score]
</code></pre>
<p>最后,构造DataFrame并编写新的<code>output.csv</code>文件</p>
<pre><code>df_output=pd.DataFrame(target)
df_output.to_csv('output.csv')
</code></pre>
<p>现在,您可以使用上面给出的示例去任何地方</p>
<p>祝你好运</p>