擅长:python、mysql、java
<p>如果您的数据包含文本列,请不要使用.csv来存储数据,即使它们当时不包含逗号。在这种情况下,仅当并且仅当您严格知道数据中不可能使用逗号时才使用它。使用制表符分隔或其他文件类型。你可以使用下面的解决方案,它适用于你的情况</p>
<pre><code>def refactor_text(csv):
my_dict = dict(
dummy=[],
obj=[],
loc=[],
query=[]
)
for i,line in enumerate(csv.split('\n')):
if i == 0:
continue
line_args = line.split(',')
for i,key in enumerate(my_dict.keys()):
if not key == 'query':
my_dict[key].append(line_args[i])
else:
my_dict[key].append(','.join(line_args[i:]))
return my_dict
df = pd.DataFrame(refactor_text(csv))
</code></pre>
<p>函数refactor_text接受一个参数作为字符串(csv),如果您直接从文件访问,或者在其他情况下,您可能需要重构它。你知道吗</p>