擅长:python、mysql、java
<p>这是一个开始,我无法破译您的几个字段/列,因此它可能需要更多的逻辑和<em>文本消息处理</em>。与其他答案类似:将文本解析到字典中键:值对-使用正则表达式查找对。在</p>
<pre><code>import collections, re
fields = {'productId':'Product ID', 'score':'Rating',
'helpfulness':'Number Voting', 'text':'Review'}
pattern = r'/([^:]*):\s?(.*)'
kv = re.compile(pattern)
data = collections.defaultdict(list)
with open('file.txt') as f:
reviews = f.read()
for match in kv.finditer(reviews):
key, value = match.groups()
if key in fields:
data[fields[key]].append(value)
df = pd.DataFrame.from_dict(data)
</code></pre>