我有一个非常大的文本文件,其中包含以下数据行:
('#DownWithAssad', '1')
('#DownYoTLParty', '1')
('#Download', '8')
('#Download:', '2')
('#Downloads', '2')
('#DownstairsMixtape', '1')
('#DowntonAbbey', '12')
('#DowntonAbbey?', '1')
('#DowntonPBS', '23')
('#Downtonabbey', '1')
('#DowntownAbbey', '1')
这似乎是一个简单的问题,但我想将数据从最高点降到最低点,这样它看起来像:
^{pr2}$我想我可以去掉括号()并用以下方法拆分数据:
import sys
f = open(sys.argv[1])
for line in f:
line = str(line)[1 : -1]
for sect in line.split(','):
print sect
不过,我不知道该怎么办。在
这就是你要做的事情。注意,以这种方式解析行是非常脆弱的(格式错误的行可能会破坏它)
更好的解析方法是使用
literal_eval
或正则表达式。你知道在字符串中出现引号或逗号时有没有特殊处理?在您可以使用
ast.literal_eval
轻松解析文本文件:工作原理:
^{pr2}$相关问题 更多 >
编程相关推荐