Python中文
首页
教程
问答
标签
搜索
登录
注册
带有随机双引号的CSV文件
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>我有一个CSV文件,在某些字段中有双引号字符。当使用Python进行解析时,它开始忽略这些引号之间的分隔符。例如:</p> <pre><code>5695|258|03/21/2012| 15:16:02.000|info|Microsoft-Windows-Defrag|shrink estimation, (C:)|36|"6ybSr: c{q6: |Application|WKS-WIN732test.test.local|http://schemas.microsoft.com/win/2004/08/events/event|0x0080000000000000|0|0||0|0|C:\Users\test\EventLog\win7-32-test-c-drive\Application.evtx 5770|258|03/24/2012| 04:21:02.000|info|Microsoft-Windows-Defrag|boot optimization, (C:)|36|00 00 00 00 d3 03 00 00 ae 03 00 00 00 00 00 00 22 b6 30 df 64 79 c7 f6 e2 6c 1c 00 00 00 00 00 00 00 00 00|Application|WKS-WIN732test.test.local|http://schemas.microsoft.com/win/2004/08/events/event|0x0080000000000000|0|0||0|0|C:\Users\test\EventLog\win7-32-test-c-drive\Application.evtx 5843|258|03/27/2012| 07:38:36.000|info|Microsoft-Windows-Defrag|boot optimization, (C:)|36|jbg54t5t"gfb:*&hgfh|Application|WKS-WIN732test.test.local|http://schemas.microsoft.com/win/2004/08/events/event|0x0080000000000000|0|0||0|0|C:\Users\test\EventLog\win7-32-test-c-drive\Application.evtx </code></pre> <p>因此,它将两个双引号之间的所有内容作为单个字段读取:</p> ^{pr2}$ <p>(请参阅上面示例中的插入符号(<code>^</code>)。在</p> <p>我怎么能忽略它?在</p> <p><strong>注意:我不想将整个文件读入RAM并替换字符。解决方案必须在遍历读取器中的行时有效。</strong></p> <p>分隔符是管道。我使用标准CSV技术阅读,并用已知编码解码:</p> <pre><code>import csv known_encoding = 'utf-8' # for mwe, real code fetches for each file with open(self.current_file.file_path, 'rb') as f: reader = csv.reader(f, delimiter='|') for row in reader: row = [s.decode(known_encoding) for s in row] # do stuff with data in row </code></pre>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>您可以将<code>quoting</code>设置为<code>csv.QUOTE_NONE</code>,如下所示:</p> <pre><code>import csv with open('my_file', 'r') as f: csvreader = csv.reader(f, delimiter='|', quoting=csv.QUOTE_NONE) .... </code></pre>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
文本导入时标题行中的特殊字符
7 回答
文本小部件:在没有输入时更新并在循环后保持空闲
7 回答
文本小部件tkin
3 回答
文本小部件tkinter中的标签更改或文本外观更改是否有撤消功能?
2 回答
文本小部件tkinter复制图像选项
2 回答
文本小部件上的Python Tkinter ttk滚动条未缩放
2 回答
文本小部件上的滚动条可能需要根据制表符ord显示前进行滚动
9 回答
文本小部件不显示lis中的内容
2 回答
文本小部件不显示Unicode字符
7 回答
文本小部件中写入的行间距
7 回答
文本小部件中的文本作为变量
10 回答
文本小部件中的滚动条仅显示在底部
1 回答
文本小部件中的选项卡键空间计数
9 回答
文本小部件作为Lis
3 回答
文本小部件在主框架中扩展列宽
9 回答
文本小部件未使用删除功能清除
9 回答
文本小部件滚动动画(Tkinter、Python)
8 回答
文本居中。格式正确吗?
3 回答
文本差分算法
7 回答
文本已知时音频文件中的单词索引
3 回答