Python中文
首页
教程
问答
标签
搜索
登录
注册
需要使用Python去掉带有引号的混乱数据集
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>我对Python的解析还是相当陌生的,所以我需要一些关于连接的帮助。我有一个.asc文件和一个.dat文件,它们的结构如下:</p> <pre><code>sta cnt assgnum cty pdpass ptype patnum "IL" "" 1 "Chicago" 10030271 "0" 3930271 "PA" "" 1 "Bedford" 10156902 "0" 3930272 "MO" "" 1 "St. Louis" 10112031 "0" 3930273 "IL" "" 1 "Chicago" 10030276 "0" 3930276 </code></pre> <p>而.dat是这样的:</p> <pre><code>cod cod_fix pdpass standard_name uspto_assignee "US institute" 32 12832332 "& AEROSPACE FOUND" 835951 "02 US corporation" "No change" 11624193 "& COMMUNICATIONS" 721167 "03 Foreign corp, incl. state-owned" "No change" 12549858 "& DESIGN LTD" 806186 "03 Foreign corp, incl. state-owned" "No change" 11170486 "& FR" 182855 </code></pre> <p>很难看。因此,我尝试将这两个文件分别保存为<strong>.csv文件,并去掉它们的所有引号(在sta、cty、ptype、cod等…)</p> <p>最终目标是将两个数据集合并到同一个<em>唯一标识符</em>(<strong>pdpass</strong>)下,但首先需要剥离它们。你知道吗</p> <p>我的剥离代码是这样的:</p> <pre><code>import csv import re with open("C:\\......FILE.asc", "r") as fin: with open("C:\.....FILE.csv", "w") as fout: for line in fin: newline = map(str.strip, line.split('"')) csv.writer(fout).writerow(newline) </code></pre> <p>这给了我一些格式不稳定的结果。不太清楚该往哪里走。有人吗?你知道吗</p>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>这些文件看起来是分开的。如果是这样,只需使用pandas库将其作为csv读取,并使用tab作为分隔符。你知道吗</p> <pre><code>import pandas as pd pd.read_csv("C:\\......FILE.asc", sep = '\t') </code></pre> <p>然后,您可以通过在每一行上使用map或apply来清除引号。你知道吗</p>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
如何合并多个PDF文件?
4 回答
如何合并多个xarray数据变量及其坐标?
2 回答
如何合并多个列中具有重复值的行
8 回答
如何合并多个唯一id
2 回答
如何合并多个图纸并使用图纸名称的名称重命名列名?
1 回答
如何合并多个字典并添加同一个键的值?(Python)
8 回答
如何合并多个搜索结果文件(pkl)以将它们全部打印在一起?
8 回答
如何合并多个数据帧
5 回答
如何合并多个数据帧并使用Pandas为假人添加列?
4 回答
如何合并多个数据帧并按时间戳排序
10 回答
如何合并多个数据帧的列表并用另一个lis标记每列
7 回答
如何合并多个数据框中的列
6 回答
如何合并多个文件?
7 回答
如何合并多个查询集?
3 回答
如何合并多个绘图?
10 回答
如何合并多个词典
9 回答
如何合并多个输入数据集(数据帧)?
7 回答
如何合并多条记录中拆分的文本行
8 回答
如何合并多索引列datafram
10 回答
如何合并多级(即多索引)数据帧?
9 回答