Python中文
首页
教程
问答
标签
搜索
登录
注册
pandas dataframe读取csv,指定列同时保留整行为字符串
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p><strong>在pandas read_csv中,是否有方法指定col1、col15、wholeline?</strong></p> <p>我试图从一个文本文件中导入大约700000行数据,该文件有hats'^'作为分隔符,没有文本限定符和回车符作为行分隔符。在</p> <p>从文本文件中,我需要第1列、第15列,然后是一个表/数据帧的三列中的整行。在</p> <p>我在熊猫身上研究过如何做到这一点,但不太了解这一点。我可以为所有26列导入fine,但这并不能解决我的问题。在</p> <pre><code>my_df = pd.read_csv("tablefile.txt", sep="^", lineterminator="\r", low_memory=False) </code></pre> <p>或者我可以使用标准python将数据放入一个表中,但是对于700000行,这大约需要4个小时。对我来说太长了。在</p> ^{pr2}$ <p><strong>在pandas read_csv中,是否有方法指定col1、col15、wholeline?</strong></p> <p>如上所述,<code>col1</code>和{<cd2>}是数字,<code>wholeline</code>是字符串</p> <ul> <li>我不想在导入后重建字符串,因为我可能会在导入过程中丢失一些字符。在</li> </ul> <p>谢谢</p> <p>编辑: 提交到数据库中的每一行都非常耗时。在</p>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>我将<code>conn.commit()</code>放在for循环的外部。它将加载时间缩短到几分钟,尽管我猜它不太安全。在</p> <p>不管怎样,谢谢你的帮助。在</p>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
如何添加虚拟方法
2 回答
如何添加表示整数的擦边字符串?
8 回答
如何添加要在Bokeh中使用的新font.ttf文件?
3 回答
如何添加要显示的矩阵XY轴编号和XY轴
8 回答
如何添加计数?
5 回答
如何添加计数器函数?
7 回答
如何添加计数器列来计算数据帧中另一列中的特定值?
9 回答
如何添加计数器来跟踪while循环中的月份和年份?
10 回答
如何添加计数并删除countplot的顶部和右侧脊椎?
1 回答
如何添加计时器wx.应用程序更新窗口对象的主循环?
4 回答
如何添加评论到帖子?PostDetailVew,Django 2.1.5
3 回答
如何添加评论拉梅尔亚姆
8 回答
如何添加诸如矩阵Python/Pandas之类的数据帧?
1 回答
如何添加谷歌地点自动完成到Flask?
7 回答
如何添加超时、python discord bot
5 回答
如何添加超过1dp的检查
10 回答
如何添加距离方法
4 回答
如何添加跟随游戏的敌人精灵
4 回答
如何添加路径以便python可以找到程序?
6 回答
如何添加身份验证/安全性以使用happybase访问HBase?
5 回答