Python中文
首页
教程
问答
标签
搜索
登录
注册
读取带有转义字符的csv
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>我有一个csv文件,其中包括一些文本。我想将此文本标记化(拆分为一个单词列表),但在<code>pd.read_csv</code>如何解释转义字符时遇到了问题。在</p> <p>我的csv文件如下所示:</p> <pre><code>text, number one line\nother line, 12 </code></pre> <p>代码如下:</p> ^{pr2}$ <p>输出为:</p> <pre><code>['one', 'line\\nother', 'line'] </code></pre> <p>我想要的是:</p> <pre><code>['one', 'line', 'other', 'line'] </code></pre> <p>问题是<code>pd.read_csv()</code>没有将<code>\n</code>解释为换行符,而是将其解释为两个字符(<code>\</code>和{<cd5>})。在</p> <p>{{cd6}和{cd6}的字符串{cdi>都没有删除^ cd6>的字符串。在</p> <p>如果我显式地设置<code>df.iloc[0,0] = 'one line\nother line'</code>,<code>word_tokenize</code>工作得很好,因为这次<code>\n</code>实际上被解释为换行符。在</p> <p>理想情况下,我只需更改<code>pd.read_csv()</code>解释文件的方式,但其他解决方案也可以。在</p>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>你可以试试这个</p> <pre><code>import pandas as pd df = pd.read_csv("test.csv", header=None) df = df.apply(lambda x: x.str.replace('\\', " ")) print(df.iloc[1, 0]) # output: one line other line </code></pre>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
如何合并多个PDF文件?
9 回答
如何合并多个xarray数据变量及其坐标?
9 回答
如何合并多个列中具有重复值的行
1 回答
如何合并多个唯一id
6 回答
如何合并多个图纸并使用图纸名称的名称重命名列名?
10 回答
如何合并多个字典并添加同一个键的值?(Python)
5 回答
如何合并多个搜索结果文件(pkl)以将它们全部打印在一起?
9 回答
如何合并多个数据帧
9 回答
如何合并多个数据帧并使用Pandas为假人添加列?
2 回答
如何合并多个数据帧并按时间戳排序
3 回答
如何合并多个数据帧的列表并用另一个lis标记每列
3 回答
如何合并多个数据框中的列
1 回答
如何合并多个文件?
10 回答
如何合并多个查询集?
3 回答
如何合并多个绘图?
1 回答
如何合并多个词典
9 回答
如何合并多个输入数据集(数据帧)?
8 回答
如何合并多条记录中拆分的文本行
2 回答
如何合并多索引列datafram
8 回答
如何合并多级(即多索引)数据帧?
9 回答