问题摘要
示例文件
为了演示我的问题,我创建了一个测试文件,在vi中编辑时如下所示:
"Name"|"Surname"|"Address"|"Notes"^M
"Angelo"|""|"Kenton Square 5"|"Note 1"^M
"Angelo"|""|"Kenton’s ^M
Sqr5"|"note2"^M
"Angelo"|""|"Kenton"s ^M
Road"|"Note3"^M
加载数据
要加载此文件,我在Jupyter笔记本中运行以下命令:
test = pd.read_csv('test.txt', sep ='|')
它会像下面的屏幕截图一样加载文件:
问题
我希望在文件中的示例“note2”和“Note3”中解决两个问题:
注2问题
加载文件时,如何删除^M?例如,在Jupyter中加载时,如何从地址列中删除“\r\n”。在地址列中加载的“note2”示例应如下所示:
注3问题
如何将字符串表达式中的双引号替换为撇号?此处它将其打断为另一行,这是不正确的。应按如下方式在第2行中加载:
“Note3”示例是一个复合的示例,因为它的字符串中也有“^M”字符,但我想在这里用撇号替换双引号,这样它就不会将其打断到另一行,从而破坏加载
谢谢你的帮助,非常感谢
安杰洛
如何用撇号替换字符串表达式中的双引号
如果要转换为
"
的'
始终在字母(单词字符)之间,则可以按照以下方式使用正则表达式(re
)预处理文件输出
说明:使用零长度断言查找“哪个在单词字符之后,哪个在单词字符之前”
如果文件中有文本,首先将其作为文本文件读取,即
然后清洗它
然后使用
io.StringIO
将其放入pandas.DataFrame
中,如下所示相关问题 更多 >
编程相关推荐