我有一个很大的文本文件,只是一个很长的字符串。这是一大块文字。你知道吗
这个文件的原始制作者试图通过在一定数量的字母后设置\n
制表符,使其成为一个“矩阵”。你知道吗
string = "adfajdslfkajsddf&&adfadfladfsjdfl\nadk...fhaldkfjahsdf"
使用带有模块re
(可能)的正则表达式,如何将这个庞大字符串的每个字符输入到它最初应该是的矩阵中?你知道吗
此外,字符串中还有某些垃圾字符,如“&;”、“#”和“{”。是否有标准模块可供使用?你知道吗
我想可以取原始字符串,根据'\n'标记的位置将其分解为几个字符串,然后通过字符串的每个单独字符将这些字符串以某种方式放置到numpy ndarray中。你知道吗
您可以通过几种方法来实现这一点,您可以检查每个字符是否为字母数字:
或者如果所有的垃圾都是标点符号,你可以
str.translate
:两者都会给你一个简单的列表:
如果需要多维数组,可以换行拆分:
这将给你:
对于python2,
translate
有点不同:相关问题 更多 >
编程相关推荐