2024-10-06 12:31:17 发布
网友
我想获取两个文本文件并将它们写入/附加到一个文件中。每个文件都有不同的分隔符。是否有一种方法可以轻松检测脱氨?还是处理这种情况的简单方法?如何处理未知文件的删除
谢谢
不,没有简单的方法来确定未指定的分隔符。事实上,我们可以很容易地构建分隔符不明确的病理病例
然而,从你给出的例子中还是有希望的。看起来您的字段主要是字母数字数据,有时包括连字符、引号等,由常用标点符号分隔。您可以读取文件的几行,并根据文本特征确定可能的分隔符
识别alphanum字段并将其折叠为单个字符,例如A。从剩余的字符中,查找一个或多或少与这些字段交替的字符。使用优先考虑事项列表,例如(制表符、逗号、空格等),计算一些拟合优度,直到得到一个看起来可能的数字。使用它作为分隔符来读取文件
A
一旦正确摄取了每个文件的行,使用csv包编写文件就很简单了(请参阅联机示例)
csv
不,没有简单的方法来确定未指定的分隔符。事实上,我们可以很容易地构建分隔符不明确的病理病例
然而,从你给出的例子中还是有希望的。看起来您的字段主要是字母数字数据,有时包括连字符、引号等,由常用标点符号分隔。您可以读取文件的几行,并根据文本特征确定可能的分隔符
识别alphanum字段并将其折叠为单个字符,例如
A
。从剩余的字符中,查找一个或多或少与这些字段交替的字符。使用优先考虑事项列表,例如(制表符、逗号、空格等),计算一些拟合优度,直到得到一个看起来可能的数字。使用它作为分隔符来读取文件一旦正确摄取了每个文件的行,使用
csv
包编写文件就很简单了(请参阅联机示例)相关问题 更多 >
编程相关推荐