在文本中的每个单词之间插入制表符

2024-09-27 07:34:13 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个utf8编码的文本文件a.txt,包含以下格式的数据:

എടവപ്പാതി\N_NN
തുടങ്ങിയിട്ട്\V_VM_VNF
നാലു\QT_QTC
ദിവസമായി\N_NN
.\RD_PUNC

每行仅包含一个单词,并带有适当的标记。你知道吗

我想在单词和标记之间插入一个制表符。你知道吗


Tags: 数据标记txt编码格式vmnnrd
2条回答

如果您想使用Regex,Regex可以为您解决这个问题。请参阅python代码:

import re

regex = r"\\"

test_str = " എടവപ്പാതി\\N_NN തുടങ്ങിയിട്ട്\\V_VM_VNF നാലു\\QT_QTC ദിവസമായി\\N_NN .\\RD_PUNC"

subst = "\\t\\\\"

# You can manually specify the number of replacements by changing the 4th argument
result = re.sub(regex, subst, test_str, 0)

if result:
    print (result)

എടവപ്പാതി \N_NN തുടങ്ങിയിട്ട് \V_VM_VNF നാലു \QT_QTC ദിവസമായി \N_NN . \RD_PUNC

如果单词和标记用\符号分隔,则可以使用replace函数。它看起来像这样:

for line in open('a.txt').read():
    print(line.replace('\\', '\t')

如果您想保留“\”标志,可以这样做:

for line in open('a.txt').read():
    print(line.replace('\\', '\t\\')

相关问题 更多 >

    热门问题