从fi读取unicode字符

from pyparsing import * key = Word(alphanums)('key') equals = Suppress('=') value = Word(alphanums)('value') kvexpression = key + equals + value with open('sample.cfg') as config_in: config_data = config_in.read() for match in kvexpression.scanString(config_data): result = match[0] print("{0} is {1}".format(result.key, result.value))

from pyparsing import* key = Word(alphanums + alphas8bit)('key') equals = Suppress('=') value = Word(alphanums + alphas8bit)('value') kvexpression = key + equals + value with open('şehir.cfg') as config_in: config_data = config_in.read() for match in kvexpression.scanString(config_data): result = match[0] print("{0} is {1}".format(result.key, result.value))

2条回答

网友

1楼 · 编辑于 2024-10-01 09:22:03

在代码的两个地方用alphanums+alphas8bit替换alphanums，如此行所示。你知道吗

key = Word(alphanums+alphas8bit)('key')

问题是alphanums只匹配不带重音的拉丁字母（加上数字）。alphas8bit匹配拉丁语-1中的附加8位字符。你知道吗

当我对这个输入运行修改过的代码时

sehir=Izmir
ülke=Türkiye
nüfus=4279677
AaBbCcÇçDdEeFfGgGgHhIiIiJjKkLlMmNnOoÖöPpRrSsSsTtUuÜüVvYyZz = 5

如果整个土耳其语字母出现在最后一行，结果是

sehir is Izmir
ülke is Türkiye
nüfus is 4279677
AaBbCcÇçDdEeFfGgGgHhIiIiJjKkLlMmNnOoÖöPpRrSsSsTtUuÜüVvYyZz is 5

网友

2楼 · 编辑于 2024-10-01 09:22:03

我自己找到了解决办法。我不知道这是否是实现这一目标的方便方法。但我觉得很好。你知道吗

从PyImport*

alphanums_tr = u'abcçdefgğhiijklmnoöprsştuüvyzABCÇDEFGĞHIİJKLMNOÖPRSŞTUÜVYZ0123456789'

key = Word(alphanums_tr)('key')
equals = Suppress('=')
value = Word(alphanums_tr)('value')

kvexpression = key + equals + value

with open('şehir.cfg') as config_in:
  config_data = config_in.read()

for match in kvexpression.scanString(config_data):
    result = match[0]
    print("{0} is {1}".format(result.key, result.value))

程序输出如下：

şehir is İzmir
ülke is Türkiye
nüfus is 4279677
alfabe is AaBbCcÇçDdEeFfGgĞğHhIiİiJjKkLlMmNnOoÖöPpRrSsŞşTtUuÜüVvYyZz

相关问题更多 >

编程相关推荐

热门问题

热门文章