Python Onehot在tex中每2个字符编码一次

2024-10-05 14:22:01 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个自定义的字母表作为一个字典由2个字母键和相应的十进制值组成。我基本上想用这个字母表对文本中的每2个字符进行编码。文本不能超过给定的字母表,所以手动定义它是安全的。这是我到目前为止所做的

values = {'00' : 0.0, '01': 1.0, '02':2.0, '03':3.0, '04':4.0, '05':5.0, '06':6.0, '07':7.0, '08':8.0, '09':9.0, '0a':10, '0b':11, '0c':12, '0d':13, '0e':14}

sample = '000a'
indexes = [values[ch:ch+2] for ch in range(0,len(sample),2)]

输出应该是0.010

但是,运行这个命令,我得到了unhable type:'slice'类型错误

有没有其他方法可以迭代文本中的每两个项,并用字典中的值替换它们?或者对于超过20G+的文本文件,什么是最佳的方法


Tags: sample方法in文本编码for字典定义
1条回答
网友
1楼 · 发布于 2024-10-05 14:22:01

这与您在示例中描述的相同:

values = {'00' : 0.0, '01': 1.0, '02':2.0, '03':3.0, '04':4.0, '05':5.0, '06':6.0, '07':7.0, '08':8.0, '09':9.0, '0a':10, '0b':11, '0c':12, '0d':13, '0e':14}

sample = '000a'
indexes = ''.join(str(values[sample[ch:ch+2]]) for ch in range(0,len(sample),2))

我想你错过了sample[:]values

相关问题 更多 >