我有一个从平行语料库中提取的候选双语术语列表,格式如下
Difensori dei diritti umani, libertà di espressione >>> Human rights defenders, freedom of expression
我想把这两种语言中的项目关联起来。因此,源语言(意大利语)中的每一个多词术语都将与目标语言(英语)中的每一个多词术语相关联。因此,在这个例子中,bigrams将如下所示:
('Difensori dei diritti umani','Human rights defenders')
('Difensori dei diritti umani','freedom of expression')
('libertà di espressione','Human rights defenders')
('libertà di espressione','freedom of expression')
有人能帮忙吗?你知道吗
这就是你要找的吗?你知道吗
它产生以下输出:
我的解决方案:
输出:
你需要一点争吵才能得到你需要的东西。如果您只需要基于翻译的元组,根据您的示例,可以使用以下函数:
输出为:
如果需要将一方的两个术语与另一方的两个术语相关联(出于上下文目的,我想),只需按如下所示调整zipping函数:
在这种情况下,输出如下:
相关问题 更多 >
编程相关推荐