我有一个任务,计算两个文本中相同的短语,以计算暂停预测系统的准确性
例如:
-源句:我/1在/1去/1学校之前/1吃早餐。
-停顿预测系统中的句子:我/我吃/我吃早餐/我去/我去/我学校
我必须得到的输出:
-相关短语:3
-相关\u未\u选取\u短语:2
-不相关:4
关于如何获取输出编号的说明:
-对于相关短语:检查并计算两个句子之间的相同短语(I,before,school=3)
-对于相关的未选取的短语:检查并统计原句中两个句子之间的不同短语(have breakfast,going to=2)
-对于不相关的:检查并统计来自停顿预测系统的句子中两个句子之间的不同短语(have,breakfast,going,to=4)
我们如何用python编写代码来计算短语以获得输出?我试过了,但找不到确切的计算方法
到目前为止,您是否尝试过这种方法:
您可能需要用
$ pip install multiset
安装multiset
相关问题 更多 >
编程相关推荐