从语料库1、语料库2和语料库3中抽取句子样本,并显示平均长度(以句子中的字符数来衡量)
所以我有3个语料库,样本是一个用来返回随机句子的定义函数:
tcr = corpus1()
rcr = corpus2()
mcr = corpus3()
sample_size=50
for sentence in tcr.sample_raw_sents(sample_size):
print(len(sentence))
for sentence in rcr.sample_raw_sents(sample_size):
print(len(sentence))
for sentence in mcr.sample_raw_sents(sample_size):
print(len(sentence))
所以使用这个代码所有的长度都会被打印出来,但是我如何求这些长度的和呢
您可以将} 中,然后将它们相加
sentences
的所有长度存储在^{使用
zip
,它将允许您一次从每个语料库中提取一个句子相关问题 更多 >
编程相关推荐