训练输出和flair NLP评估功能之间的极端性能差异?我用flair训练了一个定制的NER模型,训练完成后,它会输出所需的结果 Results: - F1-score (micro) 0.5714 - F1-score (macro) 0.4831 B ...2024-10-03 已阅读: n次