有可能在二元分类任务中获得98%的分数,还是我把计算搞砸了?

2024-09-30 01:20:07 发布

您现在位置:Python中文网/ 问答频道 /正文

我最近在两个数据集GADEU-ADR上使用了BERT进行句子分类。我对火车文件上的数据集进行了培训,将火车文件分为火车文件和验证文件。然后,我对这些数据集提供的测试文件进行了测试。我在测试数据集上得到了98%的f1分数,我不确定这是否可行,或者我的计算是错误的,因为我正在比较的那篇论文的f1分数几乎没有那么好

链接到文件BioBERT: a pre-trained biomedical language representation model for biomedical text mining

值得注意的是,我没有使用BioBERT(他们的预训练BERT模型)来完成这项任务。我只是简单地使用BERT base uncased。下面是github笔记本的链接。任何见解都会有帮助,我愿意提供所需的任何信息。此外,我已经运行了几次该模型,我仍然得到了很高的分数

BERT relation extraction on GAD and EU-ADR datasets

先谢谢你


Tags: 文件数据模型链接分类分数句子f1

热门问题