我最近在两个数据集GAD
和EU-ADR
上使用了BERT进行句子分类。我对火车文件上的数据集进行了培训,将火车文件分为火车文件和验证文件。然后,我对这些数据集提供的测试文件进行了测试。我在测试数据集上得到了98%的f1分数,我不确定这是否可行,或者我的计算是错误的,因为我正在比较的那篇论文的f1分数几乎没有那么好
链接到文件BioBERT: a pre-trained biomedical language representation model for biomedical text mining
值得注意的是,我没有使用BioBERT(他们的预训练BERT模型)来完成这项任务。我只是简单地使用BERT base uncased。下面是github笔记本的链接。任何见解都会有帮助,我愿意提供所需的任何信息。此外,我已经运行了几次该模型,我仍然得到了很高的分数
BERT relation extraction on GAD and EU-ADR datasets
先谢谢你
目前没有回答
相关问题 更多 >
编程相关推荐