未连接到internet时,Flair感知模型加载失败

2024-06-02 02:51:37 发布

您现在位置:Python中文网/ 问答频道 /正文

当我没有工作的internet连接时,以下代码对我来说失败,错误消息我在下面详细介绍。我尝试了很多方法,包括配置和检查.flair文件夹和.cache包使用的transformers文件夹。我还检查了distilbert-base-uncased是否是https://huggingface.co/models上的当前模型标识符,如错误消息所示。我能做些什么来解决这个问题?详情如下

失败的代码

from flair.models import TextClassifier
en_classifier = TextClassifier.load('en-sentiment')

错误:

Can't load tokenizer for 'distilbert-base-uncased'. Make sure that:

- 'distilbert-base-uncased' is a correct model identifier listed on 'https://huggingface.co/models'

- or 'distilbert-base-uncased' is the correct path to a directory containing relevant tokenizer files

其他详细信息:

Flair版本:0.8.0.post1'

需要环境变量,因为我的应用程序需要在没有internet连接的情况下独立运行:

TRANSFORMERS_OFFLINE=1
HF_DATASETS_OFFLINE=1

我的模型文件位于由flair.cache_root配置的.flair目录中。当我加载其他模型时,适用于我的代码是:

from flair.models import TextClassifier
rnn_classifier = TextClassifier.load('sentiment-fast')

即使这样也行得通:

from flair.models import SequenceTagger
tagger = SequenceTagger.load('ner')

.flair目录具有:

  • sentiment-en-mix-distillbert_4.pt
  • sentiment-en-mix-ft-rnn.pt
  • ner-english(文件夹)
  • pos-english(文件夹)

~/.cache/huggingface/transformers目录具有:

  • 0e1bbfda7f63a99bb52e3915dcf10c3c92122b827d92eb2d34ce94ee79ba486c.d789d64ebfe299b0e416afc4a169632f903f693095b4629a7ea271d5a0cf2c99
  • 0e1bbfda7f63a99bb52e3915dcf10c3c92122b827d92eb2d34ce94ee79ba486c.d789d64ebfe299b0e416afc4a169632f903f693095b4629a7ea271d5a0cf2c99.json
  • 75abb59d7a06f4f640158a9bfcde005264e59e8d566781ab1415b139d2e4c603.7f2721073f19841be16f41b0a70b600ca6b880c8f3df6f3535cbc704371bdfa4
  • 75abb59d7a06f4f640158a9bfcde005264e59e8d566781ab1415b139d2e4c603.7f2721073f19841be16f41b0a70b600ca6b880c8f3df6f3535cbc704371bdfa4.json
  • 8c8624b8ac8aa99c60c912161f8332de003484428c47906d7ff7eb7f73eecdbb.20430bd8e10ef77a7d2977accefe796051e01bc2fc4aa146bc862997a1a15e79
  • 8c8624b8ac8aa99c60c912161f8332de003484428c47906d7ff7eb7f73eecdbb.20430bd8e10ef77a7d2977accefe796051e01bc2fc4aa146bc862997a1a15e79.json

Tags: 代码模型文件夹cachebasemodels错误load