Tensorflow+google mlengne local predict:CSV报价应该如何处理?

2024-10-02 00:35:28 发布

您现在位置:Python中文网/ 问答频道 /正文

我训练了一个CNN模型来预测0/1值,并使用googleml引擎localpredict来测试它。我的测试文件包含2行:

some text
"some text"

我知道这会给我1和1作为预测结果。但是输出是1和0。所以双引号是有原因的。 培训期间熊猫.read\u csv用于创建词汇。你知道吗

pd.read_csv(filename, header=None, sep=',', names=['source', 'title'],encoding='utf-8', na_filter=False,engine='python')

对于预测,使用以下命令:

gcloud ml-engine local predict --model-dir=.... --text-instances=... --format=json

我在阅读csv进行培训时是否遗漏了一些参数,或者这是googleml引擎的问题?你知道吗


Tags: 文件csvtext模型引擎read原因some
2条回答

您是在输入函数中使用pandas还是tf.decode\u csv?你知道吗

在gcloud预测调用中,您将输入格式设置为json。你想把它设成CSV吗?你知道吗

您导出的图形可能包含一个decode_csv操作来读取输入。如何处理引号将取决于参数use_quote_delim的设置。为了举例说明,请考虑以下内容:

import tensorflow as tf

data = ['some text', '"some text"']
with tf.Session() as sess:
  use_delim = tf.decode_csv(data, [['']], use_quote_delim=True)
  dont = tf.decode_csv(data, [['']], use_quote_delim=False)
  out = sess.run([use_delim, dont])
  print("use", out[0])
  print("dont", out[1])

>>> ('use', [array(['some text', 'some text'], dtype=object)])
>>> ('dont', [array(['some text', '"some text"'], dtype=object)])

要获得预期的行为,需要将导出的模型设置为use_quote_delim=True(这是默认值)。你知道吗

相关问题 更多 >

    热门问题