如何将TXT文件上传到Google AutoML自然语言?

2024-10-02 12:25:09 发布

您现在位置:Python中文网/ 问答频道 /正文

我正试图上传一些文件,以便在AutoMl中进行注释和训练,以提取实体。但我在这个过程中一直收到错误。例如,当我使用PDF文件并使用相应的CSV文件创建JSONL文件时,我没有遇到任何问题,但在我将OCR应用于一些扫描文档之后,我按照指南使用了以下脚本:

https://cloud.google.com/natural-language/automl/docs/scripts/input_helper_v2.py?_gac=1.88279529.1589302044.CjwKCAjwkun1BRAIEiwA2mJRWeRJRDpqVkcxBu3um5PTXjp1KaVgPITbHqK9OunNca4lrI_MlZfVthoC748QAvD_BwE&_ga=2.177424421.-1405970329.1585427512

我在新的anaconda环境中安装了Python2.7,最后当我尝试使用此脚本时,它对我不起作用

正在将57个文件(包括csv和本地PDF文件)上载到gs://mybucket。。。 回溯(最近一次呼叫最后一次): 文件“C:\Users\USUARIO\Anaconda3\envs\jsonl\Scripts\gsutil script.py”,第5行,在 从gslib.\uuuu main\uuuuu导入main 文件“C:\Users\USUARIO\Anaconda3\envs\jsonl\lib\site packages\gslib\uuuuu main\uuuuuuuuuu.py”,第66行,在 导入httplib2 文件“C:\Users\USUARIO\Anaconda3\envs\jsonl\lib\site packages\httplib2\uuuu init\uuuuuu.py”,第482行 打印(“%s:“%h,end=”“,file=self.\u fp) ^ SyntaxError:无效语法 回溯(最近一次呼叫最后一次): 文件“input_helper_v2.py”,第686行,在 main() 文件“input_helper_v2.py”,第678行,主目录 上载文件(带注释的_文件、标志.target_gcs_目录) 上传文件中第651行的文件“input_helper_v2.py” 子进程检查调用(cmd,shell=True) 文件“C:\Users\USUARIO\Anaconda3\envs\jsonl\lib\subprocess.py”,第190行,在check\u调用中 引发被调用的进程错误(retcode,cmd) subprocess.CalledProcessError:Command'gsutil-m cpc:\users\usuario\appdata\local\temp\tmprxwqnj\analisis\u parte\u 1.jsonl c:\users\usuario\appdata\local\temp\tmprxwqnj\c\u kredit\u parte\u 2.jsonl c:\users\usuario\appdata\local\temp\tmprxwqnj\c\nc:\users\usuario\appdata\local\temp\tmprxwqnj\secreta\u popayan\u parte\u 6.jsonlc:\users\usuario\appdata\local\temp\tmprxwqnj\c\u kredit\u parte\u 1.jsonl c:\users\usuario\appdata\local\temp\tmprxwqnj\c\u colpatria\u parte\u 2.jsonlc:\users\usuario\appdata\local\temp\tmprxwqnj\c_ck_tru parte_4.jsonl c:\users\usuario\appdata\local\temp\tmprxwqnj\apc_parte_2.jsonl c:\users\usuario\appdata\local\temp\tmprxwqnj\secretria\popayan_parte_7.jsonl c:\users\usuario\uss\usuario\appdata\appdata\local\temp\tmprxwqnj\tc\prxwqnjc:\users\usuario\appdata\local\temp\tmprxwqnj\securia\u popayan\u parte\u 1.jsonlc:\users\usuario\appdata\local\temp\tmprxwqnj\cifin\u parte\u 1.jsonl c:\users\usuario\appdata\local\temp\tmprxwqnj\apc\u parte\u 1.jsonl c:\users\usuario\appdata\appdata\local\temp\tmprxwqnj\apc\apc\u parte\u parte\r\nc:\users\usuario\appdata\local\temp\tmprxwqnj\data\u credito\u mini\u parte\u 3.jsonlc:\users\usuario\appdata\local\temp\tmprxwqnj\c\u av\u villas\u parte\u 4.jsonl\temp\tmprxwqnj\c\u kredit_parte_3.jsonl c:\users\usuario\appdata\local\temp\tmprxwqnj\c_gnb_parte_2.jsonl c:\users\usuario\appdata\local\temp\tmprxwqnj\secreta_popayan_parte_9.jsonl c:\users\usuario\usuario\appdata\local\temp\tmprxwqnj\tmprxwqnj\tmprxwqnj\tparte\jsonlc:\users\usuario\appdata\local\temp\tmprxwqnj\secreta\u popayan\u parte\u 2.jsonlc:\users\usuario\appdata\local\temp\tmprxwqnj\cedulas\u parte\u 1.jsonl c:\users\usuario\appdata\local\temp\tmprxwqnj\secreta\u parte\u 1.jsonl c:\users\usuario\appdata\local\temp\tmprxwqnj\c\u tru parte\u 3.jsonl c:\users\usario\appdata\local\temp\tmprxwqnj\paz\pau salvo\jsonlc:\users\usuario\appdata\local\temp\tmprxwqnj\levantamiento\u parte\u 1.jsonl c:\users\usuario\appdata\local\temp\tmprxwqnj\secreta\u parte\u 3.jsonl c:\users\usuario\appdata\local\temp\tmprxwqnj\secreta\u popayan\u parte\u 8.jsonlc:\users\usuario\appdata\local\temp\tmprxwqnj\ape_parte1.jsonl c:\users\usuario\appdata\local\temp\tmprxwqnj\c_ck_tru parte_cif1.jsonl c:\users\usuario\appdata\local\temp\tmprxwqnj\analisis_parte_2.jsonl c:\users\usuario\appdata\local\temp\tmprxwqnj\cifin parte\jsonu parte\jsonlc:\users\usuario\appdata\local\temp\tmprxwqnj\data\u credito\u mini\u parte\u 4.jsonl c:\users\usuario\appdata\local\temp\tmprxwqnj\dataset.csv gs://mybucket'返回非零退出状态1

如果有人能帮忙,我会很感激


Tags: 文件pyhelperinputlocalusersappdatatemp

热门问题