中文字，UnicodeEncodeError:“ascii”编解码器无法对5556位的字符进行编码：序号不在范围内（128）

#python 3 version ... #關於產地 ... crop = '牛蒡' ... #要求輸入資料 def rundatainputcircle(): marketinput = input('＊請擇一輸入： 1:台北一, 2:台北二, 3:三重市, 4:台中市, 5:高雄市, 6:鳳山市, 7:桃園縣或是不填寫 > ') if marketinput == '': market = '' elif len(str(marketinput)) ==1 and 1 <= int(marketinput) <= 7: market = uriba[uribalist[int(marketinput)-1] + 1] else: print('請重新輸入：1:台北一, 2:台北二, 3:三重市, 4:台中市, 5:高雄市, 6:鳳山市, 7:桃園縣或是不填寫 > ') rundatainputcircle() rundatainputcircle() #匯入資料 def rundatacircle(): url = 'http://m.coa.gov.tw/OpenData/FarmTransData.aspx?' + '$top=' + top + '&$skip=0&crop=' + crop + '&StartDate=' + startdate + '&EndDate=' + enddate if market != '': url += '&Market=' + market else: url = url url = url.encode('ascii') print(url)#test urllib.request.urlretrieve(url, "data.gz") data_str = open('data.gz', 'r').read()#gzip.open('data.gz', 'r').read() gobou_data = json.loads(data_str) print(len(gobou_data))#test return gobou_data rawdata = rundatacircle()

2条回答

网友

1楼 · 编辑于 2024-06-02 04:29:49

你的问题是你用来编码你的URL的ascii编码不理解中文字符。在

经过短时间的网络搜索，我找到了支持汉字的gb18030编码。 https://en.wikipedia.org/wiki/GB_18030

试着用这个来编码你的网址。在

网友

2楼 · 编辑于 2024-06-02 04:29:49

最后，我找到了一个解决这个问题的方法，它分为两个部分。在

首先，我改变了url中中文单词的编码：

url = 'http://m.coa.gov.tw/OpenData/FarmTransData.aspx?$top=' + top + 

'&$skip=0&' + urllib.parse.urlencode({'crop': crop}) + '&StartDate=' + startdate + '&EndDate=' + enddate
    if market != '':
        url += '&' + urllib.parse.urlencode({'Market': market})
    else:
        url = url

然后从这个列表中加载数据。在

^{pr2}$

注意函数是否有编码或解码。您可以通过print(dir(XXX))来检查这个问题

（您可以通过这个来理解：python 3 subprocess error in bytes）

相关问题更多 >

编程相关推荐

热门问题

热门文章