Python字符编码欧洲口音

Auberjonois, René -> Auberjonois, Ren\xc3\xa9 Bäumer, Eduard -> B\xc3\xa4umer, Eduard Baur-Nütten, Gisela -> Baur-N\xc3\xbctten, Gisela Bösken, Lorenz -> B\xc3\xb6sken, Lorenz Čapek, Josef -> \xc4\x8capek, Josef Großmann, Rudolf -> Gro\xc3\x9fmann, Rudolf

2条回答

网友

1楼 · 编辑于 2024-06-28 09:47:57

正如我在print语句中看到的，您使用的是python2.x，这意味着您应该通过\u符号来定义unicode字符，或者对字符串使用u前缀。所以，把你的线路改成

create_uri(u'Auberjonois, René') # note the u''

而且看起来你不需要。在拆分后为你的部件编码-它已经是unicode了

网友

2楼 · 编辑于 2024-06-28 09:47:57

停止使用UTF-8。在任何地方使用unicode，并且只在接口处解码/编码（如果需要）。在

def create_uri(artist_name):
  name = artist_name.split(u",")
  uri_name = u"%s_%s" % (name[1].strip(), name[0].strip())
  uri = u'http://example.com/' + uri_name
  print uri

create_uri(u'Name, Non_Accent')
create_uri(u'Auberjonois, René')

相关问题更多 >

编程相关推荐

热门问题

热门文章

Python字符编码欧洲口音

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >