继this线程解决方案之后,我成功地获得了一组列表,每个列表都是这样的:
[u'\u05ea\u05d0\u05de\u05d9\u05df \u05dc\u05d9']
我假设这些字符是unicode字符,但由于某种原因,我无法将它们转换回希伯来语。
我在链接中的评论中尝试了建议的解决方案。我也试过使用''.join
,但没有成功。我得到的错误是:
Error Type: exceptions.UnicodeEncodeError 22:42:15 T:2806414192
M:2425589760 ERROR: Error Contents: 'ascii' codec can't encode
characters in position 0-4: ordinal not in range(128)
我试着用unicode()
来包装东西,但得到的结果和上面的例子一样。
我该如何实现?
注意:
我试图解析this link。
编辑:
我正在尝试使用join
将列表转换为字符串,然后打印它。下面是相关的代码图片:
soup = BeautifulStoneSoup(link, convertEntities=BeautifulStoneSoup.XML_ENTITIES)
programs = soup('ul')
for i,prog in enumerate(programs):
if i==(4+getLetterValue(name)):
j = 0
while j < len(prog('li')):
li = prog('li')[j]
link = li('a')[0]
url = link['href']
text = link.contents
print ''.join(text)
link
是一个字符串。并且getLetterValue(name)
返回一个整数,它告诉html文档中的位置。
目前没有回答
相关问题 更多 >
编程相关推荐