基于Python的Web信息抽取解析器 - 问答 - Python中文网

基于Python的Web信息抽取解析器

2024-09-30 20:18:08 发布

您现在位置：Python中文网/ 问答频道 /正文

男 | 程序猿一只，喜欢编程写python代码。

我的任务是解析一个HTML页面（用西里尔文）并提取某些单词。下面是我要分析的网页：http://www.toponymic-dictionary.in.ua/。我只看到一页：

import urllib
from lxml.html import fromstring
url = 'http://www.toponymic-dictionary.in.ua/'
content = urllib.urlopen(url).read()
doc = fromstring(content)
doc.make_links_absolute(url)

HTML代码对我来说相当复杂（使用xpath），所以我不知道如何进行解析。在

Tags： in import http url doc dictionary html www

1条回答

网友

1楼 · 发布于 2024-09-30 20:18:08

看看这个库：BeautifulSoup

它的Documentation

它最适合你的要求。在

干杯！在

相关问题更多 >

编程相关推荐

热门问题

热门文章