使用python从网站中提取数据

2024-05-20 09:39:08 发布

您现在位置:Python中文网/ 问答频道 /正文

我对web开发还是个新手,我对一些我想探索的东西有了一个想法,我想要一些关于我应该使用什么工具的建议。我了解python,最近一直在学习django,所以我希望能将它们结合起来。在

我想做的是一些基本的html解析和正则表达式的使用。基本上,我希望能够将一些有用的信息从几个网站聚合到一个网站上。例如,假设有十几所高中,我有兴趣知道它们的毕业日期、时间和地点。每个高中网站上的信息是如何呈现大致相似的,所以我想提取“地点”或“地点”,“时间”,“日期”等单词的数据,然后自动发布在我的网站上,我也希望它更新,如果任何一个高中网站的信息发生变化。在

你用什么来完成这项任务?另外,如果你知道任何有用的教程,资源等,你可以给我指出,那将是非常感谢!在


Tags: 工具数据djangoweb信息网站html时间
2条回答

{a1}

更新:

如果要填写表格,可以使用mechanize

对于提取部分,我认为您最好的选择是Beautiful soup,主要是因为它易于使用,并且可以尝试解析任何东西,甚至是损坏的xml/html。在

相关问题 更多 >