我对web开发还是个新手,我对一些我想探索的东西有了一个想法,我想要一些关于我应该使用什么工具的建议。我了解python,最近一直在学习django,所以我希望能将它们结合起来。在
我想做的是一些基本的html解析和正则表达式的使用。基本上,我希望能够将一些有用的信息从几个网站聚合到一个网站上。例如,假设有十几所高中,我有兴趣知道它们的毕业日期、时间和地点。每个高中网站上的信息是如何呈现大致相似的,所以我想提取“地点”或“地点”,“时间”,“日期”等单词的数据,然后自动发布在我的网站上,我也希望它更新,如果任何一个高中网站的信息发生变化。在
你用什么来完成这项任务?另外,如果你知道任何有用的教程,资源等,你可以给我指出,那将是非常感谢!在
{a1}
更新:
如果要填写表格,可以使用mechanize
对于提取部分,我认为您最好的选择是Beautiful soup,主要是因为它易于使用,并且可以尝试解析任何东西,甚至是损坏的xml/html。在
相关问题 更多 >
编程相关推荐