我正试图编写一个程序,对https://echa.europa.eu/进行化学搜索并得到结果。“搜索化学品”字段位于主网页的中间。我想通过提供cas号(例如67-56-1)来获得搜索每种化学品的结果URL。我得到的URL似乎不包括提供的cas号
我尝试将不同的cas号(71-23-8)插入“p_p_id”字段,但没有给出预期的搜索结果。
https://echa.europa.eu/search-for-chemicals?p_p_id=71-23-8
我还检查了从Chrome请求的GET方法的头,这些头也不包括cas号
网站是否使用变量存储输入查询?是否有一种方法或工具可用于获取结果URL,包括搜索cas号
一旦我弄明白了这一点,我将使用Python获取数据并将其保存为excel文件
谢谢
您需要通过请求主url一次来获取
JESSIONID
cookie,然后在https://echa.europa.eu/search-for-chemicals
上发送帖子。但这也需要一些必需的URL参数使用curl和bash:
使用python并使用beautifulsoup进行刮削
注意,我已经设置了timestamp参数(formdateparam),以防它在服务器上被实际检查
相关问题 更多 >
编程相关推荐