从网站提取信息的Web API

3 投票
2 回答
1926 浏览
提问于 2025-04-16 18:52

我需要一种服务,可以从网页中提取标题,并以json格式返回。我不想自己解析网页,也不想浪费多余的CPU资源。

也就是说,调用这个服务应该像这样:

curl http://api.someservice.com/fetch?url=google.com&element=title&out=json

从这个API得到的响应会是:

{
    response: {
        title: "Google"
        source: "google.com"
    }
    status: "success"

}

任何提示都会非常感谢

2 个回答

1

我觉得Yahoo!的YQL可能正是你想要的东西。

其实,YQL的简单描述就是“一个用来从网站提取信息的网络接口”:-)

5

你可以看看YQL——这是雅虎提供的一个通用服务,可以很轻松地进行这种数据抓取。试试这个:

select * from html where url="google.com" and xpath='//title'

在这里测试一下。

撰写回答