Python中文
首页
教程
问答
标签
搜索
登录
注册
用Python解析Alexa-XML
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>我有一个非常相似的问题: <a href="https://stackoverflow.com/questions/24382718/python-alexa-result-parsing-with-lxml-etree">python alexa result parsing with lxml.etree</a>。在</p> <p>我想知道如何解析第二个<code>DataUrl</code>。这意味着我要得到<code>DataUrl</code>变量,它在<code>TrafficData</code>下,而不是{<cd4>}下。(得到<code>people.com</code>而不是<code>google.com</code>)</p> <p>我还使用了lxml,数据与他描述的完全相同。在</p> <p>代码如下:</p> <pre><code><aws:UrlInfoResponse xmlns:aws="http://alexa.amazonaws.com/doc/2005-10-05/"> <aws:Response xmlns:aws="http://awis.amazonaws.com/doc/2005-07-11"> <aws:OperationRequest> <aws:RequestId>ccf3f263-ab76-ab63-db99-244666044e85</aws:RequestId> </aws:OperationRequest> <aws:UrlInfoResult> <aws:Alexa> <aws:ContentData> <aws:DataUrl type="canonical">google.com/</aws:DataUrl> <aws:SiteData> <aws:Title>Google</aws:Title> <aws:Description>Enables users to search the world's information, including webpages, images, and videos. Offers unique features and search technology.</aws:Description> <aws:OnlineSince>15-Sep-1997</aws:OnlineSince> </aws:SiteData> <aws:LinksInCount>3453627</aws:LinksInCount> </aws:ContentData> <aws:TrafficData> <aws:DataUrl type="canonical">people.com/</aws:DataUrl> <aws:Rank>1</aws:Rank> </aws:TrafficData> </aws:Alexa> </aws:UrlInfoResult> <aws:ResponseStatus xmlns:aws="http://alexa.amazonaws.com/doc/2005-10-05/"> <aws:StatusCode>Success</aws:StatusCode> </aws:ResponseStatus> </aws:Response> </aws:UrlInfoResponse> </code></pre>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>我需要做的是:</p> <pre><code>namespaces = {"aws": "http://awis.amazonaws.com/doc/2005-07-11"} texts = doc.xpath("//aws:TrafficData/aws:DataUrl/text()", namespaces=namespaces) print texts[0] </code></pre>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
尽管Python中的所有内容都是引用,为什么Python导师在没有指针的列表中绘制字符串和整数?
3 回答
尽管python中的表达式为false,但循环仍在运行
10 回答
尽管python代码正确,但从nifi ExecuteScript处理器获取语法错误
7 回答
尽管Python在Neovim中工作得很好,但插件不能识别Neovim中的Python主机
10 回答
尽管python字典包含了大量的条目,但它并没有增长
9 回答
尽管python说模块存在,为什么我会得到这个消息?
5 回答
尽管setuptools和控制盘是最新的,但无法识别singleversionexternallymanaged
4 回答
尽管stdout和stderr重定向,但未捕获错误消息
2 回答
尽管Tensorboard的事件太大,但Tensorboard的步骤太少了
7 回答
尽管tkinter上的变量已更改,但显示未更改
4 回答
尽管try/except使用Python进行单元测试时出现断言错误
1 回答
尽管URL是sam,但仍会抛出“达到最大重定向”
4 回答
尽管url有效,Pandas仍读取url的\u csv错误
4 回答
尽管while中存在时间延迟,但LINUX线程的CPU利用率为100%(1)
9 回答
尽管x0在范围内,Scipy优化仍会引发ValueError
10 回答
尽管xpath正确,但使用selenium单击链接仍不起作用
3 回答
尽管下载了ffmpeg并设置了路径变量python,但没有后端错误
2 回答
尽管下载了i,但找不到型号“fr”
7 回答
尽管下载了plotnine包,但未获取名为“plotnine”的模块时出错
6 回答
尽管为所有行指定了权重,网格(0)仍不起作用
10 回答