擅长:python、mysql、java
<p>信息嵌入在一个脚本中,该脚本以字符串的形式包含在标记属性中?那是。。。很不幸。在</p>
<p>(编辑:为了澄清,我假设这里的问题是“如果输入这个不幸的html/javascript,我怎么能用beauthoulsoup解析出电话号码呢?”。如果不正确,请告知。)</p>
<p>我想最简单的事情是隔离javascript字符串,然后使用regex来提取数字。然而,regex部分将是一个PITA,相当脆弱。在</p>
<p>假设soup是BeautifulSoup对象,<code>soup.find('h3', id='resultTelBar').span['onclick']</code>将得到字符串。然后使用<code>re.search</code>来解析第一行之外的数字。使用什么样的正则表达式取决于结果的规则性(是否每个javascript字符串都是这样格式化的,包括换行符)?等等)以及您需要它的健壮性,例如外国电话号码,或者在将来的javascript数据版本中稍作调整。在</p>