python xpath删除unicode字符

2024-09-27 21:25:37 发布

您现在位置:Python中文网/ 问答频道 /正文

我在html页面中有这段文字

<div class="phone-content">

                            ‪050 2836142‪

                    </div>

我是这样提取的:

我使用xpath来提取div中的值

^{pr2}$

我得到了这个结果:

"\u202a050 2836142\u202a"

有人知道告诉python中的xpath删除unicode字符吗?在


Tags: divhtmlunicodephone页面content字符xpath
1条回答
网友
1楼 · 发布于 2024-09-27 21:25:37

如果您正在寻找XPath解决方案:要除去给定集中的字符以外的所有字符,可以使用以下模式的两个嵌套的translate(...)调用:

translate($string, translate($string, ' 0123456789', ''), '')

这将删除所有非空格字符或数字的字符。必须用完整的XPath表达式替换出现的$string,才能获取该字符串。在

不过,在外部使用更高级的XPath操作可能更合理。XPath1.0的限制非常有限。在

相关问题 更多 >

    热门问题