python xpath删除unicode字符 - 问答 - Python中文网

python xpath删除unicode字符

2024-09-27 21:25:37 发布

您现在位置：Python中文网/ 问答频道 /正文

男 | 程序猿一只，喜欢编程写python代码。

我在html页面中有这段文字

<div class="phone-content">

                            ‪050 2836142‪

                    </div>

我是这样提取的：

我使用xpath来提取div中的值

^{pr2}$

我得到了这个结果：

"\u202a050 2836142\u202a"

有人知道告诉python中的xpath删除unicode字符吗？在

Tags： div html unicode phone 页面 content 字符 xpath

1条回答

网友

1楼 · 发布于 2024-09-27 21:25:37

如果您正在寻找XPath解决方案：要除去给定集中的字符以外的所有字符，可以使用以下模式的两个嵌套的translate(...)调用：

translate($string, translate($string, ' 0123456789', ''), '')

这将删除所有非空格字符或数字的字符。必须用完整的XPath表达式替换出现的$string，才能获取该字符串。在

不过，在外部使用更高级的XPath操作可能更合理。XPath1.0的限制非常有限。在

相关问题更多 >

编程相关推荐

热门问题

热门文章