如何从文本中提取所需信息?python

2024-09-29 23:24:08 发布

您现在位置:Python中文网/ 问答频道 /正文

我想问:塔玛·塔玛,0529589055

从这篇课文中,我不得不多次这样做。你知道吗

                    <h3 class="name">tamar tamar</h3>
                    <ul class="list-inline">
                        <li>gender:female</li>
                        <li>age:20</li>
                    <li class="phone" data="0529589055">phone:  0529589055</li>
                    <li class="email" data="tamar0529589055@gmail.com">email: tamar89055@gmail.com</li>         <!--                        <a 

Tags: namecomdataemailinlinephoneligender
2条回答

你想过尝试使用regex吗? 例如,一个简单的(\w+ \w+)</h3>将提取名称。至少对于上面的例子。 例如: (0\d+)</li>从我的头顶。你知道吗

我发现易于使用的在线regex站点:https://pythex.org

和python regex文档: https://docs.python.org/2/library/re.html

BeautifulSoup就是你要找的

from bs4 import BeautifulSoup
a='''<h3 class="name">tamar tamar</h3>
<ul class="list-inline">
    <li>gender:female</li>
    <li>age:20</li>
<li class="phone" data="0529589055">phone:  0529589055</li>
<li class="email" data="tamar0529589055@gmail.com">email: tamar89055@gmail.com</li> 
'''
soup = BeautifulSoup(a)
print(soup.find('h3',{"class": "name"}).text)
print(soup.find('li',{"class":'phone'}).text)

相关问题 更多 >

    热门问题