从维基百科页面中提取公式 - Python

2024-09-27 19:20:09 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在提取wikipedia页面并使用python将它们写入一个文件中。当前正在执行以下操作: 代码段:

keyWords = ["kinetic energy", "gravitational force"]

for word in keyWords:
    topic = wikipedia.page(word)
    text = topic.content
    print text

但内容在显示公式时格式错误。 例如:

^{pr2}$

你能不能帮我弄清楚数学公式。谢谢您!在


Tags: 文件textinfortopic代码段page页面
1条回答
网友
1楼 · 发布于 2024-09-27 19:20:09

维基百科模块抓取的维基百科页面中没有乳胶。为了从Wikipedia页面中提取所有方程,您可以利用beauthoulsoup包。在

import wikipedia
from bs4 import BeautifulSoup

topic = wikipedia.page('kinetic energy')
equations = BeautifulSoup(topic.html()).find_all('annotation')

你可以通过任何给定的源来提取

^{pr2}$

或者

equations[0].text.split('{\\displaystyle ')[1][:-1]
#'{\\vec {F}}=m{\\vec {a}}'

虽然这仍然不是一个完全有用的格式。你还应该注意到,往往有很多“一个字母”的方程式是从引用变量中产生的,所以这可能不是最好的技术。你想达到什么目的?在

相关问题 更多 >

    热门问题