Python从当前打开的HTML网站获取文本

2024-10-01 05:00:44 发布

您现在位置:Python中文网/ 问答频道 /正文

所以我在大学二年级,我们用java做了很多编程,但我想以后再做人工智能/数据科学为生,所以我决定学习pyhton(不得不说我真的很怀念那些括号)。我的第一个项目是一个简单的计算器,它将所有计算保存到一个文件中,并且能够读取该文件中的所有计算(只是让你知道我对pyhton的了解有多远)。

昨天我无意中发现了TypeRacer,一个非常简单的关于beeing打字速度的游戏。我认为为这个编写一个bot会很有趣,因为它可能没那么难,我将学习pyhton中的一些新技巧,以后可能会有用,比如从web页面获取数据

我最初的计划是复制你要输入的文本,粘贴到控制台,然后你用鼠标一点,程序就会写下文本。写作部分非常简单:

import pyautogui

def main():
 pyautogui.press('a')

基本上就是我需要的。然而,得到文本结果是非常困难的,因为你不能只是复制文本从游戏领域的网站不允许你。但是,您可以进入开发人员控制台,选择inspect元素,然后从那里可以复制文件中的文本。这是我想自动化的过程:连接到当前在(windows)pc上打开的浏览器,获取div的文本。

我甚至不确定这是否可行,因为this question表明您无法获取浏览器的所有打开的网站,所以我尝试的可能也不可能。

TLDR:我想在TypeRacer中作弊,我需要得到你必须以编程方式键入的文本。我不能把文本复制到控制台,因为网站不允许这样做


Tags: 文件数据文本游戏pyhton网站编程浏览器