如何通过网页抓取表情符号?

2024-09-30 20:26:09 发布

您现在位置:Python中文网/ 问答频道 /正文

我做了一个简单的python脚本,它可以抓取一个特定的网站

下面是示例代码

import requests
site='www.example.com'
f=open("text.txt","a")
page = requests.get(site)
contents = page.content
f.write(contents)
f.close()

之后,我使用这段代码过滤数据,从一个特定的标记中获取一些文本(虽然不是最好的方法)

^{pr2}$

虽然我成功地获取了我想要的数据,但是当我试图获取包含表情符号的文本时,问题就出现了。在

这是我的输出片段

I am pretty happy ☺ coz i can easily recall this ☝stuff
#x1f60f;😏

有没有办法把这个“Ťx1f60f”转换成表情符号?在

另外,我也在试图把这个保存在firebase中,但它仍然显示这些“ţx1f60f”在上面


Tags: 数据代码文本import脚本示例网站example
1条回答
网友
1楼 · 发布于 2024-09-30 20:26:09
  1. 试着从#x开始直到结束(#x1f60f->;1f60f

  2. 通过在开头添加0,按照Unicode的要求,最多完成8位。1f60f->;0001f60f

  3. 转换。

emoji = "\U0001f60f"
print(emoji)

相关问题 更多 >