文本编码和列排列在2.x中提供UnicodeEncodeError

import csv import requests from bs4 import BeautifulSoup import pandas stocksym = [] stockname = [] stockprice = [] data = requests.get('https://finance.yahoo.com/most-active?offset=0&count=100') soup = BeautifulSoup(data.text, 'html.parser') div =soup.find('div', { 'id': 'scr-res-table' }) table = div.find('table') tbody = table.find('tbody') for tr in tbody.find_all('tr'): sym = tr.find_all('td')[0].text.strip() stocksym.append((sym)) name = tr.find_all('td')[1].text.strip() stockname.append((name)) price = tr.find_all('td')[2].text.strip() stockprice.append((price)) df = pandas.DataFrame({ "1Sym": stocksym, "2Name": stockname, "3Price": stockprice }) df.to_csv("output.csv", index=False) print(df)

1条回答

网友

1楼 · 发布于 2024-10-01 00:26:03

在pandas中使用read_html函数会更容易，遇到的问题也会更少。只需安装lxml库，如果遇到错误，pandas将使用此库进行HTML处理。你知道吗

import csv
import requests
from bs4 import BeautifulSoup
import pandas as pd

data = requests.get('https://finance.yahoo.com/most-active?offset=0&count=100')
soup = BeautifulSoup(data.text, 'html.parser')

div = soup.find('div', { 'id': 'scr-res-table' })
table = div.find('table')

df = pd.read_html(table.prettify())[0][["Symbol", "Name", "Price (Intraday)"]]
df.to_csv("output.csv", index=False, encoding="utf-16")

相关问题更多 >

编程相关推荐

热门问题

热门文章