如果缺少一个标题，则读取csv

CustomerName,ClientID,EmailDate,EmailAddress FNAME1,LNAME1,100,2019-01-13 00:00:00.000,FNAME1@HOTMAIL.COM FNAME2,LNAME2,100,2019-01-13 00:00:00.000,FNAME2@GMAIL.COM FNAME3,LNAME3,100,2019-01-13 00:00:00.000,FNAME3@AOL.COM FNAME4,LNAME4,100,2019-01-13 00:00:00.000,FNAME40@GMAIL.COM FNAME5,LNAME5,100,2019-01-13 00:00:00.000,FNAME5@AOL.COM

def convert_ftp_data(): file = os.getcwd() + "/data.csv" data = pd.read_csv(file, index_col=False) data["first_name"] = data["CustomerName"].str.split().str[0].str.title() data["email"] = data["EmailAddress"] clean_data = data.drop(data[["CustomerName", "ClientID", "EmailDate", "EmailAddress"]], 1) print(clean_data)

3条回答

网友

1楼 · 编辑于 2024-09-30 12:13:41

为什么不在导入后跳过标题并正确设置呢

data = pd.read_csv(file, index_col=False, header=None, skiprows=1)

data.columns = 'CustomerFirstName,CustomerName,ClientID,EmailDate,EmailAddress'.split(',')

网友

2楼 · 编辑于 2024-09-30 12:13:41

请尝试以下操作：

pd.read_csv(file, usecols=['EmailAddress']).reset_index().rename(columns={'index': 'first_name', 'EmailAddress': 'email'})

输出：

    first_name  email
0   FNAME1      FNAME1@HOTMAIL.COM
1   FNAME2      FNAME2@GMAIL.COM
2   FNAME3      FNAME3@AOL.COM
3   FNAME4      FNAME40@GMAIL.COM
4   FNAME5      FNAME5@AOL.COM

网友

3楼 · 编辑于 2024-09-30 12:13:41

分别阅读标题

使用^{}，您可以利用nrows、skiprows和names参数：

from io import StringIO

x = """CustomerName,ClientID,EmailDate,EmailAddress
FNAME1,LNAME1,100,2019-01-13 00:00:00.000,FNAME1@HOTMAIL.COM
FNAME2,LNAME2,100,2019-01-13 00:00:00.000,FNAME2@GMAIL.COM
FNAME3,LNAME3,100,2019-01-13 00:00:00.000,FNAME3@AOL.COM
FNAME4,LNAME4,100,2019-01-13 00:00:00.000,FNAME40@GMAIL.COM
FNAME5,LNAME5,100,2019-01-13 00:00:00.000,FNAME5@AOL.COM"""

headers = pd.read_csv(StringIO(x), nrows=0).columns
headers = np.hstack((['FirstName', 'LastName'], headers[1:]))

df = pd.read_csv(StringIO(x), header=None, skiprows=[0], names=headers)

print(df)

#   FirstName LastName  ClientID                EmailDate        EmailAddress
# 0    FNAME1   LNAME1       100  2019-01-13 00:00:00.000  FNAME1@HOTMAIL.COM
# 1    FNAME2   LNAME2       100  2019-01-13 00:00:00.000    FNAME2@GMAIL.COM
# 2    FNAME3   LNAME3       100  2019-01-13 00:00:00.000      FNAME3@AOL.COM
# 3    FNAME4   LNAME4       100  2019-01-13 00:00:00.000   FNAME40@GMAIL.COM
# 4    FNAME5   LNAME5       100  2019-01-13 00:00:00.000      FNAME5@AOL.COM

分别阅读标题

相关问题更多 >

编程相关推荐

热门问题

热门文章