Pandas对列进行排序并查找差异

2024-09-30 05:18:56 发布

您现在位置:Python中文网/ 问答频道 /正文

a列和B列都需要排序。如果没有匹配项,则将其放入C列

我的数据看起来像

filenamesLocal          FilenamesServer
  filea.csv                  fileab.csv
  filec.csv                  filea.csv
  fileab.csv                 filec.csv
  filexyz.csv
  fileyh.csv

我希望它们在filenamesLocal=FilenamesServer的位置排序,余数在另一列中。。在

^{pr2}$

我的代码到目前为止。。在

    ldsdata = pd.read_csv('filelist.csv', sep=" ", header = None)
    #data.to_csv("filelist.csv", index=False)
    dataproj = pd.read_csv('edslist.txt', sep=" ", header = None)
    dataproj.columns = ["fileNameEdsComputer"]
    result = pd.concat([ldsdata, dataproj], axis=1, ignore_index=True)
    result.columns = ['fileNameLDS', path]
    result.sort(['fileNameLDS',path], ascending=[True, False], inplace=True)
    result.to_csv('list.csv', index=False)
    checkDifferences()

Tags: csvfalsetruereadindex排序resultpd
1条回答
网友
1楼 · 发布于 2024-09-30 05:18:56

设置

import pandas as pd
from StringIO import StringIO

text="""filenamesLocal          FilenamesServer
  filea.csv                  fileab.csv
  filec.csv                  filea.csv
  fileab.csv                 filec.csv
  filexyz.csv
  fileyh.csv"""

df = pd.read_csv(StringIO(text), delim_whitespace=True)

fnl = df.iloc[:, [0]].set_index(['filenamesLocal'], drop=False).dropna()
fns = df.iloc[:, [1]].set_index(['FilenamesServer'], drop=False).dropna()

print fnl

              filenamesLocal
filenamesLocal               
filea.csv           filea.csv
filec.csv           filec.csv
fileab.csv         fileab.csv
filexyz.csv       filexyz.csv
fileyh.csv         fileyh.csv

print fns

                FilenamesServer
FilenamesServer                
fileab.csv           fileab.csv
filea.csv             filea.csv
filec.csv             filec.csv

对齐fnl和{}

^{pr2}$

分配差额

aligned['Difference'] = master[aligned.isnull().any(axis=1)]

print aligned

            filenamesLocal FilenamesServer   Difference
filea.csv        filea.csv       filea.csv    filea.csv
fileab.csv      fileab.csv      fileab.csv   fileab.csv
filec.csv        filec.csv       filec.csv    filec.csv
filexyz.csv    filexyz.csv             NaN  filexyz.csv
fileyh.csv      fileyh.csv             NaN   fileyh.csv

相关问题 更多 >

    热门问题