检查列名是否存在

field year description 1993 bar0 a01arb92 bar1 a01svb92 bar2 a01fam92 bar3 a08 bar4 a01bea93

field exists year description 1993 bar0 a01arb92 1 bar1 a01svb92 1 bar2 a01fam92 0 bar3 a08 1 bar4 a01bea93 1

2条回答

网友

1楼 · 编辑于 2024-09-28 21:01:42

这里有一种方法，利用熊猫会自动填充缺失索引的NaN。在

首先准备数据。您可能已经完成了这一步。在

df1 = pd.read_csv(r'c:\temp\test1.txt', sep=' ')

df1
Out[30]: 
   year description     field
0  1993        bar0  a01arb92
1  1993        bar1  a01svb92
2  1993        bar2  a01fam92
3  1993        bar3       a08
4  1993        bar4  a01bea93

df1 = df1.set_index(['year', 'description', 'field'])

df2 = pd.read_csv(r'c:\temp\test2.txt', sep=' ')

df2
Out[33]: 
   year description     field
0  1993        bar0  a01arb92
1  1993        bar1  a01svb92
2  1993        bar3       a08
3  1993        bar4  a01bea93

df2 = df2.set_index(['year', 'description', 'field'])

接下来，在df2中创建一个新列，并使用pandas将这些列复制到上一个数据帧。这将填充缺失值的NaN。然后使用fillna指定一个值0。在

^{pr2}$

网友

2楼 · 编辑于 2024-09-28 21:01:42

尝试遍历每年，过滤数据帧以获得与每个特定年份相关联的字段，然后比较元素是否在stata文件中

使用read_stata读取Stata文件：

 import pandas as pd
 d= pd.stata.read_stata("file")

读取csv文件，并将其存储在数据框中

 import pandas as pd
 df= pd.read_csv("file")

过滤并提取每年的字段。在

df[df["year"]==1993].fields #Output: List of fields in year 1993

你可以通过列出年份来概括这个过程

l= df.year
for x in l:
   f= df[df["year"]==x].fields
   # Then check if f in strata file.

这里有关于如何filter fields using Pandas的详细说明。在

将starata字段与您的列表进行比较

您可以使用All()运算符。在

^{pr2}$

如果是真的，那么字段中的所有元素都在strata文件中。在

使一切都成为函数。在

^{3}$

更新

def isInList(x):
  return  [ x for x in d if x in df[df["year"]==x].fields] == d

相关问题更多 >

编程相关推荐

热门问题

热门文章