合并未对齐的Pandas数据帧

1条回答

网友

1楼 · 发布于 2024-09-27 18:24:52

对于这些类型的问题，一个通用的解决方案很可能是过火了。我们注意到，唯一可能的错误是，当一个值从属于它的位置写到左边的列时。在

如果您的问题比您给出的两列示例更复杂，为了方便起见，您应该有一个包含预期列类型的数组。在

types = ['string', 'int']

接下来，我会设置一个标记来识别缺陷：

^{pr2}$
脚本可以确定地检测到错误
在您的简单场景中，每当出现错误时，我们可以简单地检查第一列中的值。在
如果是数字，忽略并继续（在第二个值上保留NaN）
如果是字符串，请向右移动
在你的小例子中，那将是
def checkRow(row): try: row['Age'] = int(row['Age']) except ValueError: row['City']= row['Age'] row['Age'] = np.NaN return row df.apply(checkRow, axis=1)
如果您有两个以上的列，请使用types变量进行迭代检查，以找出NaN所属的位置。在
脚本无法确定错误
例如，如果两个相邻的列都是字符串值。那样的话，你就完了。使用第二个标记保存这些列并手动执行。当然，您可以进行高级检查（它应该是城市名称，检查值是否是城市名称），但这可能是过火了，手动执行会更快。在

相关问题更多 >

编程相关推荐

热门问题

热门文章