对python数据帧的行和列进行递归分组

gupt_seiff_df = pd.DataFrame(index = workshops, columns = workshops) for el in gupt_seiff: gupt_seiff_df.at[el[0], el[1]] = gupt_seiff[el] gupt_seiff_df2 = pd.DataFrame(index = workshops, columns = workshops) for row in gupt_seiff_df.index: for col in gupt_seiff_df.columns: gupt_seiff_df2.at[row, col] = gupt_seiff_df.at[row, col]

clav acciaio tornio montaggio 3 montaggio 1 tav controllo lavatrice montaggio 2 montaggio 4 clav acciaio 1.0 1.0 0.0 0.0 1.0 1.0 0.0 0.0 tornio 1.0 1.0 0.0 0.0 1.0 1.0 0.0 0.0 montaggio 3 0.0 0.0 1.0 0.0 0.0 0.0 0.059823 0.075803 montaggio 1 0.0 0.0 0.0 1.0 0.0 0.0 0.019964 0.0 tav controllo 1.0 1.0 0.0 0.0 1.0 1.0 0.0 0.0 lavatrice 1.0 1.0 0.0 0.0 1.0 1.0 0.0 0.0 montaggio 2 0.0 0.0 0.059823 0.019964 0.0 0.0 1.0 0.884966 montaggio 4 0.0 0.0 0.075803 0.0 0.0 0.0 0.884966 1.0 clav acciaio tornio montaggio 3 montaggio 1 tav controllo lavatrice montaggio 2 montaggio 4 clav acciaio 1.0 1.0 0.0 0.0 1.0 1.0 0.0 0.0 tornio 1.0 1.0 0.0 0.0 1.0 1.0 0.0 0.0 montaggio 3 0.0 0.0 1.0 0.0 0.0 0.0 0.059823 0.075803 montaggio 1 0.0 0.0 0.0 1.0 0.0 0.0 0.019964 0.0 tav controllo 1.0 1.0 0.0 0.0 1.0 1.0 0.0 0.0 lavatrice 1.0 1.0 0.0 0.0 1.0 1.0 0.0 0.0 montaggio 2 0.0 0.0 0.059823 0.019964 0.0 0.0 1.0 0.884966 montaggio 4 0.0 0.0 0.075803 0.0 0.0 0.0 0.884966 1.0

gupt_seiff_df2 = gupt_seiff_df2.drop(cluster[0], axis=0) gupt_seiff_df2 = gupt_seiff_df2.drop(cluster[0], axis=1) gupt_seiff_df2 = gupt_seiff_df2.drop(cluster[1], axis=0) gupt_seiff_df2 = gupt_seiff_df2.drop(cluster[1], axis=1) new_row_col = pd.Series({cluster[0] + cluster[1]: 1}, name=cluster[0] + cluster[1]) gupt_seiff_df2 = gupt_seiff_df2.append(new_row_col)

clav acciaio montaggio 2 tornio montaggio 3 montaggio 4 montaggio 1 tav controllolavatrice clav acciaio 1.0 0.0 1.0 0.0 0.0 0.0 NaN montaggio 2 0.0 1.0 0.0 0.059823 0.884966 0.019964 NaN tornio 1.0 0.0 1.0 0.0 0.0 0.0 NaN montaggio 3 0.0 0.059823 0.0 1.0 0.075803 0.0 NaN montaggio 4 0.0 0.884966 0.0 0.075803 1.0 0.0 NaN montaggio 1 0.0 0.019964 0.0 0.0 0.0 1.0 NaN tav controllolavatrice NaN NaN NaN NaN NaN NaN 1.0

gupt_seiff_df2 = gupt_seiff_df2.drop(cluster[0], axis=0) gupt_seiff_df2 = gupt_seiff_df2.drop(cluster[0], axis=1) gupt_seiff_df2 = gupt_seiff_df2.drop(cluster[1], axis=0) gupt_seiff_df2 = gupt_seiff_df2.drop(cluster[1], axis=1) new_row_col = pd.Series({cluster: 1}, name=cluster) gupt_seiff_df2 = gupt_seiff_df2.append(new_row_col)

Traceback (most recent call last): File "C:\Users\damia\PycharmProjects\logistic_management_tool\Main_es.py", line 9, in <module> plant = Plant(loader_) File "C:\Users\damia\PycharmProjects\logistic_management_tool\plant.py", line 168, in __init__ gupt_seiff_df2 = gupt_seiff_df2.append(new_row_col) File "C:\Users\damia\AppData\Local\Programs\Python\Python39\lib\site-packages\pandas\core\frame.py", line 7960, in append other.reindex(combined_columns, copy=False) File "C:\Users\damia\AppData\Local\Programs\Python\Python39\lib\site-packages\pandas\core\series.py", line 4345, in reindex return super().reindex(index=index, **kwargs) File "C:\Users\damia\AppData\Local\Programs\Python\Python39\lib\site-packages\pandas\core\generic.py", line 4811, in reindex return self._reindex_axes( File "C:\Users\damia\AppData\Local\Programs\Python\Python39\lib\site-packages\pandas\core\generic.py", line 4827, in _reindex_axes new_index, indexer = ax.reindex( File "C:\Users\damia\AppData\Local\Programs\Python\Python39\lib\site-packages\pandas\core\indexes\multi.py", line 2492, in reindex target = MultiIndex.from_tuples(target) File "C:\Users\damia\AppData\Local\Programs\Python\Python39\lib\site-packages\pandas\core\indexes\multi.py", line 175, in new_meth return meth(self_or_cls, *args, **kwargs) File "C:\Users\damia\AppData\Local\Programs\Python\Python39\lib\site-packages\pandas\core\indexes\multi.py", line 531, in from_tuples arrays = list(lib.tuples_to_object_array(tuples).T) File "pandas\_libs\lib.pyx", line 2537, in pandas._libs.lib.tuples_to_object_array TypeError: Expected tuple, got str

1条回答

网友

1楼 · 发布于 2024-09-27 19:34:12

我想你还在寻找解决办法

我认为.append的问题源于对索引的误解。元组最有可能导致一个MultiIndex，然后与数据帧的标签冲突（我已经查看了相应的Pandas实现，但最终丢失了）。这里有一个不错的解决方法：

使用示例框架

df = pd.DataFrame({'A': [1, 2], 'B': [2, 1]}, index=['A', 'B'])

   A  B
A  1  2
B  2  1

这个

cluster = ('A', 'B')
df = df.append(pd.Series({cluster: 1}, name=cluster))

由于同样的原因失败了，但是

cluster = ('A', 'B')
df = pd.concat([df, pd.Series({cluster: 1})])
df.columns = df.columns.to_list()[:-1] + [cluster]

结果（print(df)）在

          A    B  (A, B)
A       1.0  2.0     NaN
B       2.0  1.0     NaN
(A, B)  NaN  NaN     1.0

似乎有你想要的结构

也许有帮助

相关问题更多 >

编程相关推荐

热门问题

热门文章