如何使用pysp创建循环来迭代join

identifier component xxxx yyyy xxxx zzzz xxxx aaaa aaaa bbbb aaaa cccc bbbb dddd bbbb eeee cccc ffff cccc mmmm ffff aaaa ffff gggg ffff hhhh hhhh iiii hhhh jjjj

identifier component xxxx yyyy xxxx zzzz xxxx aaaa aaaa bbbb aaaa cccc bbbb dddd bbbb eeee cccc ffff cccc mmmm

1条回答

网友

1楼 · 发布于 2024-09-28 23:09:31

if I filter the dataframe selecting only identifier xxxx I obtain 3 rows, but what I have to do is to find a way to keep also aaaa, bbbb and cccc

你的意思是，你必须找到一种保持yyyy、zzzz和aaaa的方法，因为这些都是xxxx依赖的产品？请澄清这一点，并进一步解释如何获得最终过滤的数据帧（我得到的结果不同），我很乐意提供帮助。

我仍然很乐意提供帮助，但我仍然不明白您是如何得到最终过滤的数据帧的。你知道吗

因此您选择xxxx并接收三个相关组件yyyy、zzzz和aaaa。然后呢？得到这三个组件的相关组件，然后递归地执行此操作，直到得到基本材质？不过，这并不能反映最终过滤的数据帧中的内容。你知道吗

编辑如果我正确理解了这个问题，下面是我的想法（我不经常使用熊猫，所以如果有熊猫的特性可以让这个可爱点，我也不会感到惊讶）：

def main():

    import pandas as pd
    from queue import Queue

    df = pd.read_csv("data.csv", names=["identifier", "component"])

    result_df = pd.DataFrame()

    selected_identifier = "xxxx"
    identifier_queue = Queue()
    identifier_queue.put(selected_identifier)
    previously_seen_identifiers = set()

    while not identifier_queue.empty():
        current_identifier = identifier_queue.get()
        if current_identifier in previously_seen_identifiers:
            continue
        previously_seen_identifiers.add(current_identifier)
        current_df = df.loc[df["identifier"] == current_identifier]
        result_df = result_df.append(current_df)
        components = current_df[["component"]]["component"].tolist()
        for component in components:
            identifier_queue.put(component)

    print(result_df)

    return 0


if __name__ == "__main__":
    import sys
    sys.exit(main())

其工作原理如下：

创建一个标识符队列（也可以是一个堆栈），这些标识符需要处理。最初是要处理的唯一标识符我们选择的最终产品（xxxx在本例中）。你知道吗
当队列不为空时，获取下一个标识符并将其删除从队列中，从原始数据帧创建一个数据帧仅包含当前标识符所在的组件依赖于，并将此子数据帧附加到result_df 数据帧。在我们开始下一个迭代之前，我们将当前标识符所依赖的组件，并将其添加到我们的未处理标识符队列。你知道吗
在循环之前，我们还创建了一个set()来跟踪所有到目前为止我们看到的标识符。在循环中，如果当前标识符已经看到了，我们忽略它，继续下一个标识符。这是因为有些产品看起来具有循环依赖关系。你知道吗

如果这是你想的，请告诉我。你知道吗

相关问题更多 >

编程相关推荐

热门问题

热门文章