为什么pyspark中两种不同的数据处理方式会产生不同的结果? 我正在尝试从当前数据集创建一个示例数据集。我尝试了两种不同的方法,它们产生了两种不同的结果。以某种方式分开每个采样行应该是整数和字符串([5,unprivate],[1,hiprivate])。第一 ...2024-09-30 已阅读: n次