(PY)Spark:如何读取扩展名为“.gz”的“.txt”文件

2024-04-26 03:28:14 发布

您现在位置:Python中文网/ 问答频道 /正文

我需要在spark中加载一个纯txt RDD。但由于某些原因,要加载的文件名必须命名为“xxx.gz公司". 默认情况下,当使用sc.textFile文件. 如何让spark将文件识别为纯txt文件?你知道吗


Tags: 文件txt文件名情况公司原因命名spark