擅长:python、mysql、java
<p>使用大括号。在</p>
<p>文件=“events.parquet/exportDay=201509{08,09,10,11,12,13,14}”</p>
<p>这里有一个关于堆栈溢出的类似问题:<a href="https://stackoverflow.com/questions/31543766/pyspark-select-subset-of-files-using-regex-glob-from-s3">Pyspark select subset of files using regex glob</a>。他们建议要么使用大括号,要么执行多次读取,然后将对象联合起来(不管它们是RDD还是数据帧或其他什么,应该有某种方法)。在</p>