擅长:python、mysql、java
<p>你把事情搞混了。
线</p>
<pre><code>logLine=sc.textFile("C:\TestLogs\Hospital.log")
</code></pre>
<p>创建RDD,而RDD没有readlines()方法。
请参阅以下RDD API:</p>
<p><a href="http://spark.apache.org/docs/latest/api/python/pyspark.html#pyspark.RDD" rel="nofollow">http://spark.apache.org/docs/latest/api/python/pyspark.html#pyspark.RDD</a></p>
<p>可以使用collect()逐行检索RDD的内容。
readlines()是标准Python文件API的一部分,但是在Spark中处理文件时通常不需要它。
您只需使用textFile()加载文件,然后使用RDD API处理它,请参阅上面的链接。在</p>