Pyspark插座

2024-10-01 22:36:48 发布

您现在位置：Python中文网/ 问答频道 /正文

8210

网友

男 | 程序猿一只，喜欢编程写python代码。

我试图用pyspark读取文件（~600Mcsv文件）。在

令人惊讶的是，同样的代码在Scala中也能正常工作。在

我找到了这个问题页 https://issues.apache.org/jira/browse/SPARK-12261但不起作用。在

阅读代码：

import os
from pyspark import SparkContext
from pyspark import SparkConf

datasetDir = 'D:\\Datasets\\movieLens\\ml-latest\\'
ratingFile = 'ratings.csv'

conf = SparkConf().setAppName("movie_recommendation-server").setMaster('local[2]')
sc = SparkContext(conf=conf)

ratingRDD = sc.textFile(os.path.join(datasetDir, ratingFile))
print(ratingRDD.take(1)[0])

我得到了这个错误：

^{pr2}$

Tags：文件代码 from import os conf pyspark sc

0条回答

目前没有回答

编程相关推荐

java Android webRTC音频卷
java Android Studio无法解析com。谷歌。安卓gms。附近的信息。订阅选项。建设者
java无法通过OAuth2将额外参数传递给SpringSecurity。0
Java正则表达式查找重复单词“\\b（\\w+）（\\s++\\1\\b）+”时出现问题
使用RSA进行模块乘法的加密会导致Java卡出错
如果存在多个下游操作符，java不会发送重复记录
java如何按键比较两个JavaPairRDD并比较值？
安卓如何访问java。JAVA中的lang.Object json值？
带Javascript客户端的Thrift Java server OutOfMemoryError
java HTML到PDF字体解析器

热门问题

当用户用PYTHON设置一个或一个不带值的URL时，他们怎么能输入一个/a的代码呢？
2 个回答
当用户登录到站点时，如何显示不同的导航栏
7 个回答
当用户登录时，在Flask中向用户显示处理结果
5 个回答
当用户的Flask会话结束时，我如何从Redis后端中移除所有Celery结果？
4 个回答
当用户的Okta配置文件字段当前为blan时，更新该字段
9 个回答
当用户的付款逾期2天时，从Django模型检索数据
11 个回答
当用户的消息以问号结尾时，如何让机器人说些什么？
5 个回答
当用户的系统上可能也安装了Python 2.7时，如何在用户的系统上运行Python 3脚本？
3 个回答
当用户确定打印数量时，使用Matplotlib打印动画
10 个回答
当用户离开时是否可以删除整个网页？
3 个回答
当用户给出一个单词时如何打印？
5 个回答
当用户继续更改TKin中的值（使用trace方法）时，使用Entry并更新输入的条目
10 个回答
当用户编辑表单字段时，从Django时间字段中删除秒数
3 个回答
当用户被更改时，消息不会来自web套接字
4 个回答
当用户访问表单时，如何使表单为只读，而不具有更改权限
7 个回答
当用户试图更改对象的值时，使用描述符类引发RuntimeError
4 个回答
当用户调整GUI的大小时，是否有方法更改GUI内容的大小？
10 个回答
当用户调整风的大小时，pythontkinter小部件的大小会不均匀
8 个回答
当用户购买某个类别时，是否查找其他类别的销售？
4 个回答
当用户转到上一页时，Django和芹菜插入操作
11 个回答

Pyspark插座

相关问题更多 >

编程相关推荐

热门问题

热门文章

Pyspark插座

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >