Python dumbo_专题 - Python中文网

如何进入一个定制的地方

我想知道如何在Scapy中添加一个定制的解剖器。我使用的是python3.4和Scapy3，如果这对结果有任何影响的话。在我上了一堂愚蠢的课分组显示2（）命令正确呈现嵌套数据包。但是我不能访问新图层 ...

2024-09-30 已阅读: n次

users = {'196': ('110', '1'), '186': ('269', '1'), '22': ('68', '4'), '196': ('650', '3')} movies = ...

2024-09-30 已阅读: n次

你知道任何python mapreduce集群库吗？在我在Java（http://lucene.apache.org/mahout/）中找到了一些好的库，但是我更喜欢使用python。在 https ...

2024-09-30 已阅读: n次

我正在将Dumbo用于一些Hadoop流作业。我有一堆JSON字典，每个字典都包含一篇文章（多行文本）和一些元数据。我知道Hadoop在给大文件时性能最好，所以我想把所有JSON字典合并到一个文件中。 ...

2024-09-30 已阅读: n次

我第一次尝试导入Dumbo，但遇到以下错误： In [1]: import dumbo -------------------------------------------------------- ...

2024-09-30 已阅读: n次

我尝试使用dumbo（Python）/haddop执行以下代码 https://github.com/klbostee/dumbo/wiki/Short-tutorial#jobs-and-runne ...

2024-09-30 已阅读: n次

我试图从一个与我的模式匹配的大字符串中提取一个子字符串 text = 'This is a large subsring. bla bla bla AND www.dumbweb.com/Dumbo ...

2024-09-30 已阅读: n次

我已经为此工作了很长一段时间了，我感到非常疲惫；我希望？]来自社区的见解可能会让我的宠物项目重新启动，这样我就可以不再自责了。我使用的是ClouderaCDH3、HBase.89和Hadoop.20。 ...

2024-09-30 已阅读: n次

我有一个家长班： class Animal(object): animalFoods = {'Elephant': ['Grass', 'Trees'], 'Turtle': 'Fish'} ...

2024-09-30 已阅读: n次

这似乎是一个非常常见的用例，但在Hadoop中很难实现（WholeFileRecordReader类也有可能）。小飞象还是猪有可能？有人知道用Dumbo或Pig将整个文件作为地图任务处理的方法吗？ ...

2024-09-30 已阅读: n次

我尝试使用Dumbo/Hadoop计算一堆小文本的TF-IDF 使用此示例的文件http://dumbotics.com/2009/05/17/tf-idf-revisited/ 为了提高效率，我将文 ...

2024-09-30 已阅读: n次

我试图在python的dumbo包的帮助下从hadoop获取序列文件名。但它给了我某种标识符。如何将其映射到文件名？在下面是我在hadoop系统上获取文件名的步骤：步骤1）生成序列文件命令： ...

2024-09-30 已阅读: n次