Pandas数据框到配置单元选项卡我对Python和蜂巢还不熟悉。 我希望我能得到一些建议。 有人知道如何将python pandas数据框转换为hive表吗? ...2024-05-18 已阅读: n次
Python连接到配置单元使用pyhs2和Kerberos身份验证我用pyhs2连接蜂巢。但是配置单元服务器需要Kerberos身份验证。有人知道如何将JDBC字符串转换为pyhs2参数吗?比如: jdbc:hive2://biclient2.server.163. ...2024-05-18 已阅读: n次
如何将稀疏矩阵保存到拼花地板fi中我试图重现Netflix最近在产品向量流上的article中提到的设置。在 他们使用蜂巢中的拼花板文件作为数据源。我想用scipy的稀疏矩阵生成一些假数据。如何将这样的矩阵保存到拼花地板文件中?在 ...2024-05-18 已阅读: n次
从pyspark会话中获取配置单元和hadoop版本我正在hadoop集群和hive上使用pyspark。我知道它有可能得到火花,蜂巢和;命令行(spark-submit --version,hive --version,hadoop version) ...2024-05-18 已阅读: n次
从一个巨大的csv fi中计算唯一行的数量我有一个巨大的csv文件(约5-6gb)的大小,这是在蜂巢。有没有办法计算文件中存在的唯一行数?你知道吗 我对此一无所知。你知道吗 我需要将输出与另一个具有类似内容但唯一值的配置单元表进行比较。所以, ...2024-05-18 已阅读: n次
通过Pysp从配置单元读取数据我正在尝试通过Pyspark从配置单元表读取数据。我已经成功地建立了蜂巢和火花之间的联系。我还可以看到数据库中存在的表,但当我尝试查询该表时,出现以下错误: 代码: spark.sql("select ...2024-05-18 已阅读: n次
在Python中处理Parquet文件我试图用Python处理hive中的拼花板表,并面临一些数据类型问题。例如,如果我在我的蜂巢拼花桌上有一个 decimal (10,2),当我试图用python读取文件时,它给出了一个垃圾值。 请对此 ...2024-05-18 已阅读: n次
如何使用python创建配置单元ddl我最近开始学习蜂巢。我有一个python列表,它有以下值 list=['hello:struct', 'env:string', 'element:struct','AppId:string','pr ...2024-05-18 已阅读: n次
Python中的Hive子串等价我以以下方式在文件中拥有数据行: 0100234567 1234567 0000603842000000000000ABCDE JOHN J ...2024-05-18 已阅读: n次
从HDinsight群集访问配置单元表我正在使用pyspark访问HDinsight群集内的配置单元。当我去查询hive时,它会显示所有数据库,但当我从spark查询时,它只显示默认数据库 我相信它只是在默认情况下查询spark目录 我找 ...2024-05-18 已阅读: n次
将数据存储在六边形网格中用于单词搜索PythonPython新手。我想知道如何在六边形网格中存储字母。我试着用图表,但我不太明白。第一个字母(从一个文件或其他东西)进入蜂巢结构的中心六角形盒子,下一组字母(6)将填充在它外面,以此类推。谢谢。在 I ...2024-05-18 已阅读: n次
有一个等价于PIG.编译为了蜂巢?使用Pig/Python,我可以轻松地执行 P = Pig.Compile(...) 蜂巢有没有等效的?所以,我可以想象 P = Hive.Compile(...) 谢谢!你知道吗 ...2024-05-18 已阅读: n次
hiver 什么? 用更像Python的方式包装蜂箱节约客户。 为什么? 从cdh4发行版中获取的hive-thrift库,然后到处乱放 进口有效。 怎么做? 代码 import hiver clie ...2024-05-18 已阅读: n次
ochoneycomb用于Honeycomb的OpenCensus Python导出器 一个简单的导出器,将opencensus跨度数据转换为蜂巢轨迹。 示例 import time import os from ope ...2024-05-18 已阅读: n次
hiveary-agentHiveary代理==about----Hiveary公司的Hiveary代理<;info@hiveary.com>;<;https://github.com/hiveary/hiv ...2024-05-18 已阅读: n次
waggle 摇摆 准备并上传Docker图片供养蜂人使用。 快速启动 创建一个目录,并在该目录中放置一个dockerfile,以及 dockerfile所需的文件。 也可以选择在目录中放置一个e ...2024-05-18 已阅读: n次
pure-transport这个包为蜂巢连接提供了一个节省的运输工具 使用pyhive。这主要有利于实现纯sasl 对于难以安装sasl的windows用户。另一个用例 是对ssl套接字的支持,但是它留给用户配置套接字。 ...2024-05-18 已阅读: n次
Cortex-Runner Cortex为蜂巢提供自动化作业。 此包Python名称:Cortex-Runner 目前版本: Cortex-Runner 1.0.1 ...2024-05-18 已阅读: n次