数据科学用unix管件

smalldata的Python项目详细描述


用于统计的Unix管件

在寻找command line data science的过程中, 此工具包包含三个用于unix管道的命令行实用程序。

如果没有参数运行,所有三个进程stdin到stdout都输出其docstring。

python 3是必需的。

sd_c(小数据计数)

是正则表达式计数器筛选器,包含在smalldata/counter.py中。请参阅docstring以获取进一步帮助。

sd_g(smalldata groupby)

连接stdin中与smalldata/groupby.py中包含的正则表达式匹配的行。请参阅docstring。

sd_e(小数据提取)

本着RegExSerDe的精神,这个 该工具使用正则表达式从自由格式文本文件生成csv文件。它包含在smalldata/extract.py中并具有docstring。

其他有用的工具

如果你有csv文件,你应该最终签出q

待办事项

一本食谱就好了。演示如何分析日志文件等。

历史记录

曾经生活在一个要点中:https://gist.github.com/martinvirtel/94cf47f64bf304e1c66598e93cd565c4

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java附加两个数组   java如何在Extjs的不同页面中使用相同的存储   java Jung,大顶点的布局重叠,图形出现在奇怪的位置   java如何在Android中通过画布绘制圆?   java验证库设计模式选择   java研磨机未知标记“timedTests”   java Android领域子类实例方法   java使用resteasy/jaxrs从请求负载接收两种类型的数据   缓冲策略Java缓冲策略有时不能正确绘制   java跟踪棋子   密度无关像素如何在java中锐化图像缩略图?   java如何在MongoDB更新查询中编写(或)更新   java A*寻路游戏系统退出问题   java在安卓中读取xml的最佳方式是什么?   通过反射调用的方法的java抑制警告   安卓 java。语言错误:信号11(SIGSEGV),代码10(?),故障地址006e006f   java lombok 1.18.2使用DexBuilderForDebug抛出TransformClasses   java JOptionPane CD对话框按钮?   java只返回json中的一些值,而不是完整实体对象   java包不存在错误,请稍后重试