检测anamolies的python工具

CSV-anomaly-detector的Python项目详细描述


csv anamoly检测器:
一个检测csv文件(特别是大文件)中anamoly的工具


工具描述:

如果您使用的是一个大型csv文件,其中扫描每个
行的anamoly是一项艰巨的任务,则此工具非常方便。即使文件是从可靠的
源接收的,在继续下一步之前,始终可以安全地验证文件的准确性。


每个列都有一个标题,所有这些都将在任何
csv文件的第一行提到,我们将在整个页面中称之为“header”。


该工具采用逐头扫描的方法。扫描每个header后,将标识主导的
数据类型,并假设任何其他数据类型(“我们没有得出结论
,因为最终决定取决于用户“)的缺陷。

工具中描述的数据类型非常详尽,即使是漏掉的普通眼睛也会被工具检测到。
ex.r0han与rohan不同(在第一种情况下,请注意0而不是“o”。




命令行执行:

假设我们有一个名为mock.csv&;我们的源代码在automation.py中查看文件头:
python automation.py columns--file name=mock.csv

“IP_address”]
其中上述数组的每个元素都是一个头

以查找每个头中的元素(例如电子邮件):
python automation.py executecolumns--filename=mock.csv--columns=email

您将看到这两个响应中的任何一个:
1)此列看起来没有错误。
2)请打开impropertadata.txt(此文件包含所有易出错的条目)

错误)
--filename=mock.csv(将抛出错误)
--filename=mock.csv(将抛出错误)
--filename=mock.csv(将给出结果)

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
由于java的原因,maven无法运行代码。lang.NoClassDefFoundError:com/fasterxml/jackson/annotation/JsonMerge   Android项目中的java Creative SDK图像编辑器UI   java如何在Android Studio中使用DataOutputStream上传文件并将其他参数传递到web服务器   java倒计时服务打开时崩溃   java将RubyonRails项目转换为JRubyonRails项目   java我的图库意图是不显示图像?为什么?   java如何在春季启动时跳过mongodb/   java@Autowired在Spring中是如何实现的   甲骨文Akka java。util。同时发生的timeoutexception线程池频繁超时   java maven依赖项对spring启动应用程序有何影响?   java Firestore执行复合查询,未截获事件“已修改”   java ItemStreamException:未能初始化读取器,原因是:IllegalStateException:流已初始化。重新开放前关闭   java将空标记解组到集合的新实例中   使用AspectJ的java新手:无法调用aspect   java查找棋类游戏的所有组合   你为什么要这样做and==与Java中的equals方法不一样吗?   如何对使用JavaUUID的代码进行单元测试?