我正在用Python对MSSQL进行数据库调用(我在Linux上)。 在最终完成所有的dep之后,我的调用通常在每次拉取时运行大约1000000条记录。(数据库详细说明了问题、遇到的城市和解决方案)
记录集看起来像这样。。。。。(我只包括相关栏目)
Description, City, Solution
Won't Start, Denver, Replace Spark Plugs
Won't Start, Chicago, Add Gas
Light Out, Denver, Replace Bulb
Flat Tire, New York, Change Tire
...
...
我需要做的是计算唯一的描述,在每个描述下计算唯一的城市,在城市下计算唯一的解决方案。你知道吗
我是Python的新手(但我越喜欢它,就越喜欢它的实现),在过去使用另一种语言时,我可能会将整个记录集导出到SQLite,然后使用标准SQL进行总结。你知道吗
这似乎是一个迫切需要解决方案的解决方案,但由于我仍在学习Python,因此我对这类操作的最佳工具缺乏知识。你知道吗
有没有人能插嘴这个话题,甚至给我指出正确的方向? -JW公司
我不能提供一个不知道你的数据(类型等)是什么样的代码示例。但是我认为使用set更好,因为您只需要唯一数据的计数。你的计数正好是设定的长度。你知道吗
一套会比熊猫快。你知道吗
相关问题 更多 >
编程相关推荐