回答此问题可获得 20 贡献值,回答如果被采纳可获得 50 分。
<p>我一直在寻找我的答案,可能只是没有使用正确的措辞,只想到使用列表作为字典键值。你知道吗</p>
<p>我需要采取20 csv文件和匿名识别学生,教师,学校和地区的信息为研究目的的测试数据。csv文件的行数从20K到50K,列数从11到20,并非所有文件都有相同的信息。你知道吗</p>
<p>一个文件可能有:</p>
<pre><code>studid, termdates, testname, score, standarderr
</code></pre>
<p>另一个可能有:</p>
<pre><code>termdates, studid, studfirstname, studlastname, studdob, ethnicity, grade
</code></pre>
<p>还有一种可能:</p>
<pre><code>termdates, studid, teacher, classname, schoolname, districtname
</code></pre>
<p>我把不同的数据放进每种类型的文件/数据集的字典里,也许这不是最好的,但是当我试图用字典作为一个学生可能参加了多个测试(如语言、阅读、数学等)的键值时,我陷入了困境</p>
<p>例如:</p>
<pre><code>studDict{studid{'newid': 12345, 'dob': 1/1/1, test1:{'score': 50, 'date': 1/1/15}, test2:{'score': 50, 'date': 1/1/15}, 'school': 'Hard Knocks'},
studid1{'newid': 12345, 'dob': 1/1/1, test1:{'score': 50, 'date': 1/1/15}, test2:{'score': 50, 'date': 1/1/15}, 'school': 'Hard Knocks'}}
</code></pre>
<p>任何关于哪个库的指导或一个方法的简要说明都将不胜感激。我很了解Python,我不需要一个完整的手,但帮助我过马路将是伟大的。:D个</p>
<p><strong>澄清</p>
<p>我有一个更好的机会中彩票比这个项目被多次使用,所以方法越简单越好。如果它是一个重复的项目,我很可能会将数据转储到db表中并从那里开始工作。你知道吗</p>