擅长:python、mysql、java
<p>当您将文件的每一行复制到输出时,评估它应该被删除的概率。第一行应该有3609739/158609739被删除的可能性。如果生成一个介于0和1之间的随机数,并且该数小于该比率,请不要将其复制到输出。现在第二行的赔率是3609738/158609738;如果不删除那一行,第三行的赔率是3609738/158609737。重复直到完成。在</p>
<p>因为每行处理的几率都会变化,所以该算法保证了精确的行数。一旦你删除了3609739,几率就变为零;如果在任何时候你需要删除文件中剩下的每一行,那么几率就变成了1。在</p>