擅长:python、mysql、java
<ul>
<li>让-弗朗索瓦-法布很好地报道了<a href="https://wiki.python.org/moin/PythonSpeed/PerformanceTips#String_Concatenation" rel="nofollow noreferrer">string optimization</a>。你知道吗</li>
<li>另一个特点是对37251512个句子使用<code>readlines()</code>。只需使用<code>for a in f</code>,有关详细说明,请参见<a href="http://stupidpythonideas.blogspot.de/2013/06/readlines-considered-silly.html" rel="nofollow noreferrer">here</a>。你知道吗</li>
<li>取决于您的数据中有多少重复项以及型号:viterbi\u段在函数中,使用<a href="https://docs.python.org/3/tutorial/datastructures.html#sets" rel="nofollow noreferrer">^{<cd3>}</a>的单词,而不是对重复的单词进行重复操作,可能是有益的。你知道吗</li>
<li>似乎您使用的是python2,在这种情况下,使用<a href="https://stackoverflow.com/questions/135041/should-you-always-favor-xrange-over-range">^{<cd4>}</a>而不是<code>range</code></li>
<li><code>.replace('\n', '').split()</code>很慢,因为当您只想删除最后一个换行符时,它必须在整行上循环(在您的情况下不能有多个换行符)。你可以用<a href="https://docs.python.org/2/library/string.html" rel="nofollow noreferrer">^{<cd7>}</a>`</li>
<li>您的代码中有一些冗余,例如,每行需要以<code>/</code>结尾,但您有3个位置。你知道吗</li>
<li>所有这些变化可能很小,但它们会加起来,你的代码也变得更容易阅读</li>
</ul>