擅长:python、mysql、java
<p>我想你只是有一些缩进问题。我还向连接词添加了<code>u''</code>,以指定unicode,因为我使用的是python2.7。你知道吗</p>
<p>如果要将现有行拆分为两行,可能需要添加带有<code>.</code>的回车符。。。你知道吗</p>
<p>这是一个开始(但不是最后):</p>
<pre><code>import codecs
connectives=[u'കാരണം',u'അതുകൊണ്ട് ',u'പക്ഷേ',u'അതിനാല്',u'എങ്കിലും',u'എന്നാലും',u'എങ്കില്',u'എങ്കില്പോലും',
u'എന്നതുകൊണ്ട് ',u'എന്ന']
fr = codecs.open('i.txt', encoding='utf-8')
# fw = codecs.open('outputfile.txt', 'w')
for line in fr:
line_data=line.split()
for x, e in list(enumerate(line_data)):
if e in connectives:
line_data[x]='.\n'
print " ".join(line_data).lstrip()
</code></pre>
<p>生成此输出(额外的空间,因为拆分位于行的中间)。你知道吗</p>
<pre><code>പ്രധാനമന്ത്രി മന്മോഹന്സിംഗ് നാട്ടില് എത്തി .
അദ്ദേഹം മലയാളി അല്ല .
അദ്ദേഹത്തെ പറ്റി പറയാന് വാക്കുകല്ളില്ല .
</code></pre>