我为什么不在它们原来的词源列表中找到这些词呢?

2024-07-01 07:25:37 发布

您现在位置:Python中文网/ 问答频道 /正文

我试着在两个不同的文件中找到中文单词,但是没有用,所以我试着在同一个文件中搜索单词,但是似乎也没有找到?怎么可能?你知道吗

chin_split = codecs.open("CHIN_split.txt","r+",encoding="utf-8")

用于this正则表达式代码。你知道吗

import re
for n in re.findall(ur'[\u4e00-\u9fff]+',chin_split.read()):
    print n in re.findall(ur'[\u4e00-\u9fff]+',chin_split.read())    

为什么我只得到falses打印???你知道吗

仅供参考,我试过这样做,效果很好:

for x in [1,2,3,4,5,6,6]:
    print x in [1,2,3,4,5,6,6]

顺便说一句

chin_split包含英语、希伯来语和汉语中的单词

来自chin_split.txt的一些行:

 he daodan   核导弹     טיל גרעיני     
 hedantou    核弹头     ראש חץ גרעיני      
 helu    阖庐  "ביתו, מעונו 
 helu    阖庐   שם מלך וו בתקופת ה'אביב והסתיו'"      
 huiwu   会晤  להיפגש עם      

Tags: 文件inretxtforread单词split
1条回答
网友
1楼 · 发布于 2024-07-01 07:25:37

您多次读取文件描述符,这是错误的。你知道吗

第一个chin_split.read()将产生所有内容,但其他内容(在循环中)只会得到一个空字符串。你知道吗

这个循环没有意义,但是如果您想保留它,请先将文件内容保存在变量中。你知道吗

相关问题 更多 >

    热门问题