我有一份公司名称的清单,有些有缩写。例如:
compNames = ['Costa Limited', 'D B M LTD']
我需要使用以下方法将文本的compNames转换为令牌计数矩阵。但这不会为D B M LTD
中的B D M
输出列
count_vect = CountVectorizer(analyzer='word')
count_vect.fit_transform(compNames).toarray()
连接文本中单个字符的最佳方法是什么?你知道吗
ex: 'D B M LTD' to 'DBM LTD'
Tags:
下面是一个简短的函数,它将空格字符上的字符串分解为一个列表,迭代该列表,如果元素的长度为1,则生成一个临时字符串,当遇到长度大于1的元素时,将临时字符串追加到一个新列表。你知道吗
打印
DBM LTD
。你知道吗很尴尬,但应该有用。它在LTD前面增加了一个空间,然后用“D”替换“D”,用“B”替换“B”,依此类推。你知道吗
相关问题 更多 >
编程相关推荐