如何找到写得不同的相同职位名称？

Marketing Research Coordinator Market Researching Coordinator Markets Research Coordinator Market Researches Coordinator Marketing Research Coordinator Markets Researchers Coordinator Market Researcher Coordinators Marketing Researcher Coordinators ...

3条回答

网友

1楼 · 编辑于 2024-10-01 07:20:41

我不接受词干和柠檬化不起作用！您可以标记您的输入。然后获取词干，在营销的情况下，如果语言选择正确（检查词干分析包中的语言选择正确），您将获得市场。您还应该确保在if语句的两个元素上应用词干

如果存在听写问题或细微差异，您可以使用Levenstein包并接受类似于比率T的输入

例如：

import nltk.stem.porter

p_stemmer = PorterStemmer()
print("the stem of marketing:",p_stemmer.stem('Marketing'))        
print("the stem of marketing research:",p_stemmer.stem('Marketing Research'))

结果如下：

the stem of marketing: 'market' (correct)

the stem of marketing research: 'marketing research' (not want we want)

如您所见，如果未应用标记化，则词干分析器将无法按预期工作

我建议将所有这些结合起来（标记化、词干和levenstein）

网友

2楼 · 编辑于 2024-10-01 07:20:41

您可以使用Python包textdistance来计算字符串之间的规范化相似性，并且仅当相似性高于某个阈值时才保留它们

import textdistance

main_job = 'Marketing Research Coordinator'

other_jobs = ['Market Researching Coordinator', 'Markets Research Coordinator', 
              'Market Researches Coordinator', 'Marketing Research Coordinator', 
              'Markets Researchers Coordinator', 'Market Researcher Coordinators',
              'Marketing Researcher Coordinators', 'Marketing Researcher Executive',
              'Senior Advertising Analyst']

for job in other_jobs:
    distance = textdistance.jaccard.normalized_similarity(main_job, job)
    print(f'Similarity "{main_job}" & "{job}": {distance:.3f}')

Similarity "Marketing Research Coordinator" & "Market Researching Coordinator": 1.000
Similarity "Marketing Research Coordinator" & "Markets Research Coordinator": 0.871
Similarity "Marketing Research Coordinator" & "Market Researches Coordinator": 0.844
Similarity "Marketing Research Coordinator" & "Marketing Research Coordinator": 1.000
Similarity "Marketing Research Coordinator" & "Markets Researchers Coordinator": 0.794
Similarity "Marketing Research Coordinator" & "Market Researcher Coordinators": 0.818
Similarity "Marketing Research Coordinator" & "Marketing Researcher Coordinators": 0.909
Similarity "Marketing Research Coordinator" & "Marketing Researcher Executive": 0.579
Similarity "Marketing Research Coordinator" & "Senior Advertising Analyst": 0.436

看看最后两个例子

网友

3楼 · 编辑于 2024-10-01 07:20:41

使用下面的正则表达式模式并检查职务是否匹配

import re
pattern = r'Market(\w*?) Research(\w*?) Coordinator'
print('Enter job title')
job_title = input()
if re.search(pattern, job_title):
    print('Job title matching with Market Research Coordinator')
else:
    print('Job title not matching with Market Research Coordinator')

相关问题更多 >

编程相关推荐

热门问题

热门文章