Python中文
首页
教程
问答
标签
搜索
登录
注册
spaCy公司使用什么工具从股票代码中识别公司名称?
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>我正在尝试对金融新闻进行情绪分析,我希望能够根据股票代码识别公司。从SPOT识别Spotify。最终目标是生成每个公司的情绪模型。 公司在股票市场上的识别度很好,但在股票市场上,公司股票的识别度很低。我有一份csv格式的股票代码和公司名称列表(来自纳斯达克、纽约证券交易所、美国证券交易所)。在</p> <p>基于在spaCy中使用similarity()函数,到目前为止效果并不理想。下表显示了一些相似性得分较低的公司的样本,尽管这些公司的名称在视觉上是相似的。我想用公司名称/股票代码列表来训练模型,并且在这个训练过程之后有一个更高的相似度分数。在</p> <pre><code>+------------+-------------------------+------------+ | Stock | Name | Similarity | +------------+-------------------------+------------+ | CSPI stock | CSP Inc. | 0.072 | | CHGG stock | Chegg, Inc. | 0.071 | | QADA stock | QAD Inc. | 0.065 | | SPOT stock | Spotify Technology S.A. | 0.064 | +------------+-------------------------+------------+ </code></pre> <p>基于spaCy的文档,一些工具包括使用<a href="https://spacy.io/api/phrasematcher/" rel="nofollow noreferrer">PhraseMatcher</a>,<a href="https://spacy.io/api/entityruler" rel="nofollow noreferrer">EntityRuler</a>,<a href="https://spacy.io/api/matcher" rel="nofollow noreferrer">Rule-based matching</a>,令牌匹配器。哪个最适合这个用例?在</p>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>您可以训练sense2vec模型,然后将其与spaCy结合使用。他们携手共进。 <a href="https://github.com/explosion/sense2vec" rel="nofollow noreferrer">https://github.com/explosion/sense2vec</a></p> <p>sense2vec将帮助您识别SPOT在上下文中与Spotify相似。在</p>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
为什么在使用strptime时会出现未进行转换的数据错误?
5 回答
为什么在使用strptim时会出现这个datetime日期错误
9 回答
为什么在使用StyleFrame时索引列的标题不显示sf.至excel()?
7 回答
为什么在使用sum()函数时会发生“int”对象不可调用的错误?
6 回答
为什么在使用sympy.dsolve时会得到“'list'对象没有属性'func'”?
2 回答
为什么在使用tabla时会得到一个空的数据帧?
4 回答
为什么在使用tensorboard时需要add_graph()的第二个参数?
5 回答
为什么在使用TensorFlow Lite转换YOLOv4时,推断时间/大小没有改进?有什么可能的改进吗?
5 回答
为什么在使用Tensorflow加载训练批时会出现内存泄漏?
3 回答
为什么在使用tensorflow时会收到警告/错误(使用函数API,但未实现错误)
10 回答
为什么在使用tetpyclient发出POST请求时出现403错误?
9 回答
为什么在使用TextBlob时会出现HTTP错误?
6 回答
为什么在使用TFIDF时出现错误“IndexError:list index out of range”pyspark.ml.feature?
5 回答
为什么在使用timedelta格式化之后,我在python中的日期是错误的?
1 回答
为什么在使用timeit或exec函数时,函数中的变量不会在提供的全局命名空间中搜索?
6 回答
为什么在使用tkinter时不能使用复选框?
10 回答
为什么在使用todoistpythonapi时会返回这个奇怪的ID?
5 回答
为什么在使用TQM时,在调整图像大小时,处理时间会有很大的差异?
5 回答
为什么在使用Tweepy下载用户时间线时收到错误消息
10 回答
为什么在使用twitter帐户登录Django应用程序时重定向127.0.0.1:8000?
10 回答