一个多层感知器应该有多少输入才能从给定的文本中找出语言?

2024-10-02 20:39:22 发布

您现在位置:Python中文网/ 问答频道 /正文

我假装使用Tensorflow(Python)来实现一个小系统,它必须从给定的文本(1-20个单词)返回语言

我知道多层感知器是很好的分类问题,我认为这是一个很好的网络拓扑为我的目的

我将不得不决定有多少层和多少节点在每一层,但我不知道有多少鬃毛输入我的网络应该有

有人能帮我解决这类问题的网络输入吗


Tags: 文本目的网络语言节点tensorflow系统分类
1条回答
网友
1楼 · 发布于 2024-10-02 20:39:22

不清楚你所说的输入是什么意思

但在这个问题中,输入的是要分类的文本。所以给一些文本,“我想把它归类为英语”,你可以用char-n-grams来编码

if n = 2, ==> 'I ', ' w', 'wa', 'an' etc. 

然后,您必须使用n-gram字典将这些n-gram映射到索引。将文本矢量化,例如

{1 : 'I ', 2: 'En', ... }

您可以使用spacy的库sklearn来帮助构建这个 当然,你也可以自己写代码

“我想把它归为英语”可能映射到一个索引向量

[1, 17, 45, 7, 9, 10, 5, 4, ...] 

然后可以将其作为嵌入层的输入,然后将其馈送到MLP

相关问题 更多 >