面向自然语言处理的机器学习定制翻译

input: her favourite dog was a huskey and her favourite cat was a leopard output: dog=huskey, cat=leopard input: her favourite dog was a beagle and her favourite cat was a lion output: dog=beagle, cat=lion input: her favourite dog was a poodle and her favourite cat was a burmese output: dog=poodle, cat=burmese

1条回答

网友

1楼 · 发布于 2024-09-26 04:53:14

（1）我将重新表述您试图解决的问题：在句子S中给出一些具体的动物A，找出C类中最好的动物。所以给出第1句：

her favourite dog was a huskey and her favourite cat was a leopard

给目标动物A=“huskey”，你会得到C=“dog”作为类；类似地，当A=“豹子”时，你会得到C=“cat”。在

（2）从你问问题的方式来看，我假设你不想使用外部词典或其他数据（在那里找到C类与其相关的动物物种的搭配并训练一个有监督的分类器相对来说是微不足道的）。所以我假设你只限于你提到的数据类型。我还将假设C类在每个句子中都明确提到。在

（3）考虑到数据约束，您可能需要在特征中使用语法信息。在英语中，句法主要是通过语序来传达的，所以我将着重讨论这些。塔格可能是你演讲中有用的一部分。在

（4）对于句子S中的每个可能的目标A，您将创建一行数据。因此，句子#1有两个目标A={husky，leopard}，因此在您的训练数据中将有两行映射到相应的类dog和cat。在

行已发送。目标F1，F2。。。FN类

11哈士奇。。。狗

21豹子。。。猫

（5）包括目标的位置作为特征。。。在您提供的示例数据中可能没有用处，但对于更复杂的目标，例如A=“the big white husky”应该将完整的名词短语映射到C=“dog”。在给定的数据上找到最接近的解。在

她最喜欢的狗是哈士奇，而她最喜欢的猫是豹子

所以你可以有一个特性F_LftClosestNoun，F_RtClosestNoun，F_ClosestNoun。然后在训练数据上训练分类器，然后在看不见的数据上测试它。如果你提供一个更真实的样本，也许我们可以确定其他有用的功能。在

相关问题更多 >

编程相关推荐

热门问题

热门文章