生产环境中的NLTK？

1条回答

网友

1楼 · 发布于 2024-09-27 09:26:23

NLTK确实是一个很好的学习平台，但它的设计并不是为了强大地服务于数以百万计的客户。在

您可以用两种不同的方法来解决可伸缩性问题：

第一个“大数据”方法：让你的算法适应MapReduce并在MongoDB/Hadoop/googlemapreduce/上运行它们。。。有不同的地方可以提供这样的解决方案（亚马逊、谷歌、Rackspace……）
第二种“自力更生”的方法：使用常见的托管解决方案或您自己的数据中心。在

“大数据”方法

这意味着重新考虑你的算法。需要良好的数学背景和对算法的正确理解。也许你甚至可以替换算法，因为执行时间与工作量的关系不大。在

因此，就实现你的想法而言，这可能是最困难（甚至不可能）的解决方案，这取决于你的技能。对于部署和将来的好处，这是迄今为止最简单的解决方案。在

可伸缩性意味着不同的东西：

关于可伸缩性有不同的数量级：您想扩展10倍、100倍、1000倍吗。。。？在

有不同的方法可以克服可伸缩性问题：

无论可伸缩性是什么类型的，以及您使用什么方法来克服它，请执行负载测试，看看您能处理什么。由于您无法立即负担所有硬件的费用，因此有多种方法可以对扩展的基础设施进行负载测试：

祝你好运！在