我在下面列出了更多细节,但我想回答的问题是标题。我现在正在想办法解决这个问题,但我想我应该先问一下,以防有人马上知道答案。在
关于我的设置
我有一个Kubernetes服务在Google计算引擎集群上运行(通过googlecontainer引擎启动)。它由一个服务(用于前端稳定的IP)、一个复制控制器和运行Python服务器的pod组成。该服务器是一个Python gRPC服务器睡眠监听端口。在
有2个POD(在复制控制器中指定了2个副本)、一个rc、一个服务和4个GCE实例(根据CPU设置为自动缩放到5个)。在
我希望服务能够处理任意数量的想要流式信息的客户机。然而,我现在看到的服务只与16个客户交谈。在
我假设连接的数量要么受我拥有的GCE实例数量的限制,要么受pod数量的限制。我将做一些实验,看看这些数字的变化是如何影响事情的。在
弄明白了:
kubernetes scale rc <rc-name> replicas=3
扩展我的复制控制器,以支持24个客户机。在我将研究自动缩放(使用水平吊舱缩放器?)基于传入HTTP请求的POD数。在
更新1:
基于HTTP的Kubernetesdoesn't currently support水平pod缩放。在
更新2:
显然,这里还有其他因素在起作用,比如服务器可用的线程池的大小。使用N个线程和P pods,我能够维护P*N开放通道。这对我来说尤其有效,因为我的客户机只需要每隔几秒钟轮询服务器一次,而且它们在不活动时就会休眠。在
相关问题 更多 >
编程相关推荐