汤普森抽样

thompson-sampling的Python项目详细描述


汤普森抽样

thompson为python采样多臂bandit

这个项目是对一个多武装匪徒实施汤普森抽样方法。这个项目的目标是轻松创建和维护汤普森抽样实验。

目前,该项目支持响应服从伯努利或泊松分布的实验。我们将做进一步的工作,允许在其他发行版之后进行实验,并欢迎推荐/合作。

用法

设置实验:

下面的方法将用默认的prior实例化实验。

fromthompson_sampling.bernoulliimportBernoulliExperimentexperiment=BernoulliExperiment(arms=2)

如果您想使用priors模块设置自己的priors:

fromthompson_sampling.bernoulliimportBernoulliExperimentfromthompson_sampling.priorsimportBetaPriorpr=BetaPrior()pr.add_one(mean=0.5,variance=0.2,effective_size=10,label="option1")pr.add_one(mean=0.6,variance=0.3,effective_size=30,label="option2")experiment=BernoulliExperiment(priors=pr)

开始行动:

随机选择要在多臂强盗中“拉动”的手臂:

experiment.choose_arm()

更新奖励:

通过添加奖励信息更新有关不同武器的信息:

rewards=[{"label":"option1","reward":1},{"label":"option2","reward":0}]experiment.add_rewards(rewards)

安装

PIP

pip install thompson-sampling

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
在Android上使用BroadcastReceiver从Java报警执行本机代码   解析模板[]时发生java错误,模板可能不存在,或者任何已配置的模板解析程序都无法访问该模板   从命令行创建Java包的正确方法是什么?(与Maven的麻烦)   带有日期参数的java时区和MessageFormat   Java返回一个新数组,其中包含数组参数元素的平方   带有可选右括号的java年正则表达式   writeCharacteristic Android上的java空指针异常   在ScheduledThreadPoolExecutor中重写泛型方法的java问题   java如何在从两个不同的组合框中选择两个元素时生成通知?   java试图在正则表达式中捕获多个组,同时跳过其他组   Jasper报告中的java动态图像大小   JavaFX(带FXML)MVC:模型使用控制器   我们可以用java回滚文件mkdir吗?   java Android,无效双:“空白”字段使程序崩溃   java JSoup解析结构不良的HTML   java Jackson:(反)序列化程序和StdConverter之间有什么区别?   Crudepository(spring boot)中自定义方法的java问题