["首页","博客标签","我","开源","深度学习","机器学习","自然语言","爬虫","编程","开发语言","前端开发","生活","论文","关于me"]
bandit算法
作者: IntoHole | 可以转载, 但必须以超链接形式标明文章原始出处和作者信息及版权声明
网址: http://www.buyiker.com/2017/08/04/bandit.html
总结用途
- 在我们不知道概率分布的时候,然而概率分布又以一定概率改变,对比,我们预先统计/随机方法,bandit有更好的优势
过程
- 探索(exploration)
- 按照当前给到的最优概率去决策
代码参考