【NeurIPS 2020】基于蒙特卡罗树搜索的黑箱优化学习搜索空间划分
最佳答案 问答题库708位专家为你答疑解惑
Learning Search Space Partition for Black-box Optimization using Monte Carlo Tree Search
目标:从采样(Dt ∩ ΩA)中学习一个边界,从而最大化两方的差异
先使用Kmeans在特征向量上( [x, f(x)] )聚类,然后使用SVM划分出边界
通过learning+splitting构建一个树 --> 根据UCB选择一个区域 --> 在选择的区域上,进行采样
3.1、
通过splitting进行动态树的构建
“Dynamic tree construction via splitting”这一段描述了一种动态树结构的构建方法,该方法通过分割操作来实现。具体来说,这个过程涉及以下几个步骤:
-
性能估计:通过计算在某个区域Ωi内所有样本xi的函数值f(xi)的平均值来估计该区域的性能,即ˆv∗ni = (1/ni) Σ f(xi),其中ni是该区域内样本的数量,xi ∈ Dt ∩ Ωi是在迭代t时收集的样本。
-
迭代收集新样本:在每次迭代中,收集新的样本xi,并且对于这些新样本,区域的性能估计误差|ˆv∗ni − v∗ni|会迅速减小。当这个误差达到一个平稳状态时,意味着不需要再收集新的样本。
-
使用潜在动作分割:一旦性能估计误差达到稳定,LA-MCTS(一种算法)会使用潜在动作来分割当前区域,从而继续精细化两个子区域的价值估计。潜在动作是指通过支持向量机(SVM)学习到的边界,它将节点代表的区域分割成高性能和低性能的两个区域。
-
树的深化:随着越来越多的样本从有希望的区域收集,树会向更好的区域深入,从而更好地引导搜索过程朝向最优解。
-
分割阈值θ:在实践中,使用一个阈值θ作为可调参数来控制分割。如果在任何叶子节点上,Dt ∩ Ωi的大小超过了阈值θ,就会对该叶子节点进行分割。
这个动态树构建过程的目的是为了更好地引导贝叶斯优化(BO)算法,特别是在高维问题中,通过直接在Ωleaves上优化来帮助BO算法避免过度探索,从而提高性能。
99%的人还看了
相似问题
猜你感兴趣
版权申明
本文"【NeurIPS 2020】基于蒙特卡罗树搜索的黑箱优化学习搜索空间划分":http://eshow365.cn/6-32235-0.html 内容来自互联网,请自行判断内容的正确性。如有侵权请联系我们,立即删除!
- 上一篇: Ubuntu Linux 23.10安装manimgl
- 下一篇: Redis中Hash类型的命令