【NeurIPS 2020】基于蒙特卡罗树搜索的黑箱优化学习搜索空间划分

来自网友在路上 170870提问提问时间：2023-11-04 23:31:28阅读次数： 70

Learning Search Space Partition for Black-box Optimization using Monte Carlo Tree Search

目标：从采样（Dt ∩ ΩA）中学习一个边界，从而最大化两方的差异

先使用Kmeans在特征向量上（ [x, f(x)] ）聚类，然后使用SVM划分出边界

通过learning+splitting构建一个树 --> 根据UCB选择一个区域 --> 在选择的区域上，进行采样

3.1、

“Dynamic tree construction via splitting”这一段描述了一种动态树结构的构建方法，该方法通过分割操作来实现。具体来说，这个过程涉及以下几个步骤：

性能估计：通过计算在某个区域Ωi内所有样本xi的函数值f(xi)的平均值来估计该区域的性能，即ˆv∗ni = (1/ni) Σ f(xi)，其中ni是该区域内样本的数量，xi ∈ Dt ∩ Ωi是在迭代t时收集的样本。
迭代收集新样本：在每次迭代中，收集新的样本xi，并且对于这些新样本，区域的性能估计误差|ˆv∗ni − v∗ni|会迅速减小。当这个误差达到一个平稳状态时，意味着不需要再收集新的样本。
使用潜在动作分割：一旦性能估计误差达到稳定，LA-MCTS（一种算法）会使用潜在动作来分割当前区域，从而继续精细化两个子区域的价值估计。潜在动作是指通过支持向量机（SVM）学习到的边界，它将节点代表的区域分割成高性能和低性能的两个区域。
树的深化：随着越来越多的样本从有希望的区域收集，树会向更好的区域深入，从而更好地引导搜索过程朝向最优解。
分割阈值θ：在实践中，使用一个阈值θ作为可调参数来控制分割。如果在任何叶子节点上，Dt ∩ Ωi的大小超过了阈值θ，就会对该叶子节点进行分割。

这个动态树构建过程的目的是为了更好地引导贝叶斯优化（BO）算法，特别是在高维问题中，通过直接在Ωleaves上优化来帮助BO算法避免过度探索，从而提高性能。

查看全文

本文"【NeurIPS 2020】基于蒙特卡罗树搜索的黑箱优化学习搜索空间划分"：http://eshow365.cn/6-32235-0.html 内容来自互联网，请自行判断内容的正确性。如有侵权请联系我们，立即删除！