我最近在一次面试中遇到了这个问题,想起来就让我很恼火。
假设你有一组函数,每个函数接受固定数量的参数(不同的函数可以接受不同数量的参数),每个函数都具有以下特性:
-
每个输入都在0到1之间
-
每个输出都在0到1之间
-
函数是连续的
-
函数是一个黑盒(即你无法查看其方程)
然后他让我创建一个算法来找到这个函数的全局最小值。
对我来说,这个问题就像是在尝试回答机器学习的基础。显然,如果有某种方法可以保证找到一个函数的全局最小值,那么我们就会有完美的机器学习算法。显然我们没有,所以这个问题看起来有点不可能解决。
无论如何,我给出的答案是分而治之与随机梯度下降的混合。由于所有函数都是连续的,你总能计算出相对于某个维度的部分梯度。你将每个维度分成两半,一旦达到一定的粒度,你就应用随机梯度下降。在梯度下降中,你初始化一个起始点,并基于每个维度上的小增量来评估该点的左右两侧以获得该点的斜率。然后你根据一定的学习率更新你的点,并重新计算你的部分导数,直到你达到一个旧点和新点之间的距离低于某个阈值的点。然后你重新合并,并返回两个部分中的最小值,直到你从所有你的划分中返回最小值。我希望通过这种方式来避免SGD陷入局部最小值的困境,所以我想分隔维度空间会减少这种情况发生的几率。
最后,他似乎对我的算法并不满意。有人有更快/更准确的方法来解决这个问题吗?
回答:
范围是[0, 1]
,因此f(x) = 0
,其中x
在R^n
上,是全局最小值。此外,通过知道定义域、值域和连续性,并不能保证函数是凸函数。
例如,f(x) = sqrt(x)
,这是一个凹函数(即没有最小值),并且x - [0, 1]
属于其定义域。