我正在寻找一种“机器学习”算法,可以根据预定义的标准动态调整参数:
假设我有以下数据:
迭代次数 批处理大小 耗时 1 1000 10 2 1000 11 3 1000 10
我的标准是:“如果最近几次迭代的平均耗时少于60秒,则将大小翻倍”
由于最近3次迭代的平均耗时少于60秒,可以将批处理大小增加到2000。接下来的3次迭代可能如下:
4 2000 20 5 2000 31 6 2000 30
我们继续这个过程。如果耗时超过了60秒,我们会回退到之前的值,如下所示:
120 32000 121 121 32000 93 122 32000 113 123 16000 51 124 16000 54 125 16000 61
有没有可用的PL/SQL或SQL库?
谢谢
oradbanj
回答:
我尝试通过根据之前的耗时值变化一个随机数来模拟你的耗时。然后我使用了一个窗口函数(avg)来计算当前和之前两次耗时的平均值。ADJUSTED_BATCH_SIZE反映了AVERAGE_ELAPSED_TIME的变化。因为这是使用随机数,所以每次生成的结果集都会不同。尝试运行几次,看看是否得到你期望的结果。
WITH build_data (iteration, batch_size, elapsed_time) AS (SELECT 1 iteration, 1000 AS batch_size, TRUNC (DBMS_RANDOM.VALUE (25, 120)) elapsed_time FROM DUAL UNION ALL SELECT iteration + 1 , batch_size , CASE WHEN elapsed_time > 60 THEN TRUNC (DBMS_RANDOM.VALUE (25, 70)) ELSE TRUNC (DBMS_RANDOM.VALUE (25, 120)) END FROM build_data WHERE iteration < 1000), calc_data AS (SELECT iteration , batch_size , elapsed_time , ROUND ( AVG (elapsed_time) OVER ( ORDER BY iteration ROWS 2 PRECEDING ) ) average_elapsed_time FROM build_data) SELECT a.iteration -- , batch_size , elapsed_time , average_elapsed_time , GREATEST ( batch_size + (CASE WHEN average_elapsed_time < 60 THEN 1 WHEN average_elapsed_time > 60 THEN -1 ELSE 0 END * 1000) , 1000 ) adjusted_batch_size FROM calc_data aORDER BY iteration;