chiark / gitweb /
c31e959fa39dcb63f54ce23b5964f27abc65e9e3
[nlopt.git] / luksan / plis.c
1 #include <limits.h>
2 #include <stdlib.h>
3 #include <math.h>
4 #include <string.h>
5 #include "luksan.h"
6
7 #define max(a,b) ((a) > (b) ? (a) : (b))
8 #define min(a,b) ((a) < (b) ? (a) : (b))
9
10 /* *********************************************************************** */
11 /* SUBROUTINE PLIS               ALL SYSTEMS                   01/09/22 */
12 /* PURPOSE : */
13 /* GENERAL SUBROUTINE FOR LARGE-SCALE BOX CONSTRAINED MINIMIZATION THAT */
14 /* USE THE LIMITED MEMORY VARIABLE METRIC METHOD BASED ON THE STRANG */
15 /* RECURRENCES. */
16
17 /* PARAMETERS : */
18 /*  II  NF  NUMBER OF VARIABLES. */
19 /*  II  NB  CHOICE OF SIMPLE BOUNDS. NB=0-SIMPLE BOUNDS SUPPRESSED. */
20 /*         NB>0-SIMPLE BOUNDS ACCEPTED. */
21 /*  RI  X(NF)  VECTOR OF VARIABLES. */
22 /*  II  IX(NF)  VECTOR CONTAINING TYPES OF BOUNDS. IX(I)=0-VARIABLE */
23 /*         X(I) IS UNBOUNDED. IX(I)=1-LOVER BOUND XL(I).LE.X(I). */
24 /*         IX(I)=2-UPPER BOUND X(I).LE.XU(I). IX(I)=3-TWO SIDE BOUND */
25 /*         XL(I).LE.X(I).LE.XU(I). IX(I)=5-VARIABLE X(I) IS FIXED. */
26 /*  RI  XL(NF)  VECTOR CONTAINING LOWER BOUNDS FOR VARIABLES. */
27 /*  RI  XU(NF)  VECTOR CONTAINING UPPER BOUNDS FOR VARIABLES. */
28 /*  RO  GF(NF)  GRADIENT OF THE OBJECTIVE FUNCTION. */
29 /*  RO  S(NF)  DIRECTION VECTOR. */
30 /*  RU  XO(NF)  VECTORS OF VARIABLES DIFFERENCE. */
31 /*  RI  GO(NF)  GRADIENTS DIFFERENCE. */
32 /*  RA  UO(NF)  AUXILIARY VECTOR. */
33 /*  RA  VO(NF)  AUXILIARY VECTOR. */
34 /*  RI  XMAX  MAXIMUM STEPSIZE. */
35 /*  RI  TOLX  TOLERANCE FOR CHANGE OF VARIABLES. */
36 /*  RI  TOLF  TOLERANCE FOR CHANGE OF FUNCTION VALUES. */
37 /*  RI  TOLB  TOLERANCE FOR THE FUNCTION VALUE. */
38 /*  RI  TOLG  TOLERANCE FOR THE GRADIENT NORM. */
39 /*  RI  MINF_EST  ESTIMATION OF THE MINIMUM FUNCTION VALUE. */
40 /*  RO  GMAX  MAXIMUM PARTIAL DERIVATIVE. */
41 /*  RO  F  VALUE OF THE OBJECTIVE FUNCTION. */
42 /*  II  MIT  MAXIMUM NUMBER OF ITERATIONS. */
43 /*  II  MFV  MAXIMUM NUMBER OF FUNCTION EVALUATIONS. */
44 /*  II  IEST  ESTIMATION INDICATOR. IEST=0-MINIMUM IS NOT ESTIMATED. */
45 /*         IEST=1-MINIMUM IS ESTIMATED BY THE VALUE MINF_EST. */
46 /*  II  MF  NUMBER OF LIMITED MEMORY STEPS. */
47 /*  IO  ITERM  VARIABLE THAT INDICATES THE CAUSE OF TERMINATION. */
48 /*         ITERM=1-IF ABS(X-XO) WAS LESS THAN OR EQUAL TO TOLX IN */
49 /*                   MTESX (USUALLY TWO) SUBSEQUEBT ITERATIONS. */
50 /*         ITERM=2-IF ABS(F-FO) WAS LESS THAN OR EQUAL TO TOLF IN */
51 /*                   MTESF (USUALLY TWO) SUBSEQUEBT ITERATIONS. */
52 /*         ITERM=3-IF F IS LESS THAN OR EQUAL TO TOLB. */
53 /*         ITERM=4-IF GMAX IS LESS THAN OR EQUAL TO TOLG. */
54 /*         ITERM=6-IF THE TERMINATION CRITERION WAS NOT SATISFIED, */
55 /*                   BUT THE SOLUTION OBTAINED IS PROBABLY ACCEPTABLE. */
56 /*         ITERM=11-IF NIT EXCEEDED MIT. ITERM=12-IF NFV EXCEEDED MFV. */
57 /*         ITERM=13-IF NFG EXCEEDED MFG. ITERM<0-IF THE METHOD FAILED. */
58
59 /* VARIABLES IN COMMON /STAT/ (STATISTICS) : */
60 /*  IO  NRES  NUMBER OF RESTARTS. */
61 /*  IO  NDEC  NUMBER OF MATRIX DECOMPOSITION. */
62 /*  IO  NIN  NUMBER OF INNER ITERATIONS. */
63 /*  IO  NIT  NUMBER OF ITERATIONS. */
64 /*  IO  NFV  NUMBER OF FUNCTION EVALUATIONS. */
65 /*  IO  NFG  NUMBER OF GRADIENT EVALUATIONS. */
66 /*  IO  NFH  NUMBER OF HESSIAN EVALUATIONS. */
67
68 /* SUBPROGRAMS USED : */
69 /*  S   PCBS04  ELIMINATION OF BOX CONSTRAINT VIOLATIONS. */
70 /*  S   PS1L01  STEPSIZE SELECTION USING LINE SEARCH. */
71 /*  S   PYADC0  ADDITION OF A BOX CONSTRAINT. */
72 /*  S   PYFUT1  TEST ON TERMINATION. */
73 /*  S   PYRMC0  DELETION OF A BOX CONSTRAINT. */
74 /*  S   PYTRCD  COMPUTATION OF PROJECTED DIFFERENCES FOR THE VARIABLE METRIC */
75 /*         UPDATE. */
76 /*  S   PYTRCG  COMPUTATION OF THE PROJECTED GRADIENT. */
77 /*  S   PYTRCS  COMPUTATION OF THE PROJECTED DIRECTION VECTOR. */
78 /*  S   MXDRCB BACKWARD PART OF THE STRANG FORMULA FOR PREMULTIPLICATION */
79 /*         OF THE VECTOR X BY AN IMPLICIT BFGS UPDATE. */
80 /*  S   MXDRCF FORWARD PART OF THE STRANG FORMULA FOR PREMULTIPLICATION */
81 /*         OF THE VECTOR X BY AN IMPLICIT BFGS UPDATE. */
82 /*  S   MXDRSU SHIFT OF COLUMNS OF THE RECTANGULAR MATRICES A AND B. */
83 /*         SHIFT OF ELEMENTS OF THE VECTOR U. THESE SHIFTS ARE USED IN */
84 /*         THE LIMITED MEMORY BFGS METHOD. */
85 /*  S   MXUDIR  VECTOR AUGMENTED BY THE SCALED VECTOR. */
86 /*  RF  MXUDOT  DOT PRODUCT OF TWO VECTORS. */
87 /*  S   MXUNEG  COPYING OF A VECTOR WITH CHANGE OF THE SIGN. */
88 /*  S   MXVCOP  COPYING OF A VECTOR. */
89 /*  S   MXVSCL  SCALING OF A VECTOR. */
90
91 /* EXTERNAL SUBROUTINES : */
92 /*  SE  OBJ  COMPUTATION OF THE VALUE OF THE OBJECTIVE FUNCTION. */
93 /*         CALLING SEQUENCE: CALL OBJ(NF,X,FF) WHERE NF IS THE NUMBER */
94 /*         OF VARIABLES, X(NF) IS THE VECTOR OF VARIABLES AND FF IS */
95 /*         THE VALUE OF THE OBJECTIVE FUNCTION. */
96 /*  SE  DOBJ  COMPUTATION OF THE GRADIENT OF THE OBJECTIVE FUNCTION. */
97 /*         CALLING SEQUENCE: CALL DOBJ(NF,X,GF) WHERE NF IS THE NUMBER */
98 /*         OF VARIABLES, X(NF) IS THE VECTOR OF VARIABLES AND GF(NF) */
99 /*         IS THE GRADIENT OF THE OBJECTIVE FUNCTION. */
100 /* -- OBJ and DOBJ are replaced by a single function, objgrad, in NLopt */
101
102 /* METHOD : */
103 /* LIMITED MEMORY VARIABLE METRIC METHOD BASED ON THE STRANG */
104 /* RECURRENCES. */
105
106 static void plis_(int *nf, int *nb, double *x, int *
107                   ix, double *xl, double *xu, double *gf, double *s, 
108                   double *xo, double *go, double *uo, double *vo, 
109                   double *xmax, double *tolx, double *tolf, double *
110                   tolb, double *tolg, nlopt_stopping *stop,
111                   double *minf_est, double *gmax, 
112                   double *f, int *mit, int *mfv, int *iest, int *mf,
113                   int *iterm, stat_common *stat_1,
114                   nlopt_func objgrad, void *objgrad_data)
115 {
116     /* System generated locals */
117     int i__1;
118     double d__1, d__2;
119
120     /* Builtin functions */
121
122     /* Local variables */
123     double a, b;
124     int i__, k, n;
125     double p, r__;
126     int kd, ld;
127     double fo, fp, po, pp, ro, rp;
128     int kbf, mfg;
129     int mes, kit;
130     double alf1, alf2, eta0, eta9, par1, par2;
131     int mes1, mes2, mes3;
132     double eps8, eps9;
133     int mred, iold, nred;
134     double maxf, dmax__;
135     int inew;
136     double told;
137     int ites;
138     double rmin, rmax, umax, tolp, tols;
139     int isys;
140     int ires1, ires2;
141     int iterd, mtesf, ntesf;
142     double gnorm;
143     int iters, irest, inits, kters, maxst;
144     double snorm;
145     int mtesx, ntesx;
146
147 /*     INITIATION */
148
149     /* Parameter adjustments */
150     --vo;
151     --uo;
152     --go;
153     --xo;
154     --s;
155     --gf;
156     --xu;
157     --xl;
158     --ix;
159     --x;
160
161     /* Function Body */
162     kbf = 0;
163     if (*nb > 0) {
164         kbf = 2;
165     }
166     stat_1->nres = 0;
167     stat_1->ndec = 0;
168     stat_1->nin = 0;
169     stat_1->nit = 0;
170     stat_1->nfg = 0;
171     stat_1->nfh = 0;
172     isys = 0;
173     ites = 1;
174     mtesx = 2;
175     mtesf = 2;
176     inits = 2;
177     *iterm = 0;
178     iterd = 0;
179     iters = 2;
180     kters = 3;
181     irest = 0;
182     ires1 = 999;
183     ires2 = 0;
184     mred = 10;
185     mes = 4;
186     mes1 = 2;
187     mes2 = 2;
188     mes3 = 2;
189     eta0 = 1e-15;
190     eta9 = 1e120;
191     eps8 = 1.;
192     eps9 = 1e-8;
193     alf1 = 1e-10;
194     alf2 = 1e10;
195     rmax = eta9;
196     dmax__ = eta9;
197     maxf = 1e20;
198     if (*iest <= 0) {
199          *minf_est = -HUGE_VAL; /* changed from -1e60 by SGJ */
200     }
201     if (*iest > 0) {
202         *iest = 1;
203     }
204     if (*xmax <= 0.) {
205         *xmax = 1e16;
206     }
207     if (*tolx <= 0.) {
208         *tolx = 1e-16;
209     }
210     if (*tolf <= 0.) {
211         *tolf = 1e-14;
212     }
213     if (*tolg <= 0.) {
214          *tolg = 1e-8; /* SGJ: was 1e-6, but this sometimes stops too soon */
215     }
216 #if 0
217     /* removed by SGJ: this check prevented us from using minf_max <= 0,
218        which doesn't make sense.  Instead, if you don't want to have a
219        lower limit, you should set minf_max = -HUGE_VAL */
220     if (*tolb <= 0.) {
221         *tolb = *minf_est + 1e-16;
222     }
223 #endif
224     told = 1e-4;
225     tols = 1e-4;
226     tolp = .8;
227     /* changed by SGJ: default is no limit (INT_MAX) on # iterations/fevals */
228     if (*mit <= 0) {
229         *mit = INT_MAX;
230     }
231     if (*mfv <= 0) {
232         *mfv = INT_MAX;
233     }
234     mfg = *mfv;
235     kd = 1;
236     ld = -1;
237     kit = -(ires1 * *nf + ires2);
238     fo = *minf_est;
239
240 /*     INITIAL OPERATIONS WITH SIMPLE BOUNDS */
241
242     if (kbf > 0) {
243         i__1 = *nf;
244         for (i__ = 1; i__ <= i__1; ++i__) {
245             if ((ix[i__] == 3 || ix[i__] == 4) && xu[i__] <= xl[i__]) {
246                 xu[i__] = xl[i__];
247                 ix[i__] = 5;
248             } else if (ix[i__] == 5 || ix[i__] == 6) {
249                 xl[i__] = x[i__];
250                 xu[i__] = x[i__];
251                 ix[i__] = 5;
252             }
253 /* L2: */
254         }
255         luksan_pcbs04__(nf, &x[1], &ix[1], &xl[1], &xu[1], &eps9, &kbf);
256         luksan_pyadc0__(nf, &n, &x[1], &ix[1], &xl[1], &xu[1], &inew);
257     }
258     if (*iterm != 0) {
259         goto L11190;
260     }
261     if (nlopt_stop_time(stop)) { *iterm = 100; goto L11190; }
262     *f = objgrad(*nf, &x[1], &gf[1], objgrad_data);
263     ++stop->nevals;
264     ++stat_1->nfg;
265 L11120:
266     luksan_pytrcg__(nf, nf, &ix[1], &gf[1], &umax, gmax, &kbf, &iold);
267     luksan_pyfut1__(nf, f, &fo, &umax, gmax, &dmax__, tolx, tolf, tolb, tolg, 
268             &kd, &stat_1->nit, &kit, mit, &stop->nevals, mfv, &stat_1->nfg, &mfg, 
269             &ntesx, &mtesx, &ntesf, &mtesf, &ites, &ires1, &ires2, &irest, &
270             iters, iterm);
271     if (*iterm != 0) {
272         goto L11190;
273     }
274     if (nlopt_stop_time(stop)) { *iterm = 100; goto L11190; }
275     if (kbf > 0 && rmax > 0.) {
276         luksan_pyrmc0__(nf, &n, &ix[1], &gf[1], &eps8, &umax, gmax, &rmax, &
277                 iold, &irest);
278     }
279 L11130:
280
281 /*     DIRECTION DETERMINATION */
282
283     gnorm = sqrt(luksan_mxudot__(nf, &gf[1], &gf[1], &ix[1], &kbf));
284     if (irest != 0) {
285         goto L12620;
286     }
287 /* Computing MIN */
288     i__1 = stat_1->nit - kit;
289     k = min(i__1,*mf);
290     if (k <= 0) {
291         irest = max(irest,1);
292         goto L12620;
293     }
294
295 /*     DETERMINATION OF THE PARAMETER B */
296
297     b = luksan_mxudot__(nf, &xo[1], &go[1], &ix[1], &kbf);
298     if (b <= 0.) {
299         irest = max(irest,1);
300         goto L12620;
301     }
302     uo[1] = 1. / b;
303     luksan_mxuneg__(nf, &gf[1], &s[1], &ix[1], &kbf);
304     luksan_mxdrcb__(nf, &k, &xo[1], &go[1], &uo[1], &vo[1], &s[1], &ix[1], &
305             kbf);
306     a = luksan_mxudot__(nf, &go[1], &go[1], &ix[1], &kbf);
307     if (a > 0.) {
308         d__1 = b / a;
309         luksan_mxvscl__(nf, &d__1, &s[1], &s[1]);
310     }
311     luksan_mxdrcf__(nf, &k, &xo[1], &go[1], &uo[1], &vo[1], &s[1], &ix[1], &
312             kbf);
313     snorm = sqrt(luksan_mxudot__(nf, &s[1], &s[1], &ix[1], &kbf));
314 /* Computing MIN */
315     i__1 = k + 1;
316     k = min(i__1,*mf);
317     luksan_mxdrsu__(nf, &k, &xo[1], &go[1], &uo[1]);
318 L12620:
319     iterd = 0;
320     if (irest != 0) {
321
322 /*     STEEPEST DESCENT DIRECTION */
323
324         luksan_mxuneg__(nf, &gf[1], &s[1], &ix[1], &kbf);
325         snorm = gnorm;
326         if (kit < stat_1->nit) {
327             ++stat_1->nres;
328             kit = stat_1->nit;
329         } else {
330              *iterm = -10;
331             if (iters < 0) {
332                 *iterm = iters - 5;
333             }
334         }
335     }
336
337 /*     TEST ON DESCENT DIRECTION AND PREPARATION OF LINE SEARCH */
338
339     if (kd > 0) {
340         p = luksan_mxudot__(nf, &gf[1], &s[1], &ix[1], &kbf);
341     }
342     if (iterd < 0) {
343         *iterm = iterd;
344     } else {
345
346 /*     TEST ON DESCENT DIRECTION */
347
348         if (snorm <= 0.) {
349             irest = max(irest,1);
350         } else if (p + told * gnorm * snorm <= 0.) {
351             irest = 0;
352         } else {
353
354 /*     UNIFORM DESCENT CRITERION */
355
356             irest = max(irest,1);
357         }
358         if (irest == 0) {
359
360 /*     PREPARATION OF LINE SEARCH */
361
362             nred = 0;
363             rmin = alf1 * gnorm / snorm;
364 /* Computing MIN */
365             d__1 = alf2 * gnorm / snorm, d__2 = *xmax / snorm;
366             rmax = min(d__1,d__2);
367         }
368     }
369     if (*iterm != 0) {
370         goto L11190;
371     }
372     if (nlopt_stop_time(stop)) { *iterm = 100; goto L11190; }
373     if (irest != 0) {
374         goto L11130;
375     }
376     luksan_pytrcs__(nf, &x[1], &ix[1], &xo[1], &xl[1], &xu[1], &gf[1], &go[1],
377              &s[1], &ro, &fp, &fo, f, &po, &p, &rmax, &eta9, &kbf);
378     if (rmax == 0.) {
379         goto L11175;
380     }
381 L11170:
382     luksan_ps1l01__(&r__, &rp, f, &fo, &fp, &p, &po, &pp, minf_est, &maxf, &rmin, 
383             &rmax, &tols, &tolp, &par1, &par2, &kd, &ld, &stat_1->nit, &kit, &
384             nred, &mred, &maxst, iest, &inits, &iters, &kters, &mes, &isys);
385     if (isys == 0) {
386         goto L11174;
387     }
388     luksan_mxudir__(nf, &r__, &s[1], &xo[1], &x[1], &ix[1], &kbf);
389     luksan_pcbs04__(nf, &x[1], &ix[1], &xl[1], &xu[1], &eps9, &kbf);
390     *f = objgrad(*nf, &x[1], &gf[1], objgrad_data);
391     ++stop->nevals;
392     ++stat_1->nfg;
393     p = luksan_mxudot__(nf, &gf[1], &s[1], &ix[1], &kbf);
394     goto L11170;
395 L11174:
396     if (iters <= 0) {
397         r__ = 0.;
398         *f = fo;
399         p = po;
400         luksan_mxvcop__(nf, &xo[1], &x[1]);
401         luksan_mxvcop__(nf, &go[1], &gf[1]);
402         irest = max(irest,1);
403         ld = kd;
404         goto L11130;
405     }
406     luksan_pytrcd__(nf, &x[1], &ix[1], &xo[1], &gf[1], &go[1], &r__, f, &fo, &
407             p, &po, &dmax__, &kbf, &kd, &ld, &iters);
408 L11175:
409     if (kbf > 0) {
410         luksan_mxvine__(nf, &ix[1]);
411         luksan_pyadc0__(nf, &n, &x[1], &ix[1], &xl[1], &xu[1], &inew);
412     }
413     goto L11120;
414 L11190:
415     return;
416 } /* plis_ */
417
418 /* number of double variables that can be stored in scratch memory
419    ... it's >= 2007, and this is in the context of scientific computation,
420    so assume that at least 10M are available, and that sizeof(double)==8 */
421 #define MEMAVAIL 1310720
422
423 /* NLopt wrapper around plis_, handling dynamic allocation etc. */
424 nlopt_result luksan_plis(int n, nlopt_func f, void *f_data,
425                   const double *lb, const double *ub, /* bounds */
426                   double *x, /* in: initial guess, out: minimizer */
427                   double *minf,
428                   nlopt_stopping *stop)
429 {
430      int i, *ix;
431      double *work, *xl, *xu, *xo, *gf, *s, *go, *uo, *vo;
432      double gmax, minf_est;
433      double xmax = 0; /* no maximum */
434      double tolg = 0; /* default gradient tolerance */
435      int iest = 0; /* we have no estimate of min function value */
436      int mit = 0; /* default no limit on #iterations */
437      int mfv = stop->maxeval;
438      stat_common stat;
439      int iterm;
440      int mf;
441
442      ix = (int*) malloc(sizeof(int) * n);
443      if (!ix) return NLOPT_OUT_OF_MEMORY;
444
445      /* FIXME: what should we set mf to?  The example program tlis.for
446         sets it to zero as far as I can tell, but it seems to greatly
447         improve convergence to make it > 0.  The computation time
448         per iteration, and of course the memory, seem to go as O(n * mf),
449         and we'll assume that the main limiting factor is the memory.
450         We'll assume that at least MEMAVAIL memory, or 4*n memory, whichever
451         is bigger, is available. */
452      mf = max(MEMAVAIL/n, 4);
453      if (stop->maxeval && stop->maxeval <= mf)
454           mf = max(stop->maxeval - 5, 1); /* mf > maxeval seems not good */
455
456  retry_alloc:
457      work = (double*) malloc(sizeof(double) * (n * 4 + max(n,n*mf)*2 + 
458                                                max(n,mf)*2));
459      if (!work) { 
460           if (mf > 0) {
461                mf /= 4;
462                goto retry_alloc;
463           }
464           free(ix);
465           return NLOPT_OUT_OF_MEMORY;
466      }
467
468      xl = work; xu = xl + n; gf = xu + n; s = gf + n; 
469      xo = s + n; go = xo + max(n,n*mf);
470      uo = go + max(n,n*mf); vo = uo + max(n,mf);
471
472      for (i = 0; i < n; ++i) {
473           int lbu = lb[i] <= -0.99 * HUGE_VAL; /* lb unbounded */
474           int ubu = ub[i] >= 0.99 * HUGE_VAL;  /* ub unbounded */
475           ix[i] = lbu ? (ubu ? 0 : 2) : (ubu ? 1 : (lb[i] == ub[i] ? 5 : 3));
476           xl[i] = lb[i];
477           xu[i] = ub[i];
478      }
479
480      /* ?  xo does not seem to be initialized in the
481         original Fortran code, but it is used upon
482         input to plis if mf > 0 ... perhaps ALLOCATE initializes
483         arrays to zero by default? */
484      memset(xo, 0, sizeof(double) * max(n,n*mf));
485
486      plis_(&n, &n, x, ix, xl, xu, 
487            gf, s, xo, go, uo, vo,
488            &xmax,
489
490            /* fixme: pass tol_rel and tol_abs and use NLopt check */
491            &stop->xtol_rel,
492            &stop->ftol_rel,
493            &stop->minf_max,
494            &tolg,
495            stop,
496
497            &minf_est, &gmax,
498            minf,
499            &mit, &mfv,
500            &iest,
501            &mf,
502            &iterm, &stat,
503            f, f_data);
504
505      free(work);
506      free(ix);
507
508      switch (iterm) {
509          case 1: return NLOPT_XTOL_REACHED;
510          case 2: return NLOPT_FTOL_REACHED;
511          case 3: return NLOPT_MINF_MAX_REACHED;
512          case 4: return NLOPT_SUCCESS; /* gradient tolerance reached */
513          case 6: return NLOPT_SUCCESS;
514          case 12: case 13: return NLOPT_MAXEVAL_REACHED;
515          default: return NLOPT_FAILURE;
516      }
517 }