chiark / gitweb /
src/utilities.lisp, src/class-finalize-impl.lisp: Add `find-duplicates'.
[sod] / src / utilities.lisp
1 ;;; -*-lisp-*-
2 ;;;
3 ;;; Various handy utilities
4 ;;;
5 ;;; (c) 2009 Straylight/Edgeware
6 ;;;
7
8 ;;;----- Licensing notice ---------------------------------------------------
9 ;;;
10 ;;; This file is part of the Sensible Object Design, an object system for C.
11 ;;;
12 ;;; SOD is free software; you can redistribute it and/or modify
13 ;;; it under the terms of the GNU General Public License as published by
14 ;;; the Free Software Foundation; either version 2 of the License, or
15 ;;; (at your option) any later version.
16 ;;;
17 ;;; SOD is distributed in the hope that it will be useful,
18 ;;; but WITHOUT ANY WARRANTY; without even the implied warranty of
19 ;;; MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
20 ;;; GNU General Public License for more details.
21 ;;;
22 ;;; You should have received a copy of the GNU General Public License
23 ;;; along with SOD; if not, write to the Free Software Foundation,
24 ;;; Inc., 59 Temple Place - Suite 330, Boston, MA 02111-1307, USA.
25
26 (cl:defpackage #:sod-utilities
27   (:use #:common-lisp
28
29         ;; MOP from somewhere.
30         #+sbcl #:sb-mop
31         #+(or cmu clisp) #:mop
32         #+ecl #:clos))
33
34 (cl:in-package #:sod-utilities)
35
36 ;;;--------------------------------------------------------------------------
37 ;;; Macro hacks.
38
39 (export 'with-gensyms)
40 (defmacro with-gensyms ((&rest binds) &body body)
41   "Evaluate BODY with variables bound to fresh symbols.
42
43    The BINDS are a list of entries (VAR [NAME]), and a singleton list can be
44    replaced by just a symbol; each VAR is bound to a fresh symbol generated
45    by (gensym NAME), where NAME defaults to the symbol-name of VAR."
46   `(let (,@(mapcar (lambda (bind)
47                      (multiple-value-bind (var name)
48                          (if (atom bind)
49                              (values bind (concatenate 'string
50                                            (symbol-name bind) "-"))
51                              (destructuring-bind
52                                  (var &optional
53                                       (name (concatenate 'string
54                                              (symbol-name var) "-")))
55                                  bind
56                                (values var name)))
57                        `(,var (gensym ,name))))
58                    binds))
59      ,@body))
60
61 (eval-when (:compile-toplevel :load-toplevel :execute)
62   (defun strip-quote (form)
63     "If FORM looks like (quote FOO) for self-evaluating FOO, return FOO.
64
65    If FORM is a symbol whose constant value is `nil' then return `nil'.
66    Otherwise return FORM unchanged.  This makes it easier to inspect constant
67    things.  This is a utility for `once-only'."
68
69     (cond ((and (consp form)
70                 (eq (car form) 'quote)
71                 (cdr form)
72                 (null (cddr form)))
73            (let ((body (cadr form)))
74              (if (or (not (or (consp body) (symbolp body)))
75                      (member body '(t nil))
76                      (keywordp body))
77                  body
78                  form)))
79           ((and (symbolp form) (boundp form) (null (symbol-value form)))
80            nil)
81           (t
82            form))))
83
84 (export 'once-only)
85 (defmacro once-only ((&rest binds) &body body)
86   "Macro helper for preventing repeated evaluation.
87
88    The syntax is actually hairier than shown:
89
90         once-only ( [[ :environment ENV ]] { VAR | (VAR [VALUE-FORM]) }* )
91           { FORM }*
92
93    So, the BINDS are a list of entries (VAR [VALUE-FORM]); a singleton list
94    can be replaced by just a symbol VAR, and the VALUE-FORM defaults to VAR.
95    But before them you can have keyword arguments.  Only one is defined so
96    far.  See below for the crazy things that does.
97
98    The result of evaluating a ONCE-ONLY form is a form with the structure
99
100         (let ((#:GS1 VALUE-FORM1)
101               ...
102               (#:GSn VALUE-FORMn))
103           STUFF)
104
105    where STUFF is the value of the BODY forms, as an implicit progn, in an
106    environment with the VARs bound to the corresponding gensyms.
107
108    As additional magic, if any of the VALUE-FORMs is actually constant (as
109    determined by inspection, and aided by `constantp' if an :environment is
110    supplied, then no gensym is constructed for it, and the VAR is bound
111    directly to the constant form.  Moreover, if the constant form looks like
112    (quote FOO) for a self-evaluating FOO then the outer layer of quoting is
113    stripped away."
114
115   ;; We need an extra layer of gensyms in our expansion: we'll want the
116   ;; expansion to examine the various VALUE-FORMs to find out whether they're
117   ;; constant without evaluating them repeatedly.  This also helps with
118   ;; another problem: we explicitly encourage the rebinding of a VAR
119   ;; (probably a macro argument) to a gensym which will be bound to the value
120   ;; of the form previously held in VAR itself -- so the gensym and value
121   ;; form must exist at the same time and we need two distinct variables.
122
123   (with-gensyms ((envvar "ENV-") lets sym (bodyfunc "BODY-"))
124     (let ((env nil))
125
126       ;; First things first: let's pick up the keywords.
127       (loop
128         (unless (and binds (keywordp (car binds)))
129           (return))
130         (ecase (pop binds)
131           (:environment (setf env (pop binds)))))
132
133       ;; Now we'll investigate the bindings.  Turn each one into a list (VAR
134       ;; VALUE-FORM TEMP) where TEMP is an appropriate gensym -- see the note
135       ;; above.
136       (let ((canon (mapcar (lambda (bind)
137                              (multiple-value-bind (var form)
138                                  (if (atom bind)
139                                      (values bind bind)
140                                      (destructuring-bind
141                                          (var &optional (form var)) bind
142                                        (values var form)))
143                                (list var form
144                                      (gensym (format nil "T-~A-"
145                                                      (symbol-name var))))))
146                            binds)))
147
148         `(let* (,@(and env `((,envvar ,env)))
149                 (,lets nil)
150                 ,@(mapcar (lambda (bind)
151                             (destructuring-bind (var form temp) bind
152                               (declare (ignore var))
153                               `(,temp ,form)))
154                           canon)
155                 ,@(mapcar (lambda (bind)
156                             (destructuring-bind (var form temp) bind
157                               (declare (ignore form))
158                               `(,var
159                                 (cond ((constantp ,temp
160                                                   ,@(and env `(,envvar)))
161                                        (strip-quote ,temp))
162                                       ((symbolp ,temp)
163                                        ,temp)
164                                       (t
165                                        (let ((,sym (gensym
166                                                     ,(concatenate 'string
167                                                       (symbol-name var)
168                                                       "-"))))
169                                          (push (list ,sym ,temp) ,lets)
170                                          ,sym))))))
171                           canon))
172            (flet ((,bodyfunc () ,@body))
173              (if ,lets
174                  `(let (,@(nreverse ,lets)) ,(,bodyfunc))
175                  (,bodyfunc))))))))
176
177 (export 'parse-body)
178 (defun parse-body (body &key (docp t) (declp t))
179   "Parse the BODY into a docstring, declarations and the body forms.
180
181    These are returned as three lists, so that they can be spliced into a
182    macro expansion easily.  The declarations are consolidated into a single
183    `declare' form.  If DOCP is nil then a docstring is not permitted; if
184    DECLP is nil, then declarations are not permitted."
185   (let ((decls nil)
186         (doc nil))
187     (loop
188       (cond ((null body) (return))
189             ((and declp (consp (car body)) (eq (caar body) 'declare))
190              (setf decls (append decls (cdr (pop body)))))
191             ((and docp (stringp (car body)) (not doc) (cdr body))
192              (setf doc (pop body)))
193             (t (return))))
194     (values (and doc (list doc))
195             (and decls (list (cons 'declare decls)))
196             body)))
197
198 ;;;--------------------------------------------------------------------------
199 ;;; Locatives.
200
201 (export '(loc locp))
202 (defstruct (loc (:predicate locp) (:constructor make-loc (reader writer)))
203   "Locative data type.  See `locf' and `ref'."
204   (reader nil :type function)
205   (writer nil :type function))
206
207 (export 'locf)
208 (defmacro locf (place &environment env)
209   "Slightly cheesy locatives.
210
211    (locf PLACE) returns an object which, using the `ref' function, can be
212    used to read or set the value of PLACE.  It's cheesy because it uses
213    closures rather than actually taking the address of something.  Also,
214    unlike Zetalisp, we don't overload `car' to do our dirty work."
215   (multiple-value-bind
216       (valtmps valforms newtmps setform getform)
217       (get-setf-expansion place env)
218     `(let* (,@(mapcar #'list valtmps valforms))
219        (make-loc (lambda () ,getform)
220                  (lambda (,@newtmps) ,setform)))))
221
222 (export 'ref)
223 (declaim (inline ref (setf ref)))
224 (defun ref (loc)
225   "Fetch the value referred to by a locative."
226   (funcall (loc-reader loc)))
227 (defun (setf ref) (new loc)
228   "Store a new value in the place referred to by a locative."
229   (funcall (loc-writer loc) new))
230
231 (export 'with-locatives)
232 (defmacro with-locatives (locs &body body)
233   "Evaluate BODY with implicit locatives.
234
235    LOCS is a list of items of the form (SYM [LOC-EXPR]), where SYM is a
236    symbol and LOC-EXPR evaluates to a locative.  If LOC-EXPR is omitted, it
237    defaults to SYM.  As an abbreviation for a common case, LOCS may be a
238    symbol instead of a list.
239
240    The BODY is evaluated in an environment where each SYM is a symbol macro
241    which expands to (ref LOC-EXPR) -- or, in fact, something similar which
242    doesn't break if LOC-EXPR has side-effects.  Thus, references, including
243    `setf' forms, fetch or modify the thing referred to by the LOC-EXPR.
244    Useful for covering over where something uses a locative."
245   (setf locs (mapcar (lambda (item)
246                        (cond ((atom item) (list item item))
247                              ((null (cdr item)) (list (car item) (car item)))
248                              (t item)))
249                      (if (listp locs) locs (list locs))))
250   (let ((tt (mapcar (lambda (l) (declare (ignore l)) (gensym)) locs))
251         (ll (mapcar #'cadr locs))
252         (ss (mapcar #'car locs)))
253     `(let (,@(mapcar (lambda (tmp loc) `(,tmp ,loc)) tt ll))
254        (symbol-macrolet (,@(mapcar (lambda (sym tmp)
255                                      `(,sym (ref ,tmp))) ss tt))
256          ,@body))))
257
258 ;;;--------------------------------------------------------------------------
259 ;;; Anaphorics.
260
261 (export 'it)
262
263 (export 'aif)
264 (defmacro aif (cond cons &optional (alt nil altp))
265   "If COND is not nil, evaluate CONS with `it' bound to the value of COND.
266
267    Otherwise, if given, evaluate ALT; `it' isn't bound in ALT."
268   (once-only (cond)
269     `(if ,cond (let ((it ,cond)) ,cons) ,@(and altp `(,alt)))))
270
271 (export 'awhen)
272 (defmacro awhen (cond &body body)
273   "If COND, evaluate BODY as a progn with `it' bound to the value of COND."
274   `(let ((it ,cond)) (when it ,@body)))
275
276 (export 'aand)
277 (defmacro aand (&rest forms)
278   "Like `and', but anaphoric.
279
280    Each FORM except the first is evaluated with `it' bound to the value of
281    the previous one.  If there are no forms, then the result it `t'; if there
282    is exactly one, then wrapping it in `aand' is pointless."
283   (labels ((doit (first rest)
284              (if (null rest)
285                  first
286                  `(let ((it ,first))
287                     (if it ,(doit (car rest) (cdr rest)) nil)))))
288     (if (null forms)
289         't
290         (doit (car forms) (cdr forms)))))
291
292 (export 'acond)
293 (defmacro acond (&body clauses &environment env)
294   "Like COND, but with `it' bound to the value of the condition.
295
296    Each of the CLAUSES has the form (CONDITION FORM*); if a CONDITION is
297    non-nil then evaluate the FORMs with `it' bound to the non-nil value, and
298    return the value of the last FORM; if there are no FORMs, then return `it'
299    itself.  If the CONDITION is nil then continue with the next clause; if
300    all clauses evaluate to nil then the result is nil."
301   (labels ((walk (clauses)
302              (if (null clauses)
303                  `nil
304                  (once-only (:environment env (cond (caar clauses)))
305                    (if (and (constantp cond)
306                             (if (and (consp cond) (eq (car cond) 'quote))
307                                 (cadr cond) cond))
308                        (if (cdar clauses)
309                            `(let ((it ,cond))
310                               (declare (ignorable it))
311                               ,@(cdar clauses))
312                            cond)
313                        `(if ,cond
314                             ,(if (cdar clauses)
315                                  `(let ((it ,cond))
316                                     (declare (ignorable it))
317                                     ,@(cdar clauses))
318                                  cond)
319                             ,(walk (cdr clauses))))))))
320     (walk clauses)))
321
322 (export '(acase aecase atypecase aetypecase))
323 (defmacro acase (value &body clauses)
324   `(let ((it ,value)) (case it ,@clauses)))
325 (defmacro aecase (value &body clauses)
326   `(let ((it ,value)) (ecase it ,@clauses)))
327 (defmacro atypecase (value &body clauses)
328   `(let ((it ,value)) (typecase it ,@clauses)))
329 (defmacro aetypecase (value &body clauses)
330   `(let ((it ,value)) (etypecase it ,@clauses)))
331
332 (export 'asetf)
333 (defmacro asetf (&rest places-and-values &environment env)
334   "Anaphoric update of places.
335
336    The PLACES-AND-VALUES are alternating PLACEs and VALUEs.  Each VALUE is
337    evaluated with IT bound to the current value stored in the corresponding
338    PLACE."
339   `(progn ,@(loop for (place value) on places-and-values by #'cddr
340                   collect (multiple-value-bind
341                               (temps inits newtemps setform getform)
342                               (get-setf-expansion place env)
343                             `(let* (,@(mapcar #'list temps inits)
344                                     (it ,getform))
345                                (multiple-value-bind ,newtemps ,value
346                                  ,setform))))))
347
348 ;;;--------------------------------------------------------------------------
349 ;;; MOP hacks (not terribly demanding).
350
351 (export 'instance-initargs)
352 (defgeneric instance-initargs (instance)
353   (:documentation
354    "Return a plausble list of initargs for INSTANCE.
355
356    The idea is that you can make a copy of INSTANCE by invoking
357
358         (apply #'make-instance (class-of INSTANCE)
359                (instance-initargs INSTANCE))
360
361    The default implementation works by inspecting the slot definitions and
362    extracting suitable initargs, so this will only succeed if enough slots
363    actually have initargs specified that `initialize-instance' can fill in
364    the rest correctly.
365
366    The list returned is freshly consed, and you can destroy it if you like.")
367   (:method ((instance standard-object))
368     (mapcan (lambda (slot)
369               (aif (slot-definition-initargs slot)
370                    (list (car it)
371                          (slot-value instance (slot-definition-name slot)))
372                    nil))
373             (class-slots (class-of instance)))))
374
375 (export '(copy-instance copy-instance-using-class))
376 (defgeneric copy-instance-using-class (class instance &rest initargs)
377   (:documentation
378    "Metaobject protocol hook for `copy-instance'.")
379   (:method ((class standard-class) instance &rest initargs)
380     (let ((copy (allocate-instance class)))
381       (dolist (slot (class-slots class))
382         (let ((name (slot-definition-name slot)))
383           (when (slot-boundp instance name)
384             (setf (slot-value copy name) (slot-value instance name)))))
385       (apply #'shared-initialize copy nil initargs))))
386 (defun copy-instance (object &rest initargs)
387   "Construct and return a copy of OBJECT.
388
389    The new object has the same class as OBJECT, and the same slot values
390    except where overridden by INITARGS."
391   (apply #'copy-instance-using-class (class-of object) object initargs))
392
393 (export '(generic-function-methods method-specializers
394           eql-specializer eql-specializer-object))
395
396 ;;;--------------------------------------------------------------------------
397 ;;; List utilities.
398
399 (export 'make-list-builder)
400 (defun make-list-builder (&optional initial)
401   "Return a simple list builder."
402
403   ;; The `builder' is just a cons cell whose cdr will be the list that's
404   ;; wanted.  Effectively, then, we have a list that's one item longer than
405   ;; we actually want.  The car of this extra initial cons cell is always the
406   ;; last cons in the list -- which is now well defined because there's
407   ;; always at least one.
408
409   (let ((builder (cons nil initial)))
410     (setf (car builder) (last builder))
411     builder))
412
413 (export 'lbuild-add)
414 (defun lbuild-add (builder item)
415   "Add an ITEM to the end of a list BUILDER."
416   (let ((new (cons item nil)))
417     (setf (cdar builder) new
418           (car builder) new))
419   builder)
420
421 (export 'lbuild-add-list)
422 (defun lbuild-add-list (builder list)
423   "Add a LIST to the end of a list BUILDER.  The LIST will be clobbered."
424   (when list
425     (setf (cdar builder) list
426           (car builder) (last list)))
427   builder)
428
429 (export 'lbuild-list)
430 (defun lbuild-list (builder)
431   "Return the constructed list."
432   (cdr builder))
433
434 (export 'mappend)
435 (defun mappend (function list &rest more-lists)
436   "Like a nondestructive `mapcan'.
437
438    Map FUNCTION over the the corresponding elements of LIST and MORE-LISTS,
439    and return the result of appending all of the resulting lists."
440   (reduce #'append (apply #'mapcar function list more-lists) :from-end t))
441
442 (export 'distinguished-point-shortest-paths)
443 (defun distinguished-point-shortest-paths (root neighbours-func)
444   "Moderately efficient shortest-paths-from-root computation.
445
446    The ROOT is a distinguished vertex in a graph.  The NEIGHBOURS-FUNC
447    accepts a VERTEX as its only argument, and returns a list of conses (V .
448    C) for each of the VERTEX's neighbours, indicating that there is an edge
449    from VERTEX to V, with cost C.
450
451    The return value is a list of entries (COST . REV-PATH) for each vertex
452    reachable from the ROOT; the COST is the total cost of the shortest path,
453    and REV-PATH is the path from the ROOT, in reverse order -- so the first
454    element is the vertex itself and the last element is the ROOT.
455
456    The NEIGHBOURS-FUNC is called at most N times, and may take O(N) time to
457    produce its output list.  The computation as a whole takes O(N^2) time,
458    where N is the number of vertices in the graph, assuming there is at most
459    one edge between any pair of vertices."
460
461   ;; This is a listish version of Dijkstra's shortest-path algorithm.  It
462   ;; could be made more efficient by using a fancy priority queue rather than
463   ;; a linear search for finding the nearest live element (see below), but it
464   ;; still runs pretty well.
465
466   (let ((map (make-hash-table))
467         (dead nil)
468         (live (list (list 0 root))))
469     (setf (gethash root map) (cons :live (car live)))
470     (loop
471       ;; The dead list contains a record, in output format (COST . PATH), for
472       ;; each vertex whose shortest path has been finally decided.  The live
473       ;; list contains a record for the vertices of current interest, also in
474       ;; output format; the COST for a live record shows the best cost for a
475       ;; path using only dead vertices.
476       ;;
477       ;; Each time through here, we pull an item off the live list and
478       ;; push it onto the dead list, so we do at most N iterations total.
479
480       ;; If there are no more live items, then we're done; the remaining
481       ;; vertices, if any, are unreachable from the ROOT.
482       (when (null live) (return))
483
484       ;; Find the closest live vertex to the root.  The linear scan through
485       ;; the live list costs at most N time.
486       (let* ((best (reduce (lambda (x y) (if (< (car x) (car y)) x y)) live))
487              (best-cost (car best))
488              (best-path (cdr best))
489              (best-vertex (car best-path)))
490
491         ;; Remove the chosen vertex from the LIVE list, and add the
492         ;; appropriate record to the dead list.  We must have the shortest
493         ;; path to this vertex now: we have the shortest path using currently
494         ;; dead vertices; any other path must use at least one live vertex,
495         ;; and, by construction, the path through any such vertex must be
496         ;; further than the path we already have.
497         ;;
498         ;; Removal from the live list uses a linear scan which costs N time.
499         (setf live (delete best live))
500         (push best dead)
501         (setf (car (gethash best-vertex map)) :dead)
502
503         ;; Work through the chosen vertex's neighbours, adding each of them
504         ;; to the live list if they're not already there.  If a neighbour is
505         ;; already live, and we find a shorter path to it through our chosen
506         ;; vertex, then update the neighbour's record.
507         ;;
508         ;; The chosen vertex obviously has at most N neighbours.  There's no
509         ;; more looping in here, so performance is as claimed.
510         (dolist (neigh (funcall neighbours-func best-vertex))
511           (let* ((neigh-vertex (car neigh))
512                  (neigh-cost (+ best-cost (cdr neigh)))
513                  (neigh-record (gethash neigh-vertex map)))
514             (cond ((null neigh-record)
515                    ;; If the neighbour isn't known, then now's the time to
516                    ;; make a fresh live record for it.
517                    (let ((new-record (list* :live neigh-cost
518                                             neigh-vertex best-path)))
519                      (push (cdr new-record) live)
520                      (setf (gethash neigh-vertex map) new-record)))
521                   ((and (eq (car neigh-record) :live)
522                         (< neigh-cost (cadr neigh-record)))
523                    ;; If the neighbour is live, and we've found a better path
524                    ;; to it, then update its record.
525                    (setf (cadr neigh-record) neigh-cost
526                          (cdddr neigh-record) best-path)))))))
527     dead))
528
529 (export '(inconsistent-merge-error merge-error-candidates))
530 (define-condition inconsistent-merge-error (error)
531   ((candidates :initarg :candidates
532                :reader merge-error-candidates))
533   (:documentation
534    "Reports an inconsistency in the arguments passed to `merge-lists'.")
535   (:report (lambda (condition stream)
536              (format stream "Merge inconsistency: failed to decide between ~
537                              ~{~#[~;~A~;~A and ~A~:;~
538                                   ~@{~A, ~#[~;and ~A~]~}~]~}"
539                      (merge-error-candidates condition)))))
540
541 (export 'merge-lists)
542 (defun merge-lists (lists &key pick (test #'eql) (present #'identity))
543   "Return a merge of the given LISTS.
544
545    The resulting list contains the items of the given LISTS, with duplicates
546    removed.  The order of the resulting list is consistent with the orders of
547    the input LISTS in the sense that if A precedes B in some input list then
548    A will also precede B in the output list.  If the lists aren't consistent
549    (e.g., some list contains A followed by B, and another contains B followed
550    by A) then an error of type `inconsistent-merge-error' is signalled.  The
551    offending items are filtered for presentation through the PRESENT function
552    before being attached to the condition, so as to produce a more useful
553    diagnostic message.
554
555    Item equality is determined by TEST.
556
557    If there is an ambiguity at any point -- i.e., a choice between two or
558    more possible next items to emit -- then PICK is called to arbitrate.
559    PICK is called with two arguments: the list of candidate next items, and
560    the current output list.  It should return one of the candidate items.
561    The order of the candidates in the list given to the PICK function
562    reflects their order in the input LISTS: item A will precede item B in the
563    candidates list if and only if an occurrence of A appears in an earlier
564    input list than any occurrence of item B.  (This completely determines the
565    order of the candidates: it is not possible that two candidates appear in
566    the same input list, since that would resolve the ambiguity between them.)
567    If PICK is omitted then the item chosen is the one appearing in the
568    earliest of the input lists: i.e., effectively, the default PICK function
569    is
570
571         (lambda (candidates output-so-far)
572           (declare (ignore output-so-far))
573           (car candidates))
574
575    The primary use of this function is in computing class precedence lists.
576    By building the input lists and selecting the PICK function appropriately,
577    a variety of different CPL algorithms can be implemented."
578
579   (do ((lb (make-list-builder)))
580       ((null lists) (lbuild-list lb))
581
582     ;; The candidate items are the ones at the front of the input lists.
583     ;; Gather them up, removing duplicates.  If a candidate is somewhere in
584     ;; one of the other lists other than at the front then we reject it.  If
585     ;; we've just rejected everything, then we can make no more progress and
586     ;; the input lists were inconsistent.
587     (let* ((candidates (delete-duplicates (mapcar #'car lists)
588                                           :test test :from-end t))
589            (leasts (remove-if (lambda (item)
590                                 (some (lambda (list)
591                                         (member item (cdr list) :test test))
592                                       lists))
593                               candidates))
594            (winner (cond ((null leasts)
595                           (error 'inconsistent-merge-error
596                                  :candidates (mapcar present candidates)))
597                          ((null (cdr leasts))
598                           (car leasts))
599                          (pick
600                           (funcall pick leasts (lbuild-list lb)))
601                          (t (car leasts)))))
602
603       ;; Check that the PICK function isn't conning us.
604       (assert (member winner leasts :test test))
605
606       ;; Update the output list and remove the winning item from the input
607       ;; lists.  We know that it must be at the front of each input list
608       ;; containing it.  At this point, we discard input lists entirely when
609       ;; they run out of entries.  The loop ends when there are no more input
610       ;; lists left, i.e., when we've munched all of the input items.
611       (lbuild-add lb winner)
612       (setf lists (delete nil (mapcar (lambda (list)
613                                         (if (funcall test winner (car list))
614                                             (cdr list)
615                                             list))
616                                       lists))))))
617
618 (export 'categorize)
619 (defmacro categorize ((itemvar items &key bind) categories &body body)
620   "Categorize ITEMS into lists and invoke BODY.
621
622    The ITEMVAR is a symbol; as the macro iterates over the ITEMS, ITEMVAR
623    will contain the current item.  The BIND argument is a list of LET*-like
624    clauses.  The CATEGORIES are a list of clauses of the form (SYMBOL
625    PREDICATE).
626
627    The behaviour of the macro is as follows.  ITEMVAR is assigned (not
628    bound), in turn, each item in the list ITEMS.  The PREDICATEs in the
629    CATEGORIES list are evaluated in turn, in an environment containing
630    ITEMVAR and the BINDings, until one of them evaluates to a non-nil value.
631    At this point, the item is assigned to the category named by the
632    corresponding SYMBOL.  If none of the PREDICATEs returns non-nil then an
633    error is signalled; a PREDICATE consisting only of T will (of course)
634    match anything; it is detected specially so as to avoid compiler warnings.
635
636    Once all of the ITEMS have been categorized in this fashion, the BODY is
637    evaluated as an implicit PROGN.  For each SYMBOL naming a category, a
638    variable named after that symbol will be bound in the BODY's environment
639    to a list of the items in that category, in the same order in which they
640    were found in the list ITEMS.  The final values of the macro are the final
641    values of the BODY."
642
643   (let* ((cat-names (mapcar #'car categories))
644          (cat-match-forms (mapcar #'cadr categories))
645          (cat-vars (mapcar (lambda (name) (gensym (concatenate 'string
646                                                    (symbol-name name) "-")))
647                            cat-names))
648          (items-var (gensym "ITEMS-")))
649     `(let ((,items-var ,items)
650            ,@(mapcar (lambda (cat-var) (list cat-var nil)) cat-vars))
651        (dolist (,itemvar ,items-var)
652          (let* ,bind
653            (cond ,@(mapcar (lambda (cat-match-form cat-var)
654                              `(,cat-match-form
655                                (push ,itemvar ,cat-var)))
656                            cat-match-forms cat-vars)
657                  ,@(and (not (member t cat-match-forms))
658                         `((t (error "Failed to categorize ~A" ,itemvar)))))))
659        (let ,(mapcar (lambda (name var)
660                        `(,name (nreverse ,var)))
661                      cat-names cat-vars)
662          ,@body))))
663
664 (export 'partial-order-minima)
665 (defun partial-order-minima (items order)
666   "Return a list of minimal items according to the non-strict partial ORDER.
667
668    The ORDER function describes the partial order: (funcall ORDER X Y) should
669    return true if X precedes or is equal to Y in the order."
670   (reduce (lambda (tops this)
671             (let ((new nil) (keep t))
672               (dolist (top tops)
673                 (cond ((funcall order top this)
674                        (setf keep nil)
675                        (push top new))
676                       ((not (funcall order this top))
677                        (push top new))))
678               (nreverse (if keep (cons this new) new))))
679           items
680           :initial-value nil))
681
682 (export 'find-duplicates)
683 (defun find-duplicates (report sequence &key (key #'identity) (test #'eql))
684   "Call REPORT on each pair of duplicate items in SEQUENCE.
685
686    Duplicates are determined according to the KEY and TEST funcitons."
687   (when (symbolp test) (setf test (symbol-function test)))
688   (cond ((zerop (length sequence)) nil)
689         ((or (eq test #'eq)
690              (eq test #'eql)
691              (eq test #'equal)
692              (eq test #'equalp))
693          (let ((seen (make-hash-table :test test)))
694            (map nil (lambda (item)
695                       (let ((k (funcall key item)))
696                         (multiple-value-bind (previous matchp)
697                             (gethash k seen)
698                           (if matchp (funcall report item previous)
699                               (setf (gethash k seen) item)))))
700                 sequence)))
701         ((listp sequence)
702          (mapl (lambda (tail)
703                  (let* ((item (car tail))
704                         (rest (cdr tail))
705                         (match (member (funcall key item) rest
706                                        :test test :key key)))
707                    (when match (funcall report item (car match)))))
708                sequence))
709         ((vectorp sequence)
710          (dotimes (i (length sequence))
711            (let* ((item (aref sequence i))
712                   (pos (position (funcall key item) sequence
713                                  :key key :test test :start (1+ i))))
714              (when pos (funcall report item (aref sequence pos))))))
715         (t
716          (error 'type-error :datum sequence :expected-type 'sequence))))
717
718 ;;;--------------------------------------------------------------------------
719 ;;; Strings and characters.
720
721 (export 'frob-identifier)
722 (defun frob-identifier (string &key (swap-case t) (swap-hyphen t))
723   "Twiddles the case of STRING.
724
725    If all the letters in STRING are uppercase, and SWAP-CASE is true, then
726    switch them to lowercase; if they're all lowercase then switch them to
727    uppercase.  If there's a mix then leave them all alone.  At the same time,
728    if there are underscores but no hyphens, and SWAP-HYPHEN is true, then
729    switch them to hyphens, if there are hyphens and no underscores, switch
730    them underscores, and if there are both then leave them alone.
731
732    This is an invertible transformation, which turns vaguely plausible Lisp
733    names into vaguely plausible C names and vice versa.  Lisp names with
734    `funny characters' like stars and percent signs won't be any use, of
735    course."
736
737   ;; Work out what kind of a job we've got to do.  Gather flags: bit 0 means
738   ;; there are upper-case letters; bit 1 means there are lower-case letters;
739   ;; bit 2 means there are hyphens; bit 3 means there are underscores.
740   ;;
741   ;; Consequently, (logxor flags (ash flags 1)) is interesting: bit 1 is set
742   ;; if we have to frob case; bit 3 is set if we have to swap hyphens and
743   ;; underscores.  So use this to select functions which do bits of the
744   ;; mapping, and then compose them together.
745   (let* ((flags (reduce (lambda (state ch)
746                           (logior state
747                                   (cond ((upper-case-p ch) 1)
748                                         ((lower-case-p ch) 2)
749                                         ((char= ch #\-) 4)
750                                         ((char= ch #\_) 8)
751                                         (t 0))))
752                         string
753                         :initial-value 0))
754          (mask (logxor flags (ash flags 1)))
755          (letter (cond ((or (not swap-case) (not (logbitp 1 mask)))
756                         (constantly nil))
757                        ((logbitp 0 flags)
758                         (lambda (ch)
759                           (and (alpha-char-p ch) (char-downcase ch))))
760                        (t
761                         (lambda (ch)
762                           (and (alpha-char-p ch) (char-upcase ch))))))
763          (uscore-hyphen (cond ((or (not (logbitp 3 mask)) (not swap-hyphen))
764                                (constantly nil))
765                               ((logbitp 2 flags)
766                                (lambda (ch) (and (char= ch #\-) #\_)))
767                               (t
768                                (lambda (ch) (and (char= ch #\_) #\-))))))
769
770     (if (logbitp 3 (logior mask (ash mask 2)))
771         (map 'string (lambda (ch)
772                        (or (funcall letter ch)
773                            (funcall uscore-hyphen ch)
774                            ch))
775              string)
776         string)))
777
778 (export 'whitespace-char-p)
779 (declaim (inline whitespace-char-p))
780 (defun whitespace-char-p (char)
781   "Returns whether CHAR is a whitespace character.
782
783    Whitespaceness is determined relative to the compile-time readtable, which
784    is probably good enough for most purposes."
785   (case char
786     (#.(loop for i below char-code-limit
787              for ch = (code-char i)
788              unless (with-input-from-string (in (string ch))
789                       (peek-char t in nil))
790              collect ch) t)
791     (t nil)))
792
793 (export 'update-position)
794 (declaim (inline update-position))
795 (defun update-position (char line column)
796   "Updates LINE and COLUMN appropriately for having read the character CHAR.
797
798    Returns the new LINE and COLUMN numbers."
799   (case char
800     ((#\newline #\vt #\page)
801      (values (1+ line) 0))
802     ((#\tab)
803      (values line (logandc2 (+ column 8) 7)))
804     (t
805      (values line (1+ column)))))
806
807 (export 'backtrack-position)
808 (declaim (inline backtrack-position))
809 (defun backtrack-position (char line column)
810   "Updates LINE and COLUMN appropriately for having unread CHAR.
811
812    Well, actually an approximation for it; it will likely be wrong if the
813    last character was a tab.  But when the character is read again, it will
814    be correct."
815
816   ;; This isn't perfect: if the character doesn't actually match what was
817   ;; really read then it might not actually be possible: for example, if we
818   ;; push back a newline while in the middle of a line, or a tab while not at
819   ;; a tab stop.  In that case, we'll just lose, but hopefully not too badly.
820   (case char
821
822     ;; In the absence of better ideas, I'll set the column number to zero.
823     ;; This is almost certainly wrong, but with a little luck nobody will ask
824     ;; and it'll be all right soon.
825     ((#\newline #\vt #\page) (values (1- line) 0))
826
827     ;; Winding back a single space is sufficient.  If the position is
828     ;; currently on a tab stop then it'll advance back here next time.  If
829     ;; not, we're going to lose anyway because the previous character
830     ;; certainly couldn't have been a tab.
831     (#\tab (values line (1- column)))
832
833     ;; Anything else: just decrement the column and cross fingers.
834     (t (values line (1- column)))))
835
836 ;;;--------------------------------------------------------------------------
837 ;;; Functions.
838
839 (export 'compose)
840 (defun compose (function &rest more-functions)
841   "Composition of functions.  Functions are applied left-to-right.
842
843    This is the reverse order of the usual mathematical notation, but I find
844    it easier to read.  It's also slightly easier to work with in programs.
845    That is, (compose F1 F2 ... Fn) is what a category theorist might write as
846    F1 ; F2 ; ... ; Fn, rather than F1 o F2 o ... o Fn."
847
848   (labels ((compose1 (func-a func-b)
849              (lambda (&rest args)
850                (multiple-value-call func-b (apply func-a args)))))
851     (reduce #'compose1 more-functions :initial-value function)))
852
853 ;;;--------------------------------------------------------------------------
854 ;;; Variables.
855
856 (export 'defvar-unbound)
857 (defmacro defvar-unbound (var doc)
858   "Make VAR a special variable with documentation DOC, but leave it unbound."
859   `(eval-when (:compile-toplevel :load-toplevel :execute)
860      (defvar ,var)
861      (setf (documentation ',var 'variable) ',doc)
862      ',var))
863
864 ;;;--------------------------------------------------------------------------
865 ;;; Symbols.
866
867 (export 'symbolicate)
868 (defun symbolicate (&rest symbols)
869   "Return a symbol named after the concatenation of the names of the SYMBOLS.
870
871    The symbol is interned in the current `*package*'.  Trad."
872   (intern (apply #'concatenate 'string (mapcar #'symbol-name symbols))))
873
874 ;;;--------------------------------------------------------------------------
875 ;;; Object printing.
876
877 (export 'maybe-print-unreadable-object)
878 (defmacro maybe-print-unreadable-object
879     ((object stream &rest args) &body body)
880   "Print helper for usually-unreadable objects.
881
882    If `*print-escape*' is set then print OBJECT unreadably using BODY.
883    Otherwise just print using BODY."
884   (with-gensyms (print)
885     `(flet ((,print () ,@body))
886        (if *print-escape*
887            (print-unreadable-object (,object ,stream ,@args)
888              (,print))
889            (,print)))))
890
891 (export 'print-ugly-stuff)
892 (defun print-ugly-stuff (stream func)
893   "Print not-pretty things to the stream underlying STREAM.
894
895    The Lisp pretty-printing machinery, notably `pprint-logical-block', may
896    interpose additional streams between its body and the original target
897    stream.  This makes it difficult to make use of the underlying stream's
898    special features, whatever they might be."
899
900   ;; This is unpleasant.  Hacky hacky.
901   #.(or #+sbcl '(if (typep stream 'sb-pretty:pretty-stream)
902                   (let ((target (sb-pretty::pretty-stream-target stream)))
903                     (pprint-newline :mandatory stream)
904                     (funcall func target))
905                   (funcall func stream))
906         #+cmu '(if (typep stream 'pp:pretty-stream)
907                   (let ((target (pp::pretty-stream-target stream)))
908                     (pprint-newline :mandatory stream)
909                     (funcall func target))
910                   (funcall func stream))
911         '(funcall func stream)))
912
913 ;;;--------------------------------------------------------------------------
914 ;;; Iteration macros.
915
916 (export 'dosequence)
917 (defmacro dosequence ((var seq &key (start 0) (end nil) indexvar)
918                       &body body
919                       &environment env)
920   "Macro for iterating over general sequences.
921
922    Iterates over a (sub)sequence SEQ, delimited by START and END (which are
923    evaluated).  For each item of SEQ, BODY is invoked with VAR bound to the
924    item, and INDEXVAR (if requested) bound to the item's index.  (Note that
925    this is different from most iteration constructs in Common Lisp, which
926    work by mutating the variable.)
927
928    The loop is surrounded by an anonymous BLOCK and the loop body forms an
929    implicit TAGBODY, as is usual.  There is no result-form, however."
930
931   (once-only (:environment env seq start end)
932     (with-gensyms ((ivar "INDEX-") (endvar "END-") (bodyfunc "BODY-"))
933       (multiple-value-bind (docs decls body) (parse-body body :docp nil)
934         (declare (ignore docs))
935
936         (flet ((loopguts (indexp listp endvar)
937                  ;; Build a DO-loop to do what we want.
938                  (let* ((do-vars nil)
939                         (end-condition (if endvar
940                                            `(>= ,ivar ,endvar)
941                                            `(endp ,seq)))
942                         (item (if listp
943                                   `(car ,seq)
944                                   `(aref ,seq ,ivar)))
945                         (body-call `(,bodyfunc ,item)))
946                    (when listp
947                      (push `(,seq (nthcdr ,start ,seq) (cdr ,seq))
948                            do-vars))
949                    (when indexp
950                      (push `(,ivar ,start (1+ ,ivar)) do-vars))
951                    (when indexvar
952                      (setf body-call (append body-call (list ivar))))
953                    `(do ,do-vars (,end-condition) ,body-call))))
954
955           `(block nil
956              (flet ((,bodyfunc (,var ,@(and indexvar `(,indexvar)))
957                       ,@decls
958                       (tagbody ,@body)))
959                (etypecase ,seq
960                  (vector
961                   (let ((,endvar (or ,end (length ,seq))))
962                     ,(loopguts t nil endvar)))
963                  (list
964                   (if ,end
965                       ,(loopguts t t end)
966                       ,(loopguts indexvar t nil)))))))))))
967
968 ;;;--------------------------------------------------------------------------
969 ;;; Structure accessor hacks.
970
971 (export 'define-access-wrapper)
972 (defmacro define-access-wrapper (from to &key read-only)
973   "Make (FROM THING) work like (TO THING).
974
975    If not READ-ONLY, then also make (setf (FROM THING) VALUE) work like
976    (setf (TO THING) VALUE).
977
978    This is mostly useful for structure slot accessors where the slot has to
979    be given an unpleasant name to avoid it being an external symbol."
980   `(progn
981      (declaim (inline ,from ,@(and (not read-only) `((setf ,from)))))
982      (defun ,from (object)
983        (,to object))
984      ,@(and (not read-only)
985             `((defun (setf ,from) (value object)
986                 (setf (,to object) value))))))
987
988 ;;;--------------------------------------------------------------------------
989 ;;; Condition and error utilities.
990
991 (export 'designated-condition)
992 (defun designated-condition (default-type datum arguments
993                              &key allow-pointless-arguments)
994   "Return the condition designated by DATUM and ARGUMENTS.
995
996    DATUM and ARGUMENTS together are a `condition designator' of (some
997    supertype of) DEFAULT-TYPE; return the condition so designated."
998   (typecase datum
999     (condition
1000      (unless (or allow-pointless-arguments (null arguments))
1001        (error "Argument list provided with specific condition"))
1002      datum)
1003     (symbol
1004      (apply #'make-condition datum arguments))
1005     ((or string function)
1006      (make-condition default-type
1007                      :format-control datum
1008                      :format-arguments arguments))
1009     (t
1010      (error "Unexpected condition designator datum ~S" datum))))
1011
1012 (export 'simple-control-error)
1013 (define-condition simple-control-error (control-error simple-error)
1014   ())
1015
1016 (export 'invoke-associated-restart)
1017 (defun invoke-associated-restart (restart condition &rest arguments)
1018   "Invoke the active RESTART associated with CONDITION, with the ARGUMENTS.
1019
1020    Find an active restart designated by RESTART; if CONDITION is not nil,
1021    then restrict the search to restarts associated with CONDITION, and
1022    restarts not associated with any condition.  If no such restart is found
1023    then signal an error of type `control-error'; otherwise invoke the restart
1024    with the given ARGUMENTS."
1025   (apply #'invoke-restart
1026          (or (find-restart restart condition)
1027              (error 'simple-control-error
1028                     :format-control "~:[Restart ~S is not active~;~
1029                                         No active `~(~A~)' restart~]~
1030                                      ~@[ for condition ~S~]"
1031                     :format-arguments (list (symbolp restart)
1032                                             restart
1033                                             condition)))
1034          arguments))
1035
1036 ;;;--------------------------------------------------------------------------
1037 ;;; CLOS hacking.
1038
1039 (export 'default-slot)
1040 (defmacro default-slot ((instance slot &optional (slot-names t))
1041                           &body value
1042                           &environment env)
1043   "If INSTANCE's slot named SLOT is unbound, set it to VALUE.
1044
1045    Only set SLOT if it's listed in SLOT-NAMES, or SLOT-NAMES is `t' (i.e., we
1046    obey the `shared-initialize' protocol).  SLOT-NAMES defaults to `t', so
1047    you can use it in `initialize-instance' or similar without ill effects.
1048    Both INSTANCE and SLOT are evaluated; VALUE is an implicit progn and only
1049    evaluated if it's needed."
1050
1051   (once-only (:environment env instance slot slot-names)
1052     `(when ,(if (eq slot-names t)
1053                   `(not (slot-boundp ,instance ,slot))
1054                   `(and (not (slot-boundp ,instance ,slot))
1055                         (or (eq ,slot-names t)
1056                             (member ,slot ,slot-names))))
1057        (setf (slot-value ,instance ,slot)
1058              (progn ,@value)))))
1059
1060 (export 'define-on-demand-slot)
1061 (defmacro define-on-demand-slot (class slot (instance) &body body)
1062   "Defines a slot which computes its initial value on demand.
1063
1064    Sets up the named SLOT of CLASS to establish its value as the implicit
1065    progn BODY, by defining an appropriate method on `slot-unbound'."
1066   (multiple-value-bind (docs decls body) (parse-body body)
1067     (with-gensyms (classvar slotvar)
1068       `(defmethod slot-unbound
1069            (,classvar (,instance ,class) (,slotvar (eql ',slot)))
1070          ,@docs ,@decls
1071          (declare (ignore ,classvar))
1072          (setf (slot-value ,instance ',slot) (block ,slot ,@body))))))
1073
1074 ;;;----- That's all, folks --------------------------------------------------