chiark / gitweb /
timeout: New program to limit how long a child process runs.
authorMark Wooding <mdw@distorted.org.uk>
Sun, 5 Jun 2011 21:02:49 +0000 (22:02 +0100)
committerMark Wooding <mdw@distorted.org.uk>
Sun, 5 Jun 2011 21:11:23 +0000 (22:11 +0100)
It's already grown more sophisticated than I was expecting.  Oh, well.

Makefile.am
debian/control
debian/inst
timeout.1 [new file with mode: 0644]
timeout.c [new file with mode: 0644]

index 2257beb7b6019c40626f81ab46d57aad3c7e0bb2..dce864aa86584a688e3911b439bbded9e1ecec36 100644 (file)
@@ -68,6 +68,14 @@ pause_LDADD           = $(mLib_LIBS) $(MATH_LIBS)
 dist_man_MANS          += pause.1
 endif
 
+## timeout
+if HAVE_MLIB
+bin_PROGRAMS           += timeout
+timeout_SOURCES                 = timeout.c
+timeout_LDADD           = $(mLib_LIBS) $(MATH_LIBS)
+dist_man_MANS          += timeout.1
+endif
+
 ## stamp
 if HAVE_MLIB
 bin_PROGRAMS           += stamp
index 1335f11b44b80c59f73bc11c84e5d94befc6e0cc..ca716521459cef7a1e985df00a5ee02eb5b11de5 100644 (file)
@@ -19,6 +19,7 @@ Depends:
        shadowfix,
        zz,
        gorp,
+       timeout,
        splitconf,
        xtitle,
        pause,
@@ -42,6 +43,12 @@ Section: utils
 Depends: ${shlibs:Depends}, python (>= 2.4), python-cdb
 Description: Simple utilities for messing with CDB files.
 
+Package: timeout
+Architecture: any
+Section: utils
+Depends: ${shlibs:Depends}
+Description: Run a program for at most a given amount of time.
+
 Package: locking
 Architecture: any
 Section: utils
index 7855b361f018408b1aaeb287c1022347dea397f0..2b8ab18424f8660e35f10bf15fd897750db69867 100644 (file)
@@ -23,6 +23,8 @@ if-mtu if-mtu /usr/bin
 if-mtu.1 if-mtu /usr/share/man/man1
 inplace inplace /usr/bin
 inplace.1 inplace /usr/share/man/man1
+timeout timeout /usr/bin
+timeout.1 timeout /usr/share/man/man1
 locking locking /usr/bin
 locking.1 locking /usr/share/man/man1
 not nsict-mail /usr/bin
diff --git a/timeout.1 b/timeout.1
new file mode 100644 (file)
index 0000000..b468c87
--- /dev/null
+++ b/timeout.1
@@ -0,0 +1,105 @@
+.TH "timeout" 1 "5 June 2011" "Mark Wooding" "Toys"
+.SH NAME
+timeout \- run a program for at most a given amount of time
+.
+.SH SYNOPSIS
+.B timeout
+.RB [ \-s
+.IR signal ]
+.I seconds
+.I command
+.RI [ arguments ...]
+.
+.SH DESCRIPTION
+The
+.B timeout
+command runs a specified program for at most a given number of
+.IR seconds .
+.PP
+It works by running the given command as a separate process group.  It
+then waits either for the top-level process (only) to exit, or for the
+timeout to expire, whichever happens first.  If the process exits, then
+.B timeout
+exits too, setting its exit status to match.  Any other processes which
+may have been started are left unmolested.
+.PP
+On the other hand, if the timeout goes off, then
+.B timeout
+sends its child process group the specified signal, by default
+.BR SIGTERM ,
+though you can choose a different one with the
+.B \-s
+option.  It then waits an additional five seconds.  If the child still
+hasn't exited, it sends
+.B SIGKILL
+to the process group and waits a further five seconds.  If the child
+still hasn't exited in this time, then
+.B timeout
+gives up and exits.
+.PP
+The following command-line options are recognized.
+.TP
+.B \-h, \-\-help
+Prints a reasonably full help message describing the arguments and
+options to standard output, and exits successfully.
+.TP
+.B \-v, \-\-version
+Prints the program's version number to standard output, and exits
+successfully.
+.TP
+.B \-u, \-\-usage
+Prints a brief usage summary to standard output, and exits successfully.
+.TP
+.BI "\-s, \-\-signal=" signal
+Send
+.I signal
+to the child process if it takes too long.  The default is to send
+.BR SIGTERM .
+A signal may be given numerically (e.g., 9 for
+.BR SIGKILL )
+or by name (e.g.,
+.BR KILL ).
+.
+.SH BUGS
+Because
+.B timeout
+works by running its child process in a separate process group, it
+interacts oddly with interactive shells.  If the child process group
+attempts to do terminal I/O (particularly reading from a terminal) then
+it may be sent signals to suspend it.  This may or may not make matters
+worse.
+.PP
+The
+.B timeout
+program makes an effort to propagate interesting signals to its child
+process group.  Currently, it propagates
+.BR SIGTSTP ,
+.BR SIGCONT ,
+.BR SIGINT ,
+.BR SIGHUP ,
+and
+.BR SIGQUIT .
+This list is subject to change: I don't think I'm likely to remove any
+of the current signals from it, but I might add some; or I might add an
+option to control this list.
+.PP
+If you suspend
+.B timeout
+and its child process group, the timer continues running anyway.  (I'm
+not quite sure whether this is the right behaviour.)
+.PP
+Nested timeouts don't work in a useful way if the outer timeout expires
+earlier than the inner one.  Since
+.B SIGTERM
+isn't propagated (currently, at least), the inner
+.B timeout
+is killed by the outer one, and loses control of its child process
+group.  You could possibly work around this by sending
+.B SIGQUIT
+instead.
+.PP
+Perhaps it would be useful to allow configuration of the `panic'
+timeouts after the initial timeout signal is sent.
+.
+.SH AUTHOR
+Mark Wooding, <mdw@distorted.org.uk>
diff --git a/timeout.c b/timeout.c
new file mode 100644 (file)
index 0000000..0493efa
--- /dev/null
+++ b/timeout.c
@@ -0,0 +1,482 @@
+/* -*-c-*-
+ *
+ * Run a command with a timeout.
+ *
+ * (c) 2011 Mark Wooding
+ */
+
+/*----- Licensing notice --------------------------------------------------*
+ *
+ * This file is part of the Toys utilties collection.
+ *
+ * Toys is free software; you can redistribute it and/or modify
+ * it under the terms of the GNU General Public License as published by
+ * the Free Software Foundation; either version 2 of the License, or
+ * (at your option) any later version.
+ *
+ * Toys is distributed in the hope that it will be useful,
+ * but WITHOUT ANY WARRANTY; without even the implied warranty of
+ * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
+ * GNU General Public License for more details.
+ *
+ * You should have received a copy of the GNU General Public License
+ * along with Toys; if not, write to the Free Software Foundation,
+ * Inc., 59 Temple Place - Suite 330, Boston, MA 02111-1307, USA.
+ */
+
+/*----- Basic strategy ----------------------------------------------------*
+ *
+ * There's an obvious and simple way to make a process stop after a certain
+ * amount of time: set an alarm.  Alarms are inherited, so this will take
+ * down the whole subprocess tree.  Unfortunately, processes use alarms for
+ * all sorts of things.  And this relies on the process not fiddling with its
+ * @SIGALRM@ handler.
+ *
+ * The other possibility is to have a separate process which kills our target
+ * program when the time's up.  In order to do this effectively, we need to
+ * trap the whole thing in a process group.  Then we need to wait until the
+ * time is up or the process finished.  We'll assume that the top-level
+ * process finishing is sufficient indication that we don't need to hang on
+ * any longer.
+ *
+ * This isn't perfect.  It won't catch stragglers if the target process
+ * creates its own sub-process groups -- so, in particular, nested timeouts
+ * won't behave in an obvious way.  And, possibly most annoyingly, it
+ * interferes with the way terminal I/O works.  I'm sorry: you can't have
+ * everything.
+ */
+
+/*----- Header files ------------------------------------------------------*/
+
+#include <ctype.h>
+#include <errno.h>
+#include <signal.h>
+#include <stdio.h>
+#include <stdlib.h>
+#include <string.h>
+
+#include <sys/types.h>
+#include <sys/time.h>
+#include <fcntl.h>
+#include <unistd.h>
+#include <sys/select.h>
+#include <sys/wait.h>
+
+#include <mLib/fdflags.h>
+#include <mLib/macros.h>
+#include <mLib/mdwopt.h>
+#include <mLib/quis.h>
+#include <mLib/report.h>
+#include <mLib/sel.h>
+#include <mLib/sig.h>
+#include <mLib/tv.h>
+
+/*----- Static variables --------------------------------------------------*/
+
+static sel_state sel;
+static int state;
+
+enum {
+  ST_WAIT,
+  ST_ABORT,
+  ST_DONE
+};
+
+/*----- Argument conversion functions -------------------------------------*/
+
+/* --- @namesig@ --- *
+ *
+ * Arguments:  @const char *p@ = pointer to string
+ *
+ * Returns:    Signal number, or @-1@ for no match.
+ *
+ * Use:                Converts a signal name into its number.
+ */
+
+struct namesig {
+  const char *name;
+  int sig;
+};
+
+int cmp_namesig(const void *k, const void *v)
+  { const struct namesig *ns = v; return (strcmp(k, ns->name)); }
+
+static int namesig(const char *p)
+{
+  const static struct namesig tab[] = {
+/*
+  ;;; The signal name table is very boring to type.  To make life less awful,
+  ;;; put the signal names in this list and evaluate the code to get Emacs to
+  ;;; regenerate it.  We use @bsearch@ on it, so it's important that it be
+  ;;; sorted: Emacs does this for us.
+  (let ((signals '(HUP INT QUIT ILL ABRT FPE KILL SEGV PIPE ALRM TERM
+                  USR1 USR2 CHLD CONT STOP TSTP TTIN TTOU BUS POLL
+                  PROF SYS TRAP URG VTALRM XCPU XFSZ IOT EMT STKFLT
+                  IO CLD PWR INFO LOST WINCH)))
+    (save-excursion
+      (goto-char (point-min))
+      (let ((start (search-forward (concat "/" "* SIGLIST *" "/\n")))
+           (end (search-forward (concat "/" "* END *" "/\n"))))
+       (delete-region start end))
+      (dolist (sig (sort (copy-list signals) #'string<))
+       (insert (format "#ifdef SIG%s\n    { \"%s\", SIG%s },\n#endif\n"
+                       sig sig sig)))
+      (insert (concat "/" "* END *" "/\n"))))
+*/
+
+/* SIGLIST */
+#ifdef SIGABRT
+    { "ABRT", SIGABRT },
+#endif
+#ifdef SIGALRM
+    { "ALRM", SIGALRM },
+#endif
+#ifdef SIGBUS
+    { "BUS", SIGBUS },
+#endif
+#ifdef SIGCHLD
+    { "CHLD", SIGCHLD },
+#endif
+#ifdef SIGCLD
+    { "CLD", SIGCLD },
+#endif
+#ifdef SIGCONT
+    { "CONT", SIGCONT },
+#endif
+#ifdef SIGEMT
+    { "EMT", SIGEMT },
+#endif
+#ifdef SIGFPE
+    { "FPE", SIGFPE },
+#endif
+#ifdef SIGHUP
+    { "HUP", SIGHUP },
+#endif
+#ifdef SIGILL
+    { "ILL", SIGILL },
+#endif
+#ifdef SIGINFO
+    { "INFO", SIGINFO },
+#endif
+#ifdef SIGINT
+    { "INT", SIGINT },
+#endif
+#ifdef SIGIO
+    { "IO", SIGIO },
+#endif
+#ifdef SIGIOT
+    { "IOT", SIGIOT },
+#endif
+#ifdef SIGKILL
+    { "KILL", SIGKILL },
+#endif
+#ifdef SIGLOST
+    { "LOST", SIGLOST },
+#endif
+#ifdef SIGPIPE
+    { "PIPE", SIGPIPE },
+#endif
+#ifdef SIGPOLL
+    { "POLL", SIGPOLL },
+#endif
+#ifdef SIGPROF
+    { "PROF", SIGPROF },
+#endif
+#ifdef SIGPWR
+    { "PWR", SIGPWR },
+#endif
+#ifdef SIGQUIT
+    { "QUIT", SIGQUIT },
+#endif
+#ifdef SIGSEGV
+    { "SEGV", SIGSEGV },
+#endif
+#ifdef SIGSTKFLT
+    { "STKFLT", SIGSTKFLT },
+#endif
+#ifdef SIGSTOP
+    { "STOP", SIGSTOP },
+#endif
+#ifdef SIGSYS
+    { "SYS", SIGSYS },
+#endif
+#ifdef SIGTERM
+    { "TERM", SIGTERM },
+#endif
+#ifdef SIGTRAP
+    { "TRAP", SIGTRAP },
+#endif
+#ifdef SIGTSTP
+    { "TSTP", SIGTSTP },
+#endif
+#ifdef SIGTTIN
+    { "TTIN", SIGTTIN },
+#endif
+#ifdef SIGTTOU
+    { "TTOU", SIGTTOU },
+#endif
+#ifdef SIGURG
+    { "URG", SIGURG },
+#endif
+#ifdef SIGUSR1
+    { "USR1", SIGUSR1 },
+#endif
+#ifdef SIGUSR2
+    { "USR2", SIGUSR2 },
+#endif
+#ifdef SIGVTALRM
+    { "VTALRM", SIGVTALRM },
+#endif
+#ifdef SIGWINCH
+    { "WINCH", SIGWINCH },
+#endif
+#ifdef SIGXCPU
+    { "XCPU", SIGXCPU },
+#endif
+#ifdef SIGXFSZ
+    { "XFSZ", SIGXFSZ },
+#endif
+/* END */
+  };
+
+  const struct namesig *ns = bsearch(p, tab, N(tab), sizeof(tab[0]),
+                                    cmp_namesig);
+  if (ns) return (ns->sig);
+  else if (isdigit((unsigned char)*p)) return (atoi(p));
+  else return (-1);
+}
+
+/*----- Help functions ----------------------------------------------------*/
+
+static void usage(FILE *fp)
+  { pquis(fp, "Usage: $ [-s SIG] SECONDS COMMAND [ARGUMENTS ...]\n"); }
+
+static void version(FILE *fp)
+  { pquis(fp, "$ (version " VERSION ")\n"); }
+
+static void help(FILE *fp)
+{
+  version(fp); fputc('\n', stdout);
+  usage(fp);
+  pquis(fp, "\n\
+Run COMMAND, giving it the ARGUMENTS.  If it fails to complete within the\n\
+specified number of SECONDS, kill it.  Otherwise exit with the status it\n\
+returns.\n                                                             \
+\n\
+Options:\n\
+  -h, --help           Show this help text.\n\
+  -v, --version                Show version string.\n\
+  -u, --usage          Show a terse usage summary.\n\
+\n\
+  -s, --signal=SIG     Send signal SIG to the command.\n\
+");
+}
+
+/*----- Timeout handling --------------------------------------------------*/
+
+/* --- @timeout@ --- *
+ *
+ * The first time, we send the signal requested by the caller.  Then we wait
+ * five seconds for the child to die, and send @SIGKILL@.  If that still
+ * doesn't help, then we just give up.  It's not like there's anything else
+ * we can do which is likely to help.  And it's not like the process is going
+ * to be doing anything else in user mode ever again.
+ */
+
+struct timeout {
+  sel_timer t;
+  int panic;
+  int sig;
+  pid_t kid;
+};
+
+static void timeout(struct timeval *now, void *p)
+{
+  struct timeout *t = p;
+  struct timeval tv;
+
+  switch (t->panic) {
+    case 0:
+      moan("timed out: killing child process");
+      kill(-t->kid, t->sig);
+      break;
+    case 1:
+      moan("child hasn't responded: killing harder");
+      kill(-t->kid, SIGKILL);
+      break;
+    case 2:
+      moan("child still undead: giving up");
+      state = ST_ABORT;
+      break;
+  }
+  TV_ADDL(&tv, now, 5, 0);
+  sel_addtimer(&sel, &t->t, &tv, timeout, t);
+  t->panic++;
+}
+
+/*----- Signal handling ---------------------------------------------------*/
+
+/* --- @sigchld@ --- *
+ *
+ * If it's our child that died, fetch its exit status and stop.
+ */
+
+struct sigchld {
+  pid_t kid;
+  int rc;
+};
+
+static void sigchld(int sig, void *p)
+{
+  struct sigchld *s = p;
+  int rc;
+  pid_t pid;
+
+  if ((pid = waitpid(s->kid, &rc, WNOHANG)) < 0)
+    die(254, "waitpid failed: %s", strerror(errno));
+  if (pid == s->kid) {
+    s->rc = rc;
+    state = ST_DONE;
+  }
+}
+
+/* --- @sigpropagate@ --- *
+ *
+ * Propagate various signals to the child process group and then maybe act on
+ * them.
+ */
+
+static void sigpropagate(int sig, void *p)
+{
+  struct sigchld *s = p;
+
+  kill(-s->kid, sig);
+  switch (sig) {
+    case SIGTSTP: raise(SIGSTOP); break;
+  }
+}
+
+#define PROPAGATE_SIGNALS(_)                                           \
+  _(TSTP) _(CONT) _(INT) _(HUP) _(QUIT)
+
+/*----- Main program ------------------------------------------------------*/
+
+/* --- @main@ --- */
+
+int main(int argc, char *const argv[])
+{
+  char *p;
+  double t;
+  int signo = SIGTERM;
+  pid_t kid;
+  struct timeval tv;
+  struct timeout to;
+  struct sigchld sc;
+  sig sig_CHLD;
+#define DEFSIG(tag) sig sig_##tag;
+  PROPAGATE_SIGNALS(DEFSIG)
+#undef DEFSIG
+  unsigned f = 0;
+#define F_BOGUS 1u
+
+  /* --- Option parsing --- */
+
+  ego(argv[0]);
+
+  for (;;) {
+    static const struct option opts[] = {
+      { "help",                        0,              0,      'h' },
+      { "version",             0,              0,      'v' },
+      { "usage",               0,              0,      'u' },
+      { "signal",              OPTF_ARGREQ,    0,      's' },
+      { 0,                     0,              0,      0 }
+    };
+
+    int i = mdwopt(argc, argv, "+hvus:", opts, 0, 0, 0);
+    if (i < 0) break;
+    switch (i) {
+      case 'h': help(stdout); exit(0);
+      case 'v': version(stdout); exit(0);
+      case 'u': usage(stdout); exit(0);
+      case 's':
+       if ((signo = namesig(optarg)) < 0)
+         die(253, "bad signal spec `%s'", optarg);
+       break;
+      default: f |= F_BOGUS; break;
+    }
+  }
+  argc -= optind; argv += optind;
+  if ((f & F_BOGUS) || argc < 2) { usage(stderr); exit(253); }
+
+  p = argv[0];
+  while (isspace((unsigned char)*p)) p++;
+  t = strtod(argv[0], &p);
+  while (isspace((unsigned char)*p)) p++;
+  if (*p) die(254, "bad time value `%s'", argv[0]);
+
+  /* --- Get things set up --- */
+
+  state = ST_WAIT;
+  sel_init(&sel);
+
+  /* --- Set up signal handling --- *
+   *
+   * Doing anything with asynchronous signals is a mug's game, so we bring
+   * them in-band.  Do this before starting the child process, because
+   * otherwise we might miss an immediate @SIGCHLD@.
+   */
+
+  sig_init(&sel);
+  sc.rc = 0;
+  sig_add(&sig_CHLD, SIGCHLD, sigchld, &sc);
+#define ADDSIG(tag) sig_add(&sig_##tag, SIG##tag, sigpropagate, &sc);
+  PROPAGATE_SIGNALS(ADDSIG)
+#undef ADDSIG
+
+  /* --- Now start the child process --- */
+
+  if ((kid = fork()) < 0) die(2, "fork failed: %s", strerror(errno));
+  if (!kid) {
+    setpgid(0, 0);
+    execvp(argv[1], argv + 1);
+    _exit(252);
+  }
+  sc.kid = kid;
+
+  /* --- Set up the timer --- */
+
+  to.kid = kid;
+  to.sig = signo;
+  to.panic = 0;
+  gettimeofday(&tv, 0);
+  TV_ADDL(&tv, &tv, (time_t)t, ((long)(t * 1000000))%1000000);
+  sel_addtimer(&sel, &to.t, &tv, timeout, &to);
+
+  /* --- Main @select@ loop */
+
+  while (state == ST_WAIT) {
+    if (sel_select(&sel)) {
+      if (errno == EINTR) continue;
+      die(254, "select failed: %s", strerror(errno));
+    }
+  }
+
+  /* --- Check and translate the exit code --- */
+
+  switch (state) {
+    case ST_ABORT:
+      exit(251);
+    case ST_DONE:
+      if (WIFEXITED(sc.rc))
+       exit(WEXITSTATUS(sc.rc));
+      else if (WIFSIGNALED(sc.rc))
+       exit(128 | WTERMSIG(sc.rc));
+      else
+       exit(128);
+    default:
+      moan("FATAL: unexpected state %d", state);
+      abort();
+  }
+}
+
+/*----- That's all, folks -------------------------------------------------*/