chiark / gitweb /
update TODO
[elogind.git] / src / shutdown.c
1 /*-*- Mode: C; c-basic-offset: 8; indent-tabs-mode: nil -*-*/
2
3 /***
4   This file is part of systemd.
5
6   Copyright 2010 ProFUSION embedded systems
7
8   systemd is free software; you can redistribute it and/or modify it
9   under the terms of the GNU General Public License as published by
10   the Free Software Foundation; either version 2 of the License, or
11   (at your option) any later version.
12
13   systemd is distributed in the hope that it will be useful, but
14   WITHOUT ANY WARRANTY; without even the implied warranty of
15   MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the GNU
16   General Public License for more details.
17
18   You should have received a copy of the GNU General Public License
19   along with systemd; If not, see <http://www.gnu.org/licenses/>.
20 ***/
21
22 #include <sys/mman.h>
23 #include <sys/types.h>
24 #include <sys/reboot.h>
25 #include <linux/reboot.h>
26 #include <sys/wait.h>
27 #include <sys/types.h>
28 #include <sys/stat.h>
29 #include <sys/mount.h>
30 #include <sys/syscall.h>
31 #include <fcntl.h>
32 #include <dirent.h>
33 #include <errno.h>
34 #include <unistd.h>
35 #include <signal.h>
36 #include <stdbool.h>
37 #include <stdlib.h>
38 #include <string.h>
39
40 #include "missing.h"
41 #include "log.h"
42 #include "umount.h"
43 #include "util.h"
44
45 #define TIMEOUT_USEC (5 * USEC_PER_SEC)
46 #define FINALIZE_ATTEMPTS 50
47
48 static bool ignore_proc(pid_t pid) {
49         if (pid == 1)
50                 return true;
51
52         /* TODO: add more ignore rules here: device-mapper, etc */
53
54         return false;
55 }
56
57 static bool is_kernel_thread(pid_t pid)
58 {
59         char buf[PATH_MAX];
60         FILE *f;
61         char c;
62         size_t count;
63
64         snprintf(buf, sizeof(buf), "/proc/%lu/cmdline", (unsigned long)pid);
65         f = fopen(buf, "re");
66         if (!f)
67                 return true; /* not really, but has the desired effect */
68
69         count = fread(&c, 1, 1, f);
70         fclose(f);
71         return count != 1;
72 }
73
74 static int killall(int sign) {
75         DIR *dir;
76         struct dirent *d;
77         unsigned int n_processes = 0;
78
79         if ((dir = opendir("/proc")) == NULL)
80                 return -errno;
81
82         while ((d = readdir(dir))) {
83                 pid_t pid;
84
85                 if (parse_pid(d->d_name, &pid) < 0)
86                         continue;
87
88                 if (is_kernel_thread(pid))
89                         continue;
90
91                 if (ignore_proc(pid))
92                         continue;
93
94                 if (kill(pid, sign) == 0)
95                         n_processes++;
96                 else
97                         log_warning("Could not kill %d: %m", pid);
98         }
99
100         closedir(dir);
101
102         return n_processes;
103 }
104
105 static void wait_for_children(int n_processes, sigset_t *mask) {
106         usec_t until;
107
108         assert(mask);
109
110         until = now(CLOCK_MONOTONIC) + TIMEOUT_USEC;
111         for (;;) {
112                 struct timespec ts;
113                 int k;
114                 usec_t n;
115
116                 for (;;) {
117                         pid_t pid = waitpid(-1, NULL, WNOHANG);
118
119                         if (pid == 0)
120                                 break;
121
122                         if (pid < 0 && errno == ECHILD)
123                                 return;
124
125                         if (n_processes > 0)
126                                 if (--n_processes == 0)
127                                         return;
128                 }
129
130                 n = now(CLOCK_MONOTONIC);
131                 if (n >= until)
132                         return;
133
134                 timespec_store(&ts, until - n);
135
136                 if ((k = sigtimedwait(mask, NULL, &ts)) != SIGCHLD) {
137
138                         if (k < 0 && errno != EAGAIN) {
139                                 log_error("sigtimedwait() failed: %m");
140                                 return;
141                         }
142
143                         if (k >= 0)
144                                 log_warning("sigtimedwait() returned unexpected signal.");
145                 }
146         }
147 }
148
149 static void send_signal(int sign) {
150         sigset_t mask, oldmask;
151         int n_processes;
152
153         assert_se(sigemptyset(&mask) == 0);
154         assert_se(sigaddset(&mask, SIGCHLD) == 0);
155         assert_se(sigprocmask(SIG_BLOCK, &mask, &oldmask) == 0);
156
157         if (kill(-1, SIGSTOP) < 0 && errno != ESRCH)
158                 log_warning("kill(-1, SIGSTOP) failed: %m");
159
160         n_processes = killall(sign);
161
162         if (kill(-1, SIGCONT) < 0 && errno != ESRCH)
163                 log_warning("kill(-1, SIGCONT) failed: %m");
164
165         if (n_processes <= 0)
166                 goto finish;
167
168         wait_for_children(n_processes, &mask);
169
170 finish:
171         sigprocmask(SIG_SETMASK, &oldmask, NULL);
172 }
173
174 static void ultimate_send_signal(int sign) {
175         sigset_t mask, oldmask;
176         int r;
177
178         assert_se(sigemptyset(&mask) == 0);
179         assert_se(sigaddset(&mask, SIGCHLD) == 0);
180         assert_se(sigprocmask(SIG_BLOCK, &mask, &oldmask) == 0);
181
182         if (kill(-1, SIGSTOP) < 0 && errno != ESRCH)
183                 log_warning("kill(-1, SIGSTOP) failed: %m");
184
185         r = kill(-1, sign);
186         if (r < 0 && errno != ESRCH)
187                 log_warning("kill(-1, %s) failed: %m", signal_to_string(sign));
188
189         if (kill(-1, SIGCONT) < 0 && errno != ESRCH)
190                 log_warning("kill(-1, SIGCONT) failed: %m");
191
192         if (r < 0)
193                 goto finish;
194
195         wait_for_children(0, &mask);
196
197 finish:
198         sigprocmask(SIG_SETMASK, &oldmask, NULL);
199 }
200
201 static int prepare_new_root(void) {
202         static const char dirs[] =
203                 "/run/initramfs/oldroot\0"
204                 "/run/initramfs/proc\0"
205                 "/run/initramfs/sys\0"
206                 "/run/initramfs/dev\0"
207                 "/run/initramfs/run\0";
208
209         const char *dir;
210
211         if (mount("/run/initramfs", "/run/initramfs", NULL, MS_BIND, NULL) < 0) {
212                 log_error("Failed to mount bind /run/initramfs on /run/initramfs: %m");
213                 return -errno;
214         }
215
216         if (mount(NULL, "/run/initramfs", NULL, MS_PRIVATE, NULL) < 0) {
217                 log_error("Failed to make /run/initramfs private mount: %m");
218                 return -errno;
219         }
220
221         NULSTR_FOREACH(dir, dirs)
222                 if (mkdir_p(dir, 0755) < 0 && errno != EEXIST) {
223                         log_error("Failed to mkdir %s: %m", dir);
224                         return -errno;
225                 }
226
227         if (mount("/sys", "/run/initramfs/sys", NULL, MS_BIND, NULL) < 0) {
228                 log_error("Failed to mount bind /sys on /run/initramfs/sys: %m");
229                 return -errno;
230         }
231
232         if (mount("/proc", "/run/initramfs/proc", NULL, MS_BIND, NULL) < 0) {
233                 log_error("Failed to mount bind /proc on /run/initramfs/proc: %m");
234                 return -errno;
235         }
236
237         if (mount("/dev", "/run/initramfs/dev", NULL, MS_BIND, NULL) < 0) {
238                 log_error("Failed to mount bind /dev on /run/initramfs/dev: %m");
239                 return -errno;
240         }
241
242         if (mount("/run", "/run/initramfs/run", NULL, MS_BIND, NULL) < 0) {
243                 log_error("Failed to mount bind /run on /run/initramfs/run: %m");
244                 return -errno;
245         }
246
247         return 0;
248 }
249
250 static int pivot_to_new_root(void) {
251         int fd;
252
253         chdir("/run/initramfs");
254
255         /*
256           In case some evil process made "/" MS_SHARED
257           It works for pivot_root, but the ref count for the root device
258           is not decreasing :-/
259         */
260         if (mount(NULL, "/", NULL, MS_PRIVATE, NULL) < 0) {
261                 log_error("Failed to make \"/\" private mount %m");
262                 return -errno;
263         }
264
265         if (pivot_root(".", "oldroot") < 0) {
266                 log_error("pivot failed: %m");
267                 /* only chroot if pivot root succeded */
268                 return -errno;
269         }
270
271         chroot(".");
272         log_info("Successfully changed into root pivot.");
273
274         fd = open("/dev/console", O_RDWR);
275         if (fd < 0)
276                 log_error("Failed to open /dev/console: %m");
277         else {
278                 make_stdio(fd);
279
280                 /* Initialize the controlling terminal */
281                 setsid();
282                 ioctl(STDIN_FILENO, TIOCSCTTY, NULL);
283         }
284
285         return 0;
286 }
287
288 int main(int argc, char *argv[]) {
289         int cmd, r;
290         unsigned retries;
291         bool need_umount = true, need_swapoff = true, need_loop_detach = true, need_dm_detach = true;
292         bool killed_everbody = false, in_container;
293
294         log_parse_environment();
295         log_set_target(LOG_TARGET_CONSOLE); /* syslog will die if not gone yet */
296         log_open();
297
298         umask(0022);
299
300         if (getpid() != 1) {
301                 log_error("Not executed by init (pid 1).");
302                 r = -EPERM;
303                 goto error;
304         }
305
306         if (argc != 2) {
307                 log_error("Invalid number of arguments.");
308                 r = -EINVAL;
309                 goto error;
310         }
311
312         in_container = detect_container(NULL) > 0;
313
314         if (streq(argv[1], "reboot"))
315                 cmd = RB_AUTOBOOT;
316         else if (streq(argv[1], "poweroff"))
317                 cmd = RB_POWER_OFF;
318         else if (streq(argv[1], "halt"))
319                 cmd = RB_HALT_SYSTEM;
320         else if (streq(argv[1], "kexec"))
321                 cmd = LINUX_REBOOT_CMD_KEXEC;
322         else {
323                 log_error("Unknown action '%s'.", argv[1]);
324                 r = -EINVAL;
325                 goto error;
326         }
327
328         /* lock us into memory */
329         if (mlockall(MCL_CURRENT|MCL_FUTURE) != 0)
330                 log_warning("Cannot lock process memory: %m");
331
332         log_info("Sending SIGTERM to remaining processes...");
333         send_signal(SIGTERM);
334
335         log_info("Sending SIGKILL to remaining processes...");
336         send_signal(SIGKILL);
337
338         if (in_container)
339                 need_swapoff = false;
340
341         /* Unmount all mountpoints, swaps, and loopback devices */
342         for (retries = 0; retries < FINALIZE_ATTEMPTS; retries++) {
343                 bool changed = false;
344
345                 if (need_umount) {
346                         log_info("Unmounting file systems.");
347                         r = umount_all(&changed);
348                         if (r == 0)
349                                 need_umount = false;
350                         else if (r > 0)
351                                 log_info("Not all file systems unmounted, %d left.", r);
352                         else
353                                 log_error("Failed to unmount file systems: %s", strerror(-r));
354                 }
355
356                 if (need_swapoff) {
357                         log_info("Disabling swaps.");
358                         r = swapoff_all(&changed);
359                         if (r == 0)
360                                 need_swapoff = false;
361                         else if (r > 0)
362                                 log_info("Not all swaps are turned off, %d left.", r);
363                         else
364                                 log_error("Failed to turn off swaps: %s", strerror(-r));
365                 }
366
367                 if (need_loop_detach) {
368                         log_info("Detaching loop devices.");
369                         r = loopback_detach_all(&changed);
370                         if (r == 0)
371                                 need_loop_detach = false;
372                         else if (r > 0)
373                                 log_info("Not all loop devices detached, %d left.", r);
374                         else
375                                 log_error("Failed to detach loop devices: %s", strerror(-r));
376                 }
377
378                 if (need_dm_detach) {
379                         log_info("Detaching DM devices.");
380                         r = dm_detach_all(&changed);
381                         if (r == 0)
382                                 need_dm_detach = false;
383                         else if (r > 0)
384                                 log_warning("Not all DM devices detached, %d left.", r);
385                         else
386                                 log_error("Failed to detach DM devices: %s", strerror(-r));
387                 }
388
389                 if (!need_umount && !need_swapoff && !need_loop_detach && !need_dm_detach) {
390                         if (retries > 0)
391                                 log_info("All filesystems, swaps, loop devices, DM devices detached.");
392                         /* Yay, done */
393                         break;
394                 }
395
396                 /* If in this iteration we didn't manage to
397                  * unmount/deactivate anything, we either kill more
398                  * processes, or simply give up */
399                 if (!changed) {
400
401                         if (killed_everbody) {
402                                 /* Hmm, we already killed everybody,
403                                  * let's just give up */
404                                 log_error("Cannot finalize remaining file systems and devices, giving up.");
405                                 break;
406                         }
407
408                         log_warning("Cannot finalize remaining file systems and devices, trying to kill remaining processes.");
409                         ultimate_send_signal(SIGTERM);
410                         ultimate_send_signal(SIGKILL);
411                         killed_everbody = true;
412                 }
413
414                 log_debug("Couldn't finalize remaining file systems and devices after %u retries, trying again.", retries+1);
415         }
416
417         if (retries >= FINALIZE_ATTEMPTS)
418                 log_error("Too many iterations, giving up.");
419
420         execute_directory(SYSTEM_SHUTDOWN_PATH, NULL, NULL);
421
422         /* If we are in a container, just exit, this will kill our
423          * container for good. */
424         if (in_container) {
425                 log_error("Exiting container.");
426                 exit(0);
427         }
428
429         if (access("/run/initramfs/shutdown", X_OK) == 0) {
430
431                 if (prepare_new_root() >= 0 &&
432                     pivot_to_new_root() >= 0) {
433                         execv("/shutdown", argv);
434                         log_error("Failed to execute shutdown binary: %m");
435                 }
436         }
437
438         sync();
439
440         if (cmd == LINUX_REBOOT_CMD_KEXEC) {
441                 /* We cheat and exec kexec to avoid doing all its work */
442                 pid_t pid = fork();
443
444                 if (pid < 0)
445                         log_error("Could not fork: %m. Falling back to normal reboot.");
446                 else if (pid > 0) {
447                         wait_for_terminate_and_warn("kexec", pid);
448                         log_warning("kexec failed. Falling back to normal reboot.");
449                 } else {
450                         /* Child */
451                         const char *args[3] = { "/sbin/kexec", "-e", NULL };
452                         execv(args[0], (char * const *) args);
453                         return EXIT_FAILURE;
454                 }
455
456                 cmd = RB_AUTOBOOT;
457         }
458
459         reboot(cmd);
460         log_error("Failed to invoke reboot(): %m");
461         r = -errno;
462
463   error:
464         log_error("Critical error while doing system shutdown: %s", strerror(-r));
465
466         freeze();
467         return EXIT_FAILURE;
468 }