chiark / gitweb /
units: set capability bounding set for syslog services
[elogind.git] / src / cgroup.c
1 /*-*- Mode: C; c-basic-offset: 8; indent-tabs-mode: nil -*-*/
2
3 /***
4   This file is part of systemd.
5
6   Copyright 2010 Lennart Poettering
7
8   systemd is free software; you can redistribute it and/or modify it
9   under the terms of the GNU General Public License as published by
10   the Free Software Foundation; either version 2 of the License, or
11   (at your option) any later version.
12
13   systemd is distributed in the hope that it will be useful, but
14   WITHOUT ANY WARRANTY; without even the implied warranty of
15   MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the GNU
16   General Public License for more details.
17
18   You should have received a copy of the GNU General Public License
19   along with systemd; If not, see <http://www.gnu.org/licenses/>.
20 ***/
21
22 #include <errno.h>
23 #include <assert.h>
24 #include <unistd.h>
25 #include <sys/types.h>
26 #include <signal.h>
27 #include <sys/mount.h>
28 #include <fcntl.h>
29
30 #include "cgroup.h"
31 #include "cgroup-util.h"
32 #include "log.h"
33
34 int cgroup_bonding_realize(CGroupBonding *b) {
35         int r;
36
37         assert(b);
38         assert(b->path);
39         assert(b->controller);
40
41         if (b->realized)
42                 return 0;
43
44         if ((r = cg_create(b->controller, b->path)) < 0)
45                 return r;
46
47         b->realized = true;
48
49         if (b->ours)
50                 cg_trim(b->controller, b->path, false);
51
52         return 0;
53 }
54
55 int cgroup_bonding_realize_list(CGroupBonding *first) {
56         CGroupBonding *b;
57         int r;
58
59         LIST_FOREACH(by_unit, b, first)
60                 if ((r = cgroup_bonding_realize(b)) < 0 && b->essential)
61                         return r;
62
63         return 0;
64 }
65
66 void cgroup_bonding_free(CGroupBonding *b) {
67         assert(b);
68
69         if (b->unit) {
70                 CGroupBonding *f;
71
72                 LIST_REMOVE(CGroupBonding, by_unit, b->unit->meta.cgroup_bondings, b);
73
74                 if (streq(b->controller, SYSTEMD_CGROUP_CONTROLLER)) {
75                         assert_se(f = hashmap_get(b->unit->meta.manager->cgroup_bondings, b->path));
76                         LIST_REMOVE(CGroupBonding, by_path, f, b);
77
78                         if (f)
79                                 hashmap_replace(b->unit->meta.manager->cgroup_bondings, b->path, f);
80                         else
81                                 hashmap_remove(b->unit->meta.manager->cgroup_bondings, b->path);
82                 }
83         }
84
85         if (b->realized && b->ours) {
86
87                 if (cgroup_bonding_is_empty(b) > 0)
88                         cg_delete(b->controller, b->path);
89                 else
90                         cg_trim(b->controller, b->path, false);
91         }
92
93         free(b->controller);
94         free(b->path);
95         free(b);
96 }
97
98 void cgroup_bonding_free_list(CGroupBonding *first) {
99         CGroupBonding *b, *n;
100
101         LIST_FOREACH_SAFE(by_unit, b, n, first)
102                 cgroup_bonding_free(b);
103 }
104
105 void cgroup_bonding_trim(CGroupBonding *b, bool delete_root) {
106         assert(b);
107
108         if (b->realized && b->ours)
109                 cg_trim(b->controller, b->path, delete_root);
110 }
111
112 void cgroup_bonding_trim_list(CGroupBonding *first, bool delete_root) {
113         CGroupBonding *b;
114
115         LIST_FOREACH(by_unit, b, first)
116                 cgroup_bonding_trim(b, delete_root);
117 }
118
119 int cgroup_bonding_install(CGroupBonding *b, pid_t pid) {
120         int r;
121
122         assert(b);
123         assert(pid >= 0);
124
125         if ((r = cg_create_and_attach(b->controller, b->path, pid)) < 0)
126                 return r;
127
128         b->realized = true;
129         return 0;
130 }
131
132 int cgroup_bonding_install_list(CGroupBonding *first, pid_t pid) {
133         CGroupBonding *b;
134         int r;
135
136         LIST_FOREACH(by_unit, b, first)
137                 if ((r = cgroup_bonding_install(b, pid)) < 0 && b->essential)
138                         return r;
139
140         return 0;
141 }
142
143 int cgroup_bonding_kill(CGroupBonding *b, int sig, bool sigcont, Set *s) {
144         assert(b);
145         assert(sig >= 0);
146
147         /* Don't kill cgroups that aren't ours */
148         if (!b->realized || !b->ours)
149                 return 0;
150
151         return cg_kill_recursive(b->controller, b->path, sig, sigcont, true, false, s);
152 }
153
154 int cgroup_bonding_kill_list(CGroupBonding *first, int sig, bool sigcont, Set *s) {
155         CGroupBonding *b;
156         Set *allocated_set = NULL;
157         int ret = -EAGAIN, r;
158
159         if (!s)
160                 if (!(s = allocated_set = set_new(trivial_hash_func, trivial_compare_func)))
161                         return -ENOMEM;
162
163         LIST_FOREACH(by_unit, b, first) {
164                 if ((r = cgroup_bonding_kill(b, sig, sigcont, s)) < 0) {
165                         if (r == -EAGAIN || r == -ESRCH)
166                                 continue;
167
168                         ret = r;
169                         goto finish;
170                 }
171
172                 if (ret < 0 || r > 0)
173                         ret = r;
174         }
175
176 finish:
177         if (allocated_set)
178                 set_free(allocated_set);
179
180         return ret;
181 }
182
183 /* Returns 1 if the group is empty, 0 if it is not, -EAGAIN if we
184  * cannot know */
185 int cgroup_bonding_is_empty(CGroupBonding *b) {
186         int r;
187
188         assert(b);
189
190         if ((r = cg_is_empty_recursive(b->controller, b->path, true)) < 0)
191                 return r;
192
193         /* If it is empty it is empty */
194         if (r > 0)
195                 return 1;
196
197         /* It's not only us using this cgroup, so we just don't know */
198         return b->ours ? 0 : -EAGAIN;
199 }
200
201 int cgroup_bonding_is_empty_list(CGroupBonding *first) {
202         CGroupBonding *b;
203
204         LIST_FOREACH(by_unit, b, first) {
205                 int r;
206
207                 if ((r = cgroup_bonding_is_empty(b)) < 0) {
208                         /* If this returned -EAGAIN, then we don't know if the
209                          * group is empty, so let's see if another group can
210                          * tell us */
211
212                         if (r != -EAGAIN)
213                                 return r;
214                 } else
215                         return r;
216         }
217
218         return -EAGAIN;
219 }
220
221 int manager_setup_cgroup(Manager *m) {
222         char *current = NULL, *path = NULL;
223         int r;
224         char suffix[32];
225
226         assert(m);
227
228         /* 0. Be nice to Ingo Molnar #628004 */
229         if (path_is_mount_point("/sys/fs/cgroup/systemd") <= 0) {
230                 log_warning("No control group support available, not creating root group.");
231                 return 0;
232         }
233
234         /* 1. Determine hierarchy */
235         if ((r = cg_get_by_pid(SYSTEMD_CGROUP_CONTROLLER, 0, &current)) < 0) {
236                 log_error("Cannot determine cgroup we are running in: %s", strerror(-r));
237                 goto finish;
238         }
239
240         if (m->running_as == MANAGER_SYSTEM)
241                 strcpy(suffix, "/system");
242         else {
243                 snprintf(suffix, sizeof(suffix), "/systemd-%lu", (unsigned long) getpid());
244                 char_array_0(suffix);
245         }
246
247         free(m->cgroup_hierarchy);
248         if (endswith(current, suffix)) {
249                 /* We probably got reexecuted and can continue to use our root cgroup */
250                 m->cgroup_hierarchy = current;
251                 current = NULL;
252
253         } else {
254                 /* We need a new root cgroup */
255                 m->cgroup_hierarchy = NULL;
256                 if (asprintf(&m->cgroup_hierarchy, "%s%s", streq(current, "/") ? "" : current, suffix) < 0) {
257                         log_error("Out of memory");
258                         r = -ENOMEM;
259                         goto finish;
260                 }
261         }
262
263         /* 2. Show data */
264         if ((r = cg_get_path(SYSTEMD_CGROUP_CONTROLLER, m->cgroup_hierarchy, NULL, &path)) < 0) {
265                 log_error("Cannot find cgroup mount point: %s", strerror(-r));
266                 goto finish;
267         }
268
269         log_debug("Using cgroup controller " SYSTEMD_CGROUP_CONTROLLER ". File system hierarchy is at %s.", path);
270
271         /* 3. Install agent */
272         if ((r = cg_install_release_agent(SYSTEMD_CGROUP_CONTROLLER, SYSTEMD_CGROUP_AGENT_PATH)) < 0)
273                 log_warning("Failed to install release agent, ignoring: %s", strerror(-r));
274         else if (r > 0)
275                 log_debug("Installed release agent.");
276         else
277                 log_debug("Release agent already installed.");
278
279         /* 4. Realize the group */
280         if ((r = cg_create_and_attach(SYSTEMD_CGROUP_CONTROLLER, m->cgroup_hierarchy, 0)) < 0) {
281                 log_error("Failed to create root cgroup hierarchy: %s", strerror(-r));
282                 goto finish;
283         }
284
285         /* 5. And pin it, so that it cannot be unmounted */
286         if (m->pin_cgroupfs_fd >= 0)
287                 close_nointr_nofail(m->pin_cgroupfs_fd);
288
289         if ((m->pin_cgroupfs_fd = open(path, O_RDONLY|O_CLOEXEC|O_DIRECTORY|O_NOCTTY|O_NONBLOCK)) < 0) {
290                 log_error("Failed to open pin file: %m");
291                 r = -errno;
292                 goto finish;
293         }
294
295         log_debug("Created root group.");
296
297 finish:
298         free(current);
299         free(path);
300
301         return r;
302 }
303
304 void manager_shutdown_cgroup(Manager *m, bool delete) {
305         assert(m);
306
307         if (delete && m->cgroup_hierarchy)
308                 cg_delete(SYSTEMD_CGROUP_CONTROLLER, m->cgroup_hierarchy);
309
310         if (m->pin_cgroupfs_fd >= 0) {
311                 close_nointr_nofail(m->pin_cgroupfs_fd);
312                 m->pin_cgroupfs_fd = -1;
313         }
314
315         free(m->cgroup_hierarchy);
316         m->cgroup_hierarchy = NULL;
317 }
318
319 int cgroup_notify_empty(Manager *m, const char *group) {
320         CGroupBonding *l, *b;
321
322         assert(m);
323         assert(group);
324
325         if (!(l = hashmap_get(m->cgroup_bondings, group)))
326                 return 0;
327
328         LIST_FOREACH(by_path, b, l) {
329                 int t;
330
331                 if (!b->unit)
332                         continue;
333
334                 if ((t = cgroup_bonding_is_empty_list(b)) < 0) {
335
336                         /* If we don't know, we don't know */
337                         if (t != -EAGAIN)
338                                 log_warning("Failed to check whether cgroup is empty: %s", strerror(errno));
339
340                         continue;
341                 }
342
343                 if (t > 0)
344                         if (UNIT_VTABLE(b->unit)->cgroup_notify_empty)
345                                 UNIT_VTABLE(b->unit)->cgroup_notify_empty(b->unit);
346         }
347
348         return 0;
349 }
350
351 Unit* cgroup_unit_by_pid(Manager *m, pid_t pid) {
352         CGroupBonding *l, *b;
353         char *group = NULL;
354
355         assert(m);
356
357         if (pid <= 1)
358                 return NULL;
359
360         if (cg_get_by_pid(SYSTEMD_CGROUP_CONTROLLER, pid, &group) < 0)
361                 return NULL;
362
363         l = hashmap_get(m->cgroup_bondings, group);
364
365         if (!l) {
366                 char *slash;
367
368                 while ((slash = strrchr(group, '/'))) {
369                         if (slash == group)
370                                 break;
371
372                         *slash = 0;
373
374                         if ((l = hashmap_get(m->cgroup_bondings, group)))
375                                 break;
376                 }
377         }
378
379         free(group);
380
381         LIST_FOREACH(by_path, b, l) {
382
383                 if (!b->unit)
384                         continue;
385
386                 if (b->ours)
387                         return b->unit;
388         }
389
390         return NULL;
391 }
392
393 CGroupBonding *cgroup_bonding_find_list(CGroupBonding *first, const char *controller) {
394         CGroupBonding *b;
395
396         assert(controller);
397
398         LIST_FOREACH(by_unit, b, first)
399                 if (streq(b->controller, controller))
400                         return b;
401
402         return NULL;
403 }
404
405 char *cgroup_bonding_to_string(CGroupBonding *b) {
406         char *r;
407
408         assert(b);
409
410         if (asprintf(&r, "%s:%s", b->controller, b->path) < 0)
411                 return NULL;
412
413         return r;
414 }
415
416 pid_t cgroup_bonding_search_main_pid(CGroupBonding *b) {
417         FILE *f;
418         pid_t pid = 0, npid, mypid;
419
420         assert(b);
421
422         if (!b->ours)
423                 return 0;
424
425         if (cg_enumerate_processes(b->controller, b->path, &f) < 0)
426                 return 0;
427
428         mypid = getpid();
429
430         while (cg_read_pid(f, &npid) > 0)  {
431                 pid_t ppid;
432
433                 if (npid == pid)
434                         continue;
435
436                 /* Ignore processes that aren't our kids */
437                 if (get_parent_of_pid(npid, &ppid) >= 0 && ppid != mypid)
438                         continue;
439
440                 if (pid != 0) {
441                         /* Dang, there's more than one daemonized PID
442                         in this group, so we don't know what process
443                         is the main process. */
444                         pid = 0;
445                         break;
446                 }
447
448                 pid = npid;
449         }
450
451         fclose(f);
452
453         return pid;
454 }
455
456 pid_t cgroup_bonding_search_main_pid_list(CGroupBonding *first) {
457         CGroupBonding *b;
458         pid_t pid;
459
460         /* Try to find a main pid from this cgroup, but checking if
461          * there's only one PID in the cgroup and returning it. Later
462          * on we might want to add additional, smarter heuristics
463          * here. */
464
465         LIST_FOREACH(by_unit, b, first)
466                 if ((pid = cgroup_bonding_search_main_pid(b)) != 0)
467                         return pid;
468
469         return 0;
470
471 }