chiark / gitweb /
build-sys: move .pc files next to the matching sources
[elogind.git] / src / cgroup.c
1 /*-*- Mode: C; c-basic-offset: 8; indent-tabs-mode: nil -*-*/
2
3 /***
4   This file is part of systemd.
5
6   Copyright 2010 Lennart Poettering
7
8   systemd is free software; you can redistribute it and/or modify it
9   under the terms of the GNU General Public License as published by
10   the Free Software Foundation; either version 2 of the License, or
11   (at your option) any later version.
12
13   systemd is distributed in the hope that it will be useful, but
14   WITHOUT ANY WARRANTY; without even the implied warranty of
15   MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the GNU
16   General Public License for more details.
17
18   You should have received a copy of the GNU General Public License
19   along with systemd; If not, see <http://www.gnu.org/licenses/>.
20 ***/
21
22 #include <errno.h>
23 #include <assert.h>
24 #include <unistd.h>
25 #include <sys/types.h>
26 #include <signal.h>
27 #include <sys/mount.h>
28 #include <fcntl.h>
29
30 #include "cgroup.h"
31 #include "cgroup-util.h"
32 #include "log.h"
33
34 int cgroup_bonding_realize(CGroupBonding *b) {
35         int r;
36
37         assert(b);
38         assert(b->path);
39         assert(b->controller);
40
41         r = cg_create(b->controller, b->path);
42         if (r < 0) {
43                 log_warning("Failed to create cgroup %s:%s: %s", b->controller, b->path, strerror(-r));
44                 return r;
45         }
46
47         b->realized = true;
48
49         return 0;
50 }
51
52 int cgroup_bonding_realize_list(CGroupBonding *first) {
53         CGroupBonding *b;
54         int r;
55
56         LIST_FOREACH(by_unit, b, first)
57                 if ((r = cgroup_bonding_realize(b)) < 0 && b->essential)
58                         return r;
59
60         return 0;
61 }
62
63 void cgroup_bonding_free(CGroupBonding *b, bool remove_or_trim) {
64         assert(b);
65
66         if (b->unit) {
67                 CGroupBonding *f;
68
69                 LIST_REMOVE(CGroupBonding, by_unit, b->unit->meta.cgroup_bondings, b);
70
71                 if (streq(b->controller, SYSTEMD_CGROUP_CONTROLLER)) {
72                         assert_se(f = hashmap_get(b->unit->meta.manager->cgroup_bondings, b->path));
73                         LIST_REMOVE(CGroupBonding, by_path, f, b);
74
75                         if (f)
76                                 hashmap_replace(b->unit->meta.manager->cgroup_bondings, b->path, f);
77                         else
78                                 hashmap_remove(b->unit->meta.manager->cgroup_bondings, b->path);
79                 }
80         }
81
82         if (b->realized && b->ours && remove_or_trim) {
83
84                 if (cgroup_bonding_is_empty(b) > 0)
85                         cg_delete(b->controller, b->path);
86                 else
87                         cg_trim(b->controller, b->path, false);
88         }
89
90         free(b->controller);
91         free(b->path);
92         free(b);
93 }
94
95 void cgroup_bonding_free_list(CGroupBonding *first, bool remove_or_trim) {
96         CGroupBonding *b, *n;
97
98         LIST_FOREACH_SAFE(by_unit, b, n, first)
99                 cgroup_bonding_free(b, remove_or_trim);
100 }
101
102 void cgroup_bonding_trim(CGroupBonding *b, bool delete_root) {
103         assert(b);
104
105         if (b->realized && b->ours)
106                 cg_trim(b->controller, b->path, delete_root);
107 }
108
109 void cgroup_bonding_trim_list(CGroupBonding *first, bool delete_root) {
110         CGroupBonding *b;
111
112         LIST_FOREACH(by_unit, b, first)
113                 cgroup_bonding_trim(b, delete_root);
114 }
115
116 int cgroup_bonding_install(CGroupBonding *b, pid_t pid) {
117         int r;
118
119         assert(b);
120         assert(pid >= 0);
121
122         if ((r = cg_create_and_attach(b->controller, b->path, pid)) < 0)
123                 return r;
124
125         b->realized = true;
126         return 0;
127 }
128
129 int cgroup_bonding_install_list(CGroupBonding *first, pid_t pid) {
130         CGroupBonding *b;
131         int r;
132
133         LIST_FOREACH(by_unit, b, first)
134                 if ((r = cgroup_bonding_install(b, pid)) < 0 && b->essential)
135                         return r;
136
137         return 0;
138 }
139
140 int cgroup_bonding_set_group_access(CGroupBonding *b, mode_t mode, uid_t uid, gid_t gid) {
141         assert(b);
142
143         if (!b->realized)
144                 return -EINVAL;
145
146         return cg_set_group_access(b->controller, b->path, mode, uid, gid);
147 }
148
149 int cgroup_bonding_set_group_access_list(CGroupBonding *first, mode_t mode, uid_t uid, gid_t gid) {
150         CGroupBonding *b;
151         int r;
152
153         LIST_FOREACH(by_unit, b, first) {
154                 r = cgroup_bonding_set_group_access(b, mode, uid, gid);
155                 if (r < 0)
156                         return r;
157         }
158
159         return 0;
160 }
161
162 int cgroup_bonding_set_task_access(CGroupBonding *b, mode_t mode, uid_t uid, gid_t gid) {
163         assert(b);
164
165         if (!b->realized)
166                 return -EINVAL;
167
168         return cg_set_task_access(b->controller, b->path, mode, uid, gid);
169 }
170
171 int cgroup_bonding_set_task_access_list(CGroupBonding *first, mode_t mode, uid_t uid, gid_t gid) {
172         CGroupBonding *b;
173         int r;
174
175         LIST_FOREACH(by_unit, b, first) {
176                 r = cgroup_bonding_set_task_access(b, mode, uid, gid);
177                 if (r < 0)
178                         return r;
179         }
180
181         return 0;
182 }
183
184 int cgroup_bonding_kill(CGroupBonding *b, int sig, bool sigcont, Set *s) {
185         assert(b);
186         assert(sig >= 0);
187
188         /* Don't kill cgroups that aren't ours */
189         if (!b->ours)
190                 return 0;
191
192         return cg_kill_recursive(b->controller, b->path, sig, sigcont, true, false, s);
193 }
194
195 int cgroup_bonding_kill_list(CGroupBonding *first, int sig, bool sigcont, Set *s) {
196         CGroupBonding *b;
197         Set *allocated_set = NULL;
198         int ret = -EAGAIN, r;
199
200         if (!s)
201                 if (!(s = allocated_set = set_new(trivial_hash_func, trivial_compare_func)))
202                         return -ENOMEM;
203
204         LIST_FOREACH(by_unit, b, first) {
205                 if ((r = cgroup_bonding_kill(b, sig, sigcont, s)) < 0) {
206                         if (r == -EAGAIN || r == -ESRCH)
207                                 continue;
208
209                         ret = r;
210                         goto finish;
211                 }
212
213                 if (ret < 0 || r > 0)
214                         ret = r;
215         }
216
217 finish:
218         if (allocated_set)
219                 set_free(allocated_set);
220
221         return ret;
222 }
223
224 /* Returns 1 if the group is empty, 0 if it is not, -EAGAIN if we
225  * cannot know */
226 int cgroup_bonding_is_empty(CGroupBonding *b) {
227         int r;
228
229         assert(b);
230
231         if ((r = cg_is_empty_recursive(b->controller, b->path, true)) < 0)
232                 return r;
233
234         /* If it is empty it is empty */
235         if (r > 0)
236                 return 1;
237
238         /* It's not only us using this cgroup, so we just don't know */
239         return b->ours ? 0 : -EAGAIN;
240 }
241
242 int cgroup_bonding_is_empty_list(CGroupBonding *first) {
243         CGroupBonding *b;
244
245         LIST_FOREACH(by_unit, b, first) {
246                 int r;
247
248                 if ((r = cgroup_bonding_is_empty(b)) < 0) {
249                         /* If this returned -EAGAIN, then we don't know if the
250                          * group is empty, so let's see if another group can
251                          * tell us */
252
253                         if (r != -EAGAIN)
254                                 return r;
255                 } else
256                         return r;
257         }
258
259         return -EAGAIN;
260 }
261
262 int manager_setup_cgroup(Manager *m) {
263         char *current = NULL, *path = NULL;
264         int r;
265         char suffix[32];
266
267         assert(m);
268
269         /* 0. Be nice to Ingo Molnar #628004 */
270         if (path_is_mount_point("/sys/fs/cgroup/systemd", false) <= 0) {
271                 log_warning("No control group support available, not creating root group.");
272                 return 0;
273         }
274
275         /* 1. Determine hierarchy */
276         if ((r = cg_get_by_pid(SYSTEMD_CGROUP_CONTROLLER, 0, &current)) < 0) {
277                 log_error("Cannot determine cgroup we are running in: %s", strerror(-r));
278                 goto finish;
279         }
280
281         if (m->running_as == MANAGER_SYSTEM)
282                 strcpy(suffix, "/system");
283         else {
284                 snprintf(suffix, sizeof(suffix), "/systemd-%lu", (unsigned long) getpid());
285                 char_array_0(suffix);
286         }
287
288         free(m->cgroup_hierarchy);
289         if (endswith(current, suffix)) {
290                 /* We probably got reexecuted and can continue to use our root cgroup */
291                 m->cgroup_hierarchy = current;
292                 current = NULL;
293
294         } else {
295                 /* We need a new root cgroup */
296                 m->cgroup_hierarchy = NULL;
297                 if (asprintf(&m->cgroup_hierarchy, "%s%s", streq(current, "/") ? "" : current, suffix) < 0) {
298                         log_error("Out of memory");
299                         r = -ENOMEM;
300                         goto finish;
301                 }
302         }
303
304         /* 2. Show data */
305         if ((r = cg_get_path(SYSTEMD_CGROUP_CONTROLLER, m->cgroup_hierarchy, NULL, &path)) < 0) {
306                 log_error("Cannot find cgroup mount point: %s", strerror(-r));
307                 goto finish;
308         }
309
310         log_debug("Using cgroup controller " SYSTEMD_CGROUP_CONTROLLER ". File system hierarchy is at %s.", path);
311
312         /* 3. Install agent */
313         if ((r = cg_install_release_agent(SYSTEMD_CGROUP_CONTROLLER, SYSTEMD_CGROUP_AGENT_PATH)) < 0)
314                 log_warning("Failed to install release agent, ignoring: %s", strerror(-r));
315         else if (r > 0)
316                 log_debug("Installed release agent.");
317         else
318                 log_debug("Release agent already installed.");
319
320         /* 4. Realize the group */
321         if ((r = cg_create_and_attach(SYSTEMD_CGROUP_CONTROLLER, m->cgroup_hierarchy, 0)) < 0) {
322                 log_error("Failed to create root cgroup hierarchy: %s", strerror(-r));
323                 goto finish;
324         }
325
326         /* 5. And pin it, so that it cannot be unmounted */
327         if (m->pin_cgroupfs_fd >= 0)
328                 close_nointr_nofail(m->pin_cgroupfs_fd);
329
330         if ((m->pin_cgroupfs_fd = open(path, O_RDONLY|O_CLOEXEC|O_DIRECTORY|O_NOCTTY|O_NONBLOCK)) < 0) {
331                 log_error("Failed to open pin file: %m");
332                 r = -errno;
333                 goto finish;
334         }
335
336         log_debug("Created root group.");
337
338 finish:
339         free(current);
340         free(path);
341
342         return r;
343 }
344
345 void manager_shutdown_cgroup(Manager *m, bool delete) {
346         assert(m);
347
348         if (delete && m->cgroup_hierarchy)
349                 cg_delete(SYSTEMD_CGROUP_CONTROLLER, m->cgroup_hierarchy);
350
351         if (m->pin_cgroupfs_fd >= 0) {
352                 close_nointr_nofail(m->pin_cgroupfs_fd);
353                 m->pin_cgroupfs_fd = -1;
354         }
355
356         free(m->cgroup_hierarchy);
357         m->cgroup_hierarchy = NULL;
358 }
359
360 int cgroup_notify_empty(Manager *m, const char *group) {
361         CGroupBonding *l, *b;
362
363         assert(m);
364         assert(group);
365
366         l = hashmap_get(m->cgroup_bondings, group);
367         if (!l)
368                 return 0;
369
370         LIST_FOREACH(by_path, b, l) {
371                 int t;
372
373                 if (!b->unit)
374                         continue;
375
376                 t = cgroup_bonding_is_empty_list(b);
377                 if (t < 0) {
378
379                         /* If we don't know, we don't know */
380                         if (t != -EAGAIN)
381                                 log_warning("Failed to check whether cgroup is empty: %s", strerror(errno));
382
383                         continue;
384                 }
385
386                 if (t > 0) {
387                         /* If it is empty, let's delete it */
388                         cgroup_bonding_trim_list(b->unit->meta.cgroup_bondings, true);
389
390                         if (UNIT_VTABLE(b->unit)->cgroup_notify_empty)
391                                 UNIT_VTABLE(b->unit)->cgroup_notify_empty(b->unit);
392                 }
393         }
394
395         return 0;
396 }
397
398 Unit* cgroup_unit_by_pid(Manager *m, pid_t pid) {
399         CGroupBonding *l, *b;
400         char *group = NULL;
401
402         assert(m);
403
404         if (pid <= 1)
405                 return NULL;
406
407         if (cg_get_by_pid(SYSTEMD_CGROUP_CONTROLLER, pid, &group) < 0)
408                 return NULL;
409
410         l = hashmap_get(m->cgroup_bondings, group);
411
412         if (!l) {
413                 char *slash;
414
415                 while ((slash = strrchr(group, '/'))) {
416                         if (slash == group)
417                                 break;
418
419                         *slash = 0;
420
421                         if ((l = hashmap_get(m->cgroup_bondings, group)))
422                                 break;
423                 }
424         }
425
426         free(group);
427
428         LIST_FOREACH(by_path, b, l) {
429
430                 if (!b->unit)
431                         continue;
432
433                 if (b->ours)
434                         return b->unit;
435         }
436
437         return NULL;
438 }
439
440 CGroupBonding *cgroup_bonding_find_list(CGroupBonding *first, const char *controller) {
441         CGroupBonding *b;
442
443         assert(controller);
444
445         LIST_FOREACH(by_unit, b, first)
446                 if (streq(b->controller, controller))
447                         return b;
448
449         return NULL;
450 }
451
452 char *cgroup_bonding_to_string(CGroupBonding *b) {
453         char *r;
454
455         assert(b);
456
457         if (asprintf(&r, "%s:%s", b->controller, b->path) < 0)
458                 return NULL;
459
460         return r;
461 }
462
463 pid_t cgroup_bonding_search_main_pid(CGroupBonding *b) {
464         FILE *f;
465         pid_t pid = 0, npid, mypid;
466
467         assert(b);
468
469         if (!b->ours)
470                 return 0;
471
472         if (cg_enumerate_processes(b->controller, b->path, &f) < 0)
473                 return 0;
474
475         mypid = getpid();
476
477         while (cg_read_pid(f, &npid) > 0)  {
478                 pid_t ppid;
479
480                 if (npid == pid)
481                         continue;
482
483                 /* Ignore processes that aren't our kids */
484                 if (get_parent_of_pid(npid, &ppid) >= 0 && ppid != mypid)
485                         continue;
486
487                 if (pid != 0) {
488                         /* Dang, there's more than one daemonized PID
489                         in this group, so we don't know what process
490                         is the main process. */
491                         pid = 0;
492                         break;
493                 }
494
495                 pid = npid;
496         }
497
498         fclose(f);
499
500         return pid;
501 }
502
503 pid_t cgroup_bonding_search_main_pid_list(CGroupBonding *first) {
504         CGroupBonding *b;
505         pid_t pid;
506
507         /* Try to find a main pid from this cgroup, but checking if
508          * there's only one PID in the cgroup and returning it. Later
509          * on we might want to add additional, smarter heuristics
510          * here. */
511
512         LIST_FOREACH(by_unit, b, first)
513                 if ((pid = cgroup_bonding_search_main_pid(b)) != 0)
514                         return pid;
515
516         return 0;
517
518 }