chiark / gitweb /
core: rework how we flush incoming traffic when a socket unit goes down
[elogind.git] / src / basic / capability-util.c
1 /***
2   This file is part of systemd.
3
4   Copyright 2010 Lennart Poettering
5
6   systemd is free software; you can redistribute it and/or modify it
7   under the terms of the GNU Lesser General Public License as published by
8   the Free Software Foundation; either version 2.1 of the License, or
9   (at your option) any later version.
10
11   systemd is distributed in the hope that it will be useful, but
12   WITHOUT ANY WARRANTY; without even the implied warranty of
13   MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the GNU
14   Lesser General Public License for more details.
15
16   You should have received a copy of the GNU Lesser General Public License
17   along with systemd; If not, see <http://www.gnu.org/licenses/>.
18 ***/
19
20 #include <errno.h>
21 #include <grp.h>
22 #include <stdio.h>
23 #include <stdlib.h>
24 #include <sys/capability.h>
25 #include <sys/prctl.h>
26 #include <unistd.h>
27
28 #include "alloc-util.h"
29 #include "capability-util.h"
30 #include "fileio.h"
31 #include "log.h"
32 #include "macro.h"
33 #include "parse-util.h"
34 #include "util.h"
35
36 #if 0 /// UNNEEDED by elogind
37 int have_effective_cap(int value) {
38         _cleanup_cap_free_ cap_t cap;
39         cap_flag_value_t fv;
40
41         cap = cap_get_proc();
42         if (!cap)
43                 return -errno;
44
45         if (cap_get_flag(cap, value, CAP_EFFECTIVE, &fv) < 0)
46                 return -errno;
47         else
48                 return fv == CAP_SET;
49 }
50 #endif // 0
51
52 unsigned long cap_last_cap(void) {
53         static thread_local unsigned long saved;
54         static thread_local bool valid = false;
55         _cleanup_free_ char *content = NULL;
56         unsigned long p = 0;
57         int r;
58
59         if (valid)
60                 return saved;
61
62         /* available since linux-3.2 */
63         r = read_one_line_file("/proc/sys/kernel/cap_last_cap", &content);
64         if (r >= 0) {
65                 r = safe_atolu(content, &p);
66                 if (r >= 0) {
67                         saved = p;
68                         valid = true;
69                         return p;
70                 }
71         }
72
73         /* fall back to syscall-probing for pre linux-3.2 */
74         p = (unsigned long) CAP_LAST_CAP;
75
76         if (prctl(PR_CAPBSET_READ, p) < 0) {
77
78                 /* Hmm, look downwards, until we find one that
79                  * works */
80                 for (p--; p > 0; p --)
81                         if (prctl(PR_CAPBSET_READ, p) >= 0)
82                                 break;
83
84         } else {
85
86                 /* Hmm, look upwards, until we find one that doesn't
87                  * work */
88                 for (;; p++)
89                         if (prctl(PR_CAPBSET_READ, p+1) < 0)
90                                 break;
91         }
92
93         saved = p;
94         valid = true;
95
96         return p;
97 }
98
99 #if 0 /// UNNEEDED by elogind
100 int capability_update_inherited_set(cap_t caps, uint64_t set) {
101         unsigned long i;
102
103         /* Add capabilities in the set to the inherited caps. Do not apply
104          * them yet. */
105
106         for (i = 0; i < cap_last_cap(); i++) {
107
108                 if (set & (UINT64_C(1) << i)) {
109                         cap_value_t v;
110
111                         v = (cap_value_t) i;
112
113                         /* Make the capability inheritable. */
114                         if (cap_set_flag(caps, CAP_INHERITABLE, 1, &v, CAP_SET) < 0)
115                                 return -errno;
116                 }
117         }
118
119         return 0;
120 }
121
122 int capability_ambient_set_apply(uint64_t set, bool also_inherit) {
123         unsigned long i;
124         _cleanup_cap_free_ cap_t caps = NULL;
125
126         /* Add the capabilities to the ambient set. */
127
128         if (also_inherit) {
129                 int r;
130                 caps = cap_get_proc();
131                 if (!caps)
132                         return -errno;
133
134                 r = capability_update_inherited_set(caps, set);
135                 if (r < 0)
136                         return -errno;
137
138                 if (cap_set_proc(caps) < 0)
139                         return -errno;
140         }
141
142         for (i = 0; i < cap_last_cap(); i++) {
143
144                 if (set & (UINT64_C(1) << i)) {
145
146                         /* Add the capability to the ambient set. */
147                         if (prctl(PR_CAP_AMBIENT, PR_CAP_AMBIENT_RAISE, i, 0, 0) < 0)
148                                 return -errno;
149                 }
150         }
151
152         return 0;
153 }
154
155 int capability_bounding_set_drop(uint64_t keep, bool right_now) {
156         _cleanup_cap_free_ cap_t after_cap = NULL;
157         cap_flag_value_t fv;
158         unsigned long i;
159         int r;
160
161         /* If we are run as PID 1 we will lack CAP_SETPCAP by default
162          * in the effective set (yes, the kernel drops that when
163          * executing init!), so get it back temporarily so that we can
164          * call PR_CAPBSET_DROP. */
165
166         after_cap = cap_get_proc();
167         if (!after_cap)
168                 return -errno;
169
170         if (cap_get_flag(after_cap, CAP_SETPCAP, CAP_EFFECTIVE, &fv) < 0)
171                 return -errno;
172
173         if (fv != CAP_SET) {
174                 _cleanup_cap_free_ cap_t temp_cap = NULL;
175                 static const cap_value_t v = CAP_SETPCAP;
176
177                 temp_cap = cap_dup(after_cap);
178                 if (!temp_cap) {
179                         r = -errno;
180                         goto finish;
181                 }
182
183                 if (cap_set_flag(temp_cap, CAP_EFFECTIVE, 1, &v, CAP_SET) < 0) {
184                         r = -errno;
185                         goto finish;
186                 }
187
188                 if (cap_set_proc(temp_cap) < 0) {
189                         r = -errno;
190                         goto finish;
191                 }
192         }
193
194         for (i = 0; i <= cap_last_cap(); i++) {
195
196                 if (!(keep & (UINT64_C(1) << i))) {
197                         cap_value_t v;
198
199                         /* Drop it from the bounding set */
200                         if (prctl(PR_CAPBSET_DROP, i) < 0) {
201                                 r = -errno;
202                                 goto finish;
203                         }
204                         v = (cap_value_t) i;
205
206                         /* Also drop it from the inheritable set, so
207                          * that anything we exec() loses the
208                          * capability for good. */
209                         if (cap_set_flag(after_cap, CAP_INHERITABLE, 1, &v, CAP_CLEAR) < 0) {
210                                 r = -errno;
211                                 goto finish;
212                         }
213
214                         /* If we shall apply this right now drop it
215                          * also from our own capability sets. */
216                         if (right_now) {
217                                 if (cap_set_flag(after_cap, CAP_PERMITTED, 1, &v, CAP_CLEAR) < 0 ||
218                                     cap_set_flag(after_cap, CAP_EFFECTIVE, 1, &v, CAP_CLEAR) < 0) {
219                                         r = -errno;
220                                         goto finish;
221                                 }
222                         }
223                 }
224         }
225
226         r = 0;
227
228 finish:
229         if (cap_set_proc(after_cap) < 0)
230                 return -errno;
231
232         return r;
233 }
234
235 static int drop_from_file(const char *fn, uint64_t keep) {
236         int r, k;
237         uint32_t hi, lo;
238         uint64_t current, after;
239         char *p;
240
241         r = read_one_line_file(fn, &p);
242         if (r < 0)
243                 return r;
244
245         assert_cc(sizeof(hi) == sizeof(unsigned));
246         assert_cc(sizeof(lo) == sizeof(unsigned));
247
248         k = sscanf(p, "%u %u", &lo, &hi);
249         free(p);
250
251         if (k != 2)
252                 return -EIO;
253
254         current = (uint64_t) lo | ((uint64_t) hi << 32ULL);
255         after = current & keep;
256
257         if (current == after)
258                 return 0;
259
260         lo = (unsigned) (after & 0xFFFFFFFFULL);
261         hi = (unsigned) ((after >> 32ULL) & 0xFFFFFFFFULL);
262
263         if (asprintf(&p, "%u %u", lo, hi) < 0)
264                 return -ENOMEM;
265
266         r = write_string_file(fn, p, WRITE_STRING_FILE_CREATE);
267         free(p);
268
269         return r;
270 }
271
272 int capability_bounding_set_drop_usermode(uint64_t keep) {
273         int r;
274
275         r = drop_from_file("/proc/sys/kernel/usermodehelper/inheritable", keep);
276         if (r < 0)
277                 return r;
278
279         r = drop_from_file("/proc/sys/kernel/usermodehelper/bset", keep);
280         if (r < 0)
281                 return r;
282
283         return r;
284 }
285
286 int drop_privileges(uid_t uid, gid_t gid, uint64_t keep_capabilities) {
287         _cleanup_cap_free_ cap_t d = NULL;
288         unsigned i, j = 0;
289         int r;
290
291         /* Unfortunately we cannot leave privilege dropping to PID 1
292          * here, since we want to run as user but want to keep some
293          * capabilities. Since file capabilities have been introduced
294          * this cannot be done across exec() anymore, unless our
295          * binary has the capability configured in the file system,
296          * which we want to avoid. */
297
298         if (setresgid(gid, gid, gid) < 0)
299                 return log_error_errno(errno, "Failed to change group ID: %m");
300
301         if (setgroups(0, NULL) < 0)
302                 return log_error_errno(errno, "Failed to drop auxiliary groups list: %m");
303
304         /* Ensure we keep the permitted caps across the setresuid() */
305         if (prctl(PR_SET_KEEPCAPS, 1) < 0)
306                 return log_error_errno(errno, "Failed to enable keep capabilities flag: %m");
307
308         r = setresuid(uid, uid, uid);
309         if (r < 0)
310                 return log_error_errno(errno, "Failed to change user ID: %m");
311
312         if (prctl(PR_SET_KEEPCAPS, 0) < 0)
313                 return log_error_errno(errno, "Failed to disable keep capabilities flag: %m");
314
315         /* Drop all caps from the bounding set, except the ones we want */
316         r = capability_bounding_set_drop(keep_capabilities, true);
317         if (r < 0)
318                 return log_error_errno(r, "Failed to drop capabilities: %m");
319
320         /* Now upgrade the permitted caps we still kept to effective caps */
321         d = cap_init();
322         if (!d)
323                 return log_oom();
324
325         if (keep_capabilities) {
326                 cap_value_t bits[u64log2(keep_capabilities) + 1];
327
328                 for (i = 0; i < ELEMENTSOF(bits); i++)
329                         if (keep_capabilities & (1ULL << i))
330                                 bits[j++] = i;
331
332                 /* use enough bits */
333                 assert(i == 64 || (keep_capabilities >> i) == 0);
334                 /* don't use too many bits */
335                 assert(keep_capabilities & (1ULL << (i - 1)));
336
337                 if (cap_set_flag(d, CAP_EFFECTIVE, j, bits, CAP_SET) < 0 ||
338                     cap_set_flag(d, CAP_PERMITTED, j, bits, CAP_SET) < 0)
339                         return log_error_errno(errno, "Failed to enable capabilities bits: %m");
340
341                 if (cap_set_proc(d) < 0)
342                         return log_error_errno(errno, "Failed to increase capabilities: %m");
343         }
344
345         return 0;
346 }
347
348 int drop_capability(cap_value_t cv) {
349         _cleanup_cap_free_ cap_t tmp_cap = NULL;
350
351         tmp_cap = cap_get_proc();
352         if (!tmp_cap)
353                 return -errno;
354
355         if ((cap_set_flag(tmp_cap, CAP_INHERITABLE, 1, &cv, CAP_CLEAR) < 0) ||
356             (cap_set_flag(tmp_cap, CAP_PERMITTED, 1, &cv, CAP_CLEAR) < 0) ||
357             (cap_set_flag(tmp_cap, CAP_EFFECTIVE, 1, &cv, CAP_CLEAR) < 0))
358                 return -errno;
359
360         if (cap_set_proc(tmp_cap) < 0)
361                 return -errno;
362
363         return 0;
364 }
365 #endif // 0