chiark / gitweb /
90b15dbd4d3d5dc4d365d24488f94a21340d133e
[cgi-auth-flexible.git] / caf.pod
1 # -*- fundamental -*-
2
3 =head1 NAME
4
5 CGI::Auth::Flexible - web authentication optionally using cookies
6
7 =head1 SYNOPSYS
8
9  my $verifier = CGI::Auth::Flexible->new_verifier(setting => value,...);
10  my $authreq = $verifier->new_request($cgi);
11
12  # simple applications
13  $authreq->check_ok() or return;
14
15  # sophisticated applications
16  my $divert_kind = $authreq->check_divert();
17  if ($divert_kind) { ... print diversion page and quit ... }
18
19  # while handling the request
20  $user = $authreq->get_username();
21  $authreq->check_mutate();
22
23 =head1 DESCRIPTION
24
25 CGI::Auth::Flexible is a library which you can use to add a
26 forms/cookie-based login facility to a Perl web application.
27
28 CGI::Auth::Flexible doesn't interfere with your application's URL path
29 namespace and just needs a few (configurable) form parameter and
30 cookie name(s) for its own use.  It tries to avoid making assumptions
31 about the implementation structure of your application.
32
33 Because CGI::Auth::Flexible is licenced under the AGPLv3, you will
34 probably need to provide a facility to allow users (even ones not
35 logged in) to download the source code for your web app.  Conveniently
36 by default CGI::Auth::Flexible provides (for pure Perl webapps) a
37 mechanism for users to get the source.
38
39 CGI::Auth::Flexible is designed to try to stop you accidentally
40 granting access by misunderstanding the API.  (Also it, of course,
41 guards against cross-site scripting.)  You do need to make sure to
42 call CGI::Auth::Flexible before answering AJAX requests as well as
43 before generating HTML pages, of course, and to call it in every
44 entrypoint to your system.
45
46 =head2 CHECKLIST
47
48 As a minimum you need to do all of the things on this checklist, where
49 applicable.  The items marked SECURITY are the ones that you might
50 forget: without them your application may appear to work, but will be
51 insecure.
52
53 =over
54
55 =item *
56
57 Call C<new_verifier> (once at application startup)
58
59 =item *
60
61 Call C<new_request> (once per request)
62
63 =item *
64
65 B<SECURITY>: Call C<check_ok> or C<check_divert> on every request, and
66 honour the return value.
67
68 =item *
69
70 If you're using C<check_ok>, implement either the
71 C<username_password_error> or C<login_ok> hook and provide it as
72 a setting to C<new_verifier>.
73
74 =item *
75
76 Provide the setting C<dir> (or provide absolute paths for all the
77 other relevant settings).
78
79 =item *
80
81 Call C<get_username> when you need to know who's logged in.
82
83 =item *
84
85 B<SECURITY>: Call C<check_mutate> or C<mutate_ok>, if you specified
86 C<promise_check_mutate>.
87
88 =item *
89
90 B<SECURITY>: Call C<check_nonpage> for every request which is not a page load
91 (if your application has any of those).
92
93 =item *
94
95 When generating URLs and forms (including AJAX requests), include the
96 hidden form parameter using C<secret_hidden_val> or
97 C<secret_hidden_html> when appropriate (see below).
98
99 =item *
100
101 B<SECURITY>: If you do not override the source provision facility (see
102 L</SOURCE CODE DOWNLOAD>), check that the assumptions it makes aren't
103 going to leak security-critical data.
104
105 =item *
106
107 Set up HTTPS on your webserver, or set the C<encrypted_only> setting
108 to a false value.
109
110 =back
111
112 These points will now be covered in more detail.
113
114 =head2 INITIALISATION
115
116 Your application should, on startup (eg, when it is loaded by
117 mod_perl) do
118 C<< $verifier = CGI::Auth::Flexible->new_verifier(settings...) >>.
119 This call can be expensive and is best amortised.
120
121 The resulting verifier object can be used to process individual
122 requests, in each case with
123 C<< $authreq = CGI::Auth::Flexible->new_request($cgi) >>.
124
125 See L</SETTINGS>.
126
127 =head2 CHECKING AND RESPONSE GENERATION
128
129 If the user is logged in, your application is to handle the request.
130 Otherwise, the user needs to be presented with a login form or error
131 message, as appropriate.  CGI::Auth::Flexible provides two alternative
132 interfaces for this:
133
134 =head3 Simple applications
135
136 The simplist usage is to call C<< $request->check_ok() >> which will
137 check the user's authentication.  If the user is not logged in it will
138 generate a login form (or redirection or other appropriate page) and
139 return false; your application should not then processing that request
140 any further.  If the user is logged in it will return true.
141
142 Various hooks are provided to customise the responses generated by
143 C<check_ok>.
144
145 After C<check_ok> returns true you should go ahead and process the
146 request; you can use C<< $request->get_username >> to find out which
147 user the request came from.
148
149 =head2 Sophisticated applications
150
151 If you want to handle the control flow and to generate login forms,
152 redirections, etc., yourself, you can say
153 C<< $divert = $request->check_divert >>.  This returns undef if
154 the user is logged in, or I<divert spec> if some kind of login
155 page or diversion should be generated.  See L</DIVERT SPEC> below for
156 details of how to deal with the return value.
157
158 =head2 MUTATING OPERATIONS AND EXTERNAL LINKS
159
160 =head3 Mutation-ignorant applications
161
162 By default CGI::Auth::Flexible does not permit external links into
163 your site.  All GET requests give a "click to continue" page which
164 submits a form which loads your app's main page.  In this
165 configuration all your application's forms and AJAX requests should
166 use C<POST>.  This restriction arises from complicated deficiencies
167 in the web's security architecture.
168
169 Such applications are also not able to provide user-specific CSS
170 stylesheets, javascript, favicons, etc.
171
172 =head3 Mutation-aware applications
173
174 The alternative is for your application to always make a special check
175 when the incoming request is going to do some kind of action (such as
176 modifying the user's setup, purchasing goods, or whatever) rather than
177 just retrieve and/or display information.  We term such requests
178 "mutating" requests.
179
180 Then non-mutating pages can be linked to from other, untrustworthy,
181 websites.
182
183 To support external links, and C<GET> requests, pass
184 C<< promise_check_mutate => 1 >> in I<settings>, and then call
185 C<< $authreq->check_mutate() >> before taking any actions.  If the
186 incoming request is not suitable then C<< $authreq->check_mutate() >>
187 will call C<die>.
188
189 There have to be no mutating C<GET> requests in your application (but
190 you shouldn't have any of those anyway); if there are, they won't
191 work.  (CGI::Auth::Flexible will spot them and cause them to fail,
192 rather than allow them to be insecure.)
193
194 =head2 GENERATING URLS, FORMS AND AJAX QUERIES
195
196 When you generate a URL, C<POST> form or AJAX request you may need to
197 include a secret hidden form parameter for the benefit of
198 CGI::Auth::Generic.  This form parameter will be checked by
199 C<check_ok>/C<check_divert> and should be ignored by your application.
200
201 By default the hidden parameter is called C<caf_assochash>.
202
203 After calling C<check_ok> or C<check_divert> the value to put in your
204 form can be obtained from C<secret_hidden_val>; C<secret_hidden_html>
205 will generate the whole HTML C<< <input...> >> element.
206
207 =head3 Mutation-ignorant applications
208
209 For mutation-ignorant applications (see above), all forms etc. should
210 include the hidden parameter (and as discussed, they must all use
211 POST rather than GET).
212
213 =head3 Mutation-aware applications
214
215 For mutation-aware applications, whether to include the secret
216 parameter depends on the kind of request.  CGI::Auth::Flexible knows
217 when it is necessary.  You should find out by calling
218 C<need_add_hidden>.
219
220 If it is inconvenient to call C<need_add_hidden> at runtime, you can
221 rely instead on the following promises:  All POST requests (which
222 includes all mutating requests) need the parameter.  The return value
223 of need_add_hidden depends only on the $method and $reqtype
224 parameters, so you can query it once and remember the answer.
225 HTML page load GETs do not need the parameter.  It is better to
226 err on the side of including the parameter.
227
228 If you really must, you can call C<need_add_hidden> "on the bench"
229 during development and bake the answer into your application code
230 structure.  However, if you do that and a new vulnerability was
231 discovered which is fixed by changing the answer, updating
232 CGI::Auth::Flexible wouldn't be sufficient to fix it.
233
234 =head3 Mutation-aware applications - non-page requests
235
236 If your mutation-aware application supports non-page resources (AJAX
237 and JSON requests, stylesheets, favicons, etc.) it must inform
238 CGI::Auth::Flexible when it is handling such a request, by calling
239 C<check_nonpage>.
240
241 Normally C<check_nonpage> will simply return (and you can ignore the
242 return value).  However, if there is an attack (or, perhaps, a bug) it
243 will die, stopping the attack.
244
245 (You do not need to call C<check_nonpage> for POST requests, but it is
246 harmless to do so.)
247
248 =head3 Mutation-aware applications - novel kinds of request
249
250 If you want to support a kind of request perhaps not yet known about
251 by CGI::Auth::Flexible, you can provide information about that new
252 request kind using C<update_get_need_add_hidden>.
253
254 =head2 DATA STORAGE
255
256 CGI::Auth::Flexible needs to store various information in plain files;
257 it does this in the directory specified by the C<dir> parameter.
258
259 =head1 SOURCE CODE DOWNLOAD
260
261 By default, CGI::Auth::Flexible provides a facility for users to
262 download the source code for the running version of your web
263 application.
264
265 This facility makes a number of important assumptions which you need
266 to check.  Note that if the provided facility is not sufficient
267 because your application is more sophisticated than it copes with (or
268 if you disable the builtin facility), you may need to implement a
269 functioning alternative to avoid violating the AGPLv3 licence.
270
271 Here are the most important (default) assumptions:
272
273 =over
274
275 =item *
276
277 Your app's source code is available by looking at @INC, $0 and
278 S<$ENV{'SCRIPT_FILENAME'}> (the B<source items>).  See
279 C<srcdump_listitems>.  Where these point to files or directories under
280 revision control, the source item is the whole containing vcs tree.
281
282 =item *
283
284 Specifically, there are no compiled or autogenerated Perl
285 files, Javascript resources, etc., which are not contained in one of
286 the source item directories.  (Files which came with your operating
287 system install don't need to be shipped as they fall under the system
288 library exception.)
289
290 =item *
291
292 You have not installed any modified versions of system
293 libraries (including system-supplied Perl modules) in C</usr> outside
294 C</usr/local>.  See C<srcdump_system_dir>.
295
296 =item *
297
298 For each source item in a dvcs, the entire dvcs history does
299 not contain anything confidential (or libellous).  Also, all files which
300 contain secrets are in the dvcs's I<.ignore> file.  See
301 C<srcdump_vcsscript_git> et al.
302
303 =item *
304
305 For each source item NOT in a dvcs, there are no confidential
306 files with the world-readable bit set (being in a world-inaccessible
307 directory is not sufficient).  See C<srcdump_excludes>.
308
309 =item *
310
311 You have none of your app's source code in C</etc>.
312
313 =item *
314
315 You don't regard pathnames on your server as secret.
316
317 =item *
318
319 You don't intentionally load Perl code by virtue of C<.>
320 being in C<@INC> by default.  (See C<srcdump_filter_cwd>.)
321
322 =back
323
324 =head1 MAIN FUNCTIONS AND METHODS
325
326 =over
327
328 =item C<< CGI::Auth::Flexible->new_verifier(setting => value, ...) >>
329
330 Initialises an instance and returns a verifier object.
331 The arguments are setting pairs like a hash initialiser.
332 See L</SETTINGS> below.
333
334 =item C<< $verifier->new_request($cgi) >>
335
336 Prepares to process a request.  I<$cgi> should normally
337 be the query object from L<CGI(3perl)>.  Most of the default
338 hook methods assume that it is; however if you replace enough of
339 the hook methods then you can pass any value you like and it
340 will be passed to your hooks.
341
342 The return value is the authentication request object (I<$authreq>)
343 which is used to check the incoming request and will contain
344 information about its credentials.
345
346 =item C<< $authreq->check_divert() >>
347
348 Checks whether the user is logged in.  Returns undef if the user is
349 logged in and we should service the request.  Otherwise returns a
350 divert spec (see L</DIVERT SPEC>) saying what should happen instead.
351
352 This method may die if it doesn't like the request, in which case
353 the request needs to be rejected.
354
355 =item C<< $authreq->check_ok() >>
356
357 Checks whether the user is logged in.  Returns true if the user is
358 logged in and we should service the request.
359
360 Otherwise it handles the request itself, generating any appropriate
361 redirect, login form, or continuation page.  It then returns false and
362 the application should not process the request further.
363
364 =item C<< $verifier->disconnect() >>
365
366 Discards the resources (open files, etc.) in the verifier object.
367
368 =back
369
370 =head1 REQUEST-RELATED FUNCTIONS AND METHODS
371
372 All of these are only valid after C<check_divert> or C<check_ok> has
373 been called.  (In the case of C<check_ok> it won't normally be sensible
374 to call these functions unless C<check_ok> returned true.)
375
376 =item C<< $authreq->get_divert() >>
377
378 Returns the value previously returned by C<check_divert>.
379
380 =item C<< $authreq->get_username() >>
381
382 Returns the name of the logged-in user.  If the user was not logged
383 in (or their session had timed out, or something), returns undef.
384
385 =item C<< $authreq->check_mutate() >>
386
387 Declares to CGI::Auth::Generic that the request being handled will
388 "mutate".  That is, it will modify some server-side state (eg, adding
389 items to shopping baskets, posting messages to blogs, sending emails,
390 or whatever).
391
392 If you have set the setting C<promise_check_mutate> you must call
393 C<check_mutate> whenever appropriate.  If you haven't then it's
394 irrelevant.  See L<MUTATING OPERATIONS AND EXTERNAL LINKS>.
395
396 C<check_mutate> will either return successfully, indicating that all
397 is well and the request should proceed, or it will die.  If it dies
398 that means that the request was improper, which can only result from a
399 bug or an attack.  So an "internal server error" is a suitable
400 response.
401
402 =item C<< $authreq->check_nonpage($method, $reqtype) >>
403
404 Declares to CGI::Auth::Generic that the request is not a page request,
405 but rather a request of type I<$reqtype>.
406
407 If your application has set the setting C<promise_check_mutate>,
408 whenever it is handling anything except an HTML page loads, it must
409 call this function.  See L</REQUEST TYPES>, and
410 L<GENERATING URLS, FORMS AND AJAX QUERIES>.
411
412 C<check_nonpage> will either return successfully, indicating that all
413 is well and the request should proceed, or it will die, like
414 C<check_mutate>.
415
416 =head1 RESPONSE-RELATED FUNCTIONS AND METHODS
417
418 =item C<< $authreq->url_with_query_params($params, [$nonpagetype]) >>
419
420 Convenience function which returns a url for a GET request to this
421 application.
422
423 I<$params> is a hashref specifying the parameters and the PATH_INFO
424 (not including any parameters related to CGI::Auth::Flexible).
425 The keys are the parameter names, and the values are array refs with
426 the parameter value(s) (as strings, as yet unquoted).  (They are array
427 refs because it is possible to pass multiple values for the same
428 parameter in a single request; normally each arrayref would be a
429 singleton.)
430
431 The request path will be the path to the application.  If a parameter
432 with name C<< '' >> is supplied, it is taken as the PATH_INFO - its
433 value will be appended to the application path.  (It should normally
434 start with C<< / >>, and only one value should be supplied.)
435
436 =item C<< something->need_add_hidden($method, $reqtype) >>
437
438 Enquires whether a request of type I<$reqtype> using HTTP method
439 I<$method> needs the hidden form parameter.  See L</REQUEST TYPES>.
440
441 =item C<< something->secret_hidden_val() >>
442
443 Returns the value of the hidden form parameter.  This should be
444 included in all POST requests to your application (and thus be a
445 hidden form parameter in all forms).
446
447 It should also be in some (maybe all) GET requests.  If your
448 application is mutation-ignorant, it should be in all GET requests.
449 If you are mutation-aware, you need to consult C<need_add_hidden>.
450
451 The name of the hidden parameter is the setting C<assoc_param_name>,
452 C<caf_hassochash> by default.  xxx rename param and setting
453
454 =item C<< something->secret_hidden_html() >>
455
456 Returns the HTML for an C<INPUT> element specifying the hidden form
457 parameter.
458
459 =item C<< something->secret_cookie_val() >>
460
461 Returns the value of the secret cookie.  CGI::Auth::Flexible sets this
462 cookie in the forms generated by C<check_ok>.  You may also set it
463 yourself (and indeed you must do so if you use C<check_divert>).
464
465 =back
466
467 =head1 OTHER FUNCTIONS AND METHODS
468
469 =over
470
471 =item C<< $verifier_or_authreq->hash($data) >>
472
473 Hashes the supplied data using the hash function specified by the
474 C<hash_algorithm> setting, and converts the result to a string of hex
475 digits.
476
477 =item C<< something->update_get_need_add_hidden($reqtype, $value, [$force]) >>
478
479 Updates CGI::Auth::Generic's knowledge about the various kinds of
480 request, and whether they need the hidden form parameter.  This
481 function applies only to GET requests - POST requests always use the
482 parameter.
483
484 I<$reqtype> is the request type (the value which will be passed to
485 C<check_nonpage> and C<need_add_hidden>.  If you are supporting a new
486 I<$reqtype> you shouuld coordinate with CGI::Auth::Flexible upstrea,
487 or other users, to assign a unique request type name.
488
489 This method may be called on an authreq or a verifier, in which case
490 it will affect all authreqs using the same verifier.  Or it may be
491 called on the class as a whole, in which case it will affect the
492 global default list for all verifiers.
493
494 If I<$force> is supplied and true, this will override
495 CGI::Auth::Flexible's existing knowledge.  Otherwise this new setting
496 will be ignored if CGI::Auth::Flexible already knows about the request
497 type.  (When called on a verifier or authreq, it will ignore the
498 update in favour of existing knowledge recorded both globally in the
499 class or due to previous requests on the same verifier.)
500
501 See L</REQUEST TYPES>.
502
503 =item C<< CGI::Auth::Flexible::srcdump_dir_cpio($cgi,$verifier,$dumpdir,$dir,$outfn,$how,$script) >>
504
505 Helper function for implementing the C<srcdump_process_item> hook.
506 Generates a tarball using cpio and includes it in the prepared source
507 code distribution.
508
509 The arguments are mostly the same as for that hook.  C<$dir> is the
510 root directory at which to start the archive.  C<$how> is a short text
511 string which will be mentioned in the log.
512
513 C<$script> is a shell script fragment which must output a
514 nul-separated list of filenames (e.g. the output of C<find -print0>).
515 It is textually surrounded by C<( )> and will be executed with C<set -e>
516 in force.  Its cwd will be C<$dir>.
517
518 =item C<< $verifier_or_authreq->($data) | CGI::Auth::Flexible-> >>
519
520 Hashes the supplied data using the hash function specified by the
521 C<hash_algorithm> setting, and converts the result to a string of hex
522 digits.
523
524 =back
525
526 =head1 REQUEST TYPES
527
528 The C<$reqtype> values understood by C<check_nonpage> are strings.
529 They are:
530
531 =over
532
533 =item C<PAGE>
534
535 A top-level HTML page load.  May contain confidential information for
536 the benefit of the logged-in user.
537
538 =item C<FRAME>
539
540 An HTML frame.  May contain confidential information for
541 the benefit of the logged-in user.
542
543 =item C<IFRAME>
544
545 An HTML iframe.  May contain confidential information for
546 the benefit of the logged-in user.
547
548 =item C<SRCDUMP>
549
550 Source dump request, whether for the licence or actual source code
551 tarball; returned value is not secret.
552
553 =item C<STYLESHEET>
554
555 CSS stylesheet.  B<MUST NOT> contain any confidential data.  If the
556 stylesheet depends on the user, then attackers may be able to
557 determine what stylesheet the user is using.  Hopefully this is not a
558 problem.
559
560 =item C<FAVICON>
561
562 "Favicon" - icon for display in the browser's url bar etc.  We aren't
563 currently aware of a way that attackers can get a copy of this.
564
565 =item C<ROBOTS>
566
567 C<robots.txt>.  Should not contain any confidential data (obviously).
568
569 =item C<IMAGE>
570
571 Inline image, for an C<< <img src=...> >> element.
572
573 Unfortunately it is not possible to sensibly show top-level
574 confidential images (that is, have the user's browser directly visit a
575 url which resolves to an image rather than an HTML page with an inline
576 image).  This is because images need to have a per-session hidden form
577 parameter to avoid cross-site scripting, which breaks bookmarks etc.
578
579 =item C<SCRIPT>
580
581 JavaScript for a C<< <script> >> element.  (Possibly confidential for
582 the user.)
583
584 =item C<AJAX-XML>
585
586 C<< XMLHttpRequest >> returning XML data.  (Possibly
587 confidential for the user.)
588
589 =item C<AJAX-JSON>
590
591 C<< XMLHttpRequest >> returning JSON data.  (Possibly
592 confidential for the user.)
593
594 =item C<AJAX-OTHER>
595
596 C<< XMLHttpRequest >> returning data of some other kind.  (Possibly
597 confidential for the user.)
598
599 =back.
600
601 =head1 DIVERT SPEC
602
603 The return value from C<check_divert> indicates how the request should
604 be handled.  It is C<undef> if all is well and the user is logged in.
605
606 Otherwise the return value is a hash ref with the following keys:
607
608 =over
609
610 =item C<Kind>
611
612 Scalar string indicating the kind of diversion required.
613
614 =item C<Message>
615
616 Scalar string for display to the user in relation to the diversion.
617 Has already been translated.  In HTML but normally does not contain
618 any tags.
619
620 =item C<CookieSecret>
621
622 The login cookie which should be set along with whatever response is
623 sent to the client.  The value in the hash is the actual value
624 of the cookie as a string.  C<undef> means no cookie setting header
625 should be sent; C<''> means the cookie should be cleared.
626
627 =item C<Params>
628
629 The extra hidden form parameters (and the C<PATH_INFO>) which should
630 be set when the subsequent request bounces back from the client, in
631 the form used by C<url_with_query_params>.
632
633 The contents of this hashref does not include the CAF-specific
634 parameters such as the secret cookie, those which follow from the kind
635 of diversion requested, etc.
636
637 It is correct to always include the contents of C<Params> as hidden
638 parameters in the urls for all redirections, and as hidden input
639 fields in all generated forms.  The specific cases where C<Params> is
640 currently relevant are also mentioned in the text for each divert
641 kind.
642
643 =back
644
645 The values of C<Kind> are:
646
647 =over
648
649 =item C<SRCDUMP->I<item>
650
651 We should respond by sending our application source code.  I<item>
652 (which will contain only word characters, and no lower case) is the
653 specific item to send, normally C<SOURCE> or C<LICENCE>.
654
655 =item C<REDIRECT-HTTPS>
656
657 We should respond with an HTTP redirect to the HTTPS instance of our
658 application.
659
660 =item C<REDIRECT-LOGGEDOUT>
661
662 We should redirect to a page showing that the user has been logged
663 out.  (Ie, to a url with one of the the C<loggedout_param_names> set.)
664
665 =item C<SMALLPAGE-LOGGEDOUT>
666
667 We should generate a page showing that the user has been logged out.
668 There can be a link on the page pointing to the login page so that the
669 user can log back in.
670
671 =item C<SMALLPAGE-NOCOOKIE>
672
673 We should generate a page reporting that the user does not have
674 cookies enabled.  It should probably contain a link pointing to the
675 login page with additionally all the parameters in C<Params>.  When
676 this divert spec is generated, C<Message> will explain the problem
677 with cookies so there is no need to do that again in the page body if
678 you include the contents of C<Message>.
679
680 =item C<LOGIN-STALE>
681
682 The user's session was stale (this is described in C<Message>).  We
683 should generate a login form.
684
685 =item C<LOGIN-BAD>
686
687 The user supplied bad login credentials.  The details are in
688 C<Message>.  We should generate a login form (with additionally the
689 parameters from C<Params> as hidden fields).
690
691 =item C<LOGIN-INCOMINGLINK>
692
693 We should generate a login form (with the specified parameters); the
694 user is entering the site via a cross-site link but is not yet logged
695 in.
696
697 =item C<LOGIN-FRESH>
698
699 We should generate a login form.  The user is not yet logged in.
700
701 =item C<REDIRECT-LOGGEDIN>
702
703 We should redirect to our actual application, with the specified
704 parameters.  (The user has just logged in.)
705
706 =item C<MAINPAGEONLY>
707
708 We should generate our main page but B<ignoring all form parameters>
709 and B<ignoring the path_info>.  Most applications will find this
710 difficult to implement.
711
712 An alternative is to generate a small page with a form or link which
713 submits our own main page without any parameters.
714
715 (Applications which set C<promise_check_mutate> do not see this divert
716 kind.)
717
718 =head1 SETTINGS
719
720 C<new_verifier> and C<new_request> each take a list of settings, as
721 a list of pairs C<< key => value >> (like a Perl hash assignment).
722
723 The settings supplied to C<new_verifier> are stored in the verifier
724 and will apply to all authreqs made from it unless overridden in the
725 call to C<new_request>
726
727 When a setting is described as a hook function, it should be a
728 coderef.  The first argument will be the query object from
729 L<CGI(3perl)> (strictly, it will be whatever value was passed to
730 C<new_request>).  The second argument will be the authreq object (the
731 return value from C<new_request>).
732 Ie, C<< sub some_hook ($$...) { my ($cgi,$authreq,@stuff) = @_ ... >>
733
734 In bullet point headings, the hook functions are shown in the form
735 C<< some_hook($cgi,$authreq,@stuff) >> even though this would not be
736 legal syntax.  This should be read to mean that the
737 %implicit_settings_hash{'some_hook'}($cgi,$authreq,@stuff)
738 would be a legal call.  (However, the settings hash is not exposed.)
739
740 When a hook's default implementation is mentioned and named, that
741 function won't also be described in the section on the module's
742 functions.
743
744 =over
745
746 =head2 GENERAL SETTINGS
747
748 =item C<dir>
749
750 The directory CGI::Auth::Generic should use for its data storage.
751 This is actually just a default absolute path used when the other
752 path settings are relative values.
753
754 Must be an absolute filename.
755
756 =item C<db_dbh>
757
758 CGI::Auth::Flexible needs a database for recording users' login
759 session.  This database needs to be shared across all instances of the
760 web application, so in a multi-node cluster it needs to be your actual
761 database.
762
763 CGI::Auth::Flexible will create the table and index it needs if they
764 don't already exist, and will manage their contents.  You do not need
765 to integrate them into the rest of your webapp's data storage.  (In
766 particular, there is no need for transactional integrity across
767 changes made by CAF and your own application.)
768
769 By default, CAF uses a sqlite3 database stored on local disk in the
770 file named by C<db_path>.  This will be suitable for all
771 applications which run on a single host.
772
773 This value, if supplied, should be a DBI handle for the database.
774
775 =item C<db_dsn>
776
777 This is the DSN to pass to C<< DBI->connect >>.  Used only if
778 C<db_dbh> is not supplied.
779
780 =item C<db_path>
781
782 Path to the sqlite3 database used for CAF's session storage.  The
783 default is C<caf.db>.
784
785 Used only if neither C<db_dbh> or C<db_dsn> are supplied.
786
787 If this is a relative path, it is in C<dir>.
788
789 =item C<db_prefix>
790
791 Prefix for the SQL tables and indices to use (and to create, if
792 necessary).
793
794 See L</DATABASE TABLES>.
795
796 =item C<keys_path>
797
798 Path to the keys file used by CAF.  This arrangement will change in
799 the future.  See L</BUGS>.
800
801 =item C<random_source>
802
803 Special file to read random numbers from.  Should return
804 cryptographically secure (pseudo)-random bytes, unpredictable to
805 adversaries (even ones on the same machine).
806
807 On Linux, there is no device which is properly suitable.  This is a
808 bug in Linux.  You can use C</dev/random> which can block
809 unnecessarily even though the kernel PRNG has been properly seeded and
810 is fine, or C</dev/urandom> which might return values which attackers
811 can predict if the kernel PRNG has not been properly seeded.
812
813 The default is C</dev/urandom>.
814
815 =item C<secretbits>
816
817 Length of the assoc secret.  Defaults to 128.
818
819 =item C<hash_algorithm>
820
821 Must be a string suitable for use with C<new Digest>.
822 Defaults to C<SHA-256>.
823
824 =item C<login_timeout>
825
826 A user will be logged out this many seconds after they first logged
827 in.  Default: 86400 (one day).
828
829 =item C<login_form_timeout>
830
831 A login form becomes invalid this many seconds after it has been sent.
832 Default: 3600 seconds (one hour).
833
834 =item C<key_rollover>
835
836 The key used for generating assoc secrets is rolled over approximately
837 this often (in seconds).  Default: 86400.
838
839 =item C<assoc_param_name>
840
841 Name of the hidden form parameter.  Default: C<caf_assochash>.
842
843 =item C<cookie_name>
844
845 Name of the cookie used for login sessions.  Default:
846 C<caf_assocsecret>.
847
848 =item C<password_param_name>
849
850 Name of the password field in the login form.  Default: C<password>.
851
852 Used by C<login_ok_password> (the default C<login_ok> hook),
853 C<gen_plain_login_form> and the default C<is_login> hook.
854
855 =item C<username_param_names>
856
857 Arrayref of name(s) of username form parameters.
858
859 The first entry is used by C<login_ok_password> (the default
860 C<login_ok> hook) to pass to the C<username_password_error> hook and
861 used as the username if all is well.
862
863 All the entries are used by C<gen_plain_login_fork> (the default
864 C<gen_login_form> hook for C<check_ok>) to generate form entry fields.
865
866 The default is C<['username']>.
867
868 =item C<logout_param_names>
869
870 Arrayref of name(s) of form parameters indicating that the request is
871 a logout request.
872
873 Used by the default C<is_logout> hook.
874
875 If you want users to be able to explicitly log out, you need to
876 provide a logout button, something like
877 C<< <input type="submit" name="caf_logout" ...>>
878
879 The default is C<['caf_logout']>
880
881 =item C<logged_param_names>
882
883 Arrayref of name(s) of form parameters indicating that user has just
884 logged out.  (During the logout process, the actual logout action is a
885 POST request, whose response redirects to the "you have been logged
886 out" page; these form parameters are for this second page.)
887
888 Used by the default C<is_loggedout> hook.
889
890 The first entry is used by C<check_ok> to generate the redirection.
891
892 The default is C<['caf_loggedout']>
893
894 =item C<promise_check_mutate>
895
896 Boolean.  If true, is a declaration by the application that it is
897 mutatin-aware.  See L</MUTATING OPERATIONS AND EXTERNAL LINKS>.
898
899 The default is 0.
900
901 =item C<encrypted_only>
902
903 Boolean.  If true, CAF will insist that all transactions be done over
904 an encrypted http connection.  It will redirect unencrypted requests
905 to the https instance of the applicattion, and will set the encrypted
906 only flag on its cookie.
907
908 The default is 1.
909
910 =back
911
912 =item C<< get_url($cgi,$authreq) >>
913
914 Hook which returns the URL of this web application.  By default, we
915 call C<< $cgi->url() >> for each request, but you can fix this if you
916 prefer.
917
918 =item C<< is_login,is_logout,is_loggedout($cgi,$authreq) >>
919
920 Hook which returns a boolean indicating whether the request was,
921 respectively: a login form submission (ie, username and password); a
922 logout request (submission resulting from the user pressing the
923 "logout" button); "logged out" page (redirection from the logout
924 POST).
925
926 The default is to check whether any of the corresponding request
927 parameters (C<< login_param_names >> etc.) was supplied, using the
928 C<get_param> hook.
929
930 =back
931
932 =head2 SETTINGS (HOOKS) RELATED TO THE CGI REQUEST OBJECT
933
934 =over
935
936 =item C<< get_param($cgi,$authreq,$param) >>
937
938 Returns the value of a single-valued form parameter.
939 The default is to call C<< $cgi->param($param) >>.
940 The semantics are the same as that of C<CGI::param>.
941
942 =item C<< get_params($cgi,$authreq) >>
943
944 Returns a hash of the parameters.  The return value is a hashref whose
945 keys are the parameter names and whose values are arrayrefs, one entry
946 in the arrayref for each value.
947
948 The default is to call C<< $cgi->Vars() >>, expect the
949 results to look like those from C<CGI::Vars>, and massage them into
950 the required form with split.
951
952 =item C<< get_path_info($cgi,$authreq) >>
953
954 Returns the PATH_INFO of the request.  The default is to
955 call C<< $cgi->path_info() >>.
956
957 =item C<< get_cookie($cgi,$authreq) >>
958
959 Returns the value of the CAF cookie sent with the request, or undef if
960 none was supplied.  The default is to call C<<
961 $cgi->cookie($cookie_name) >> (where C<$cookie_name> is from the
962 setting of the same name).  The return value should be the scalar
963 value of the cookie.
964
965 =item C<< get_method($cgi,$authreq) >>
966
967 Returns the HTTP method as a string.  The default is to call
968 C<< $cgi->request_method() >>.
969
970 =back
971
972 =item C<< is_https($cgi,$authreq) >>
973
974 Returns a boolean indicating whether the request was over an encrypted
975 channel.  The default is C<< !!$cgi->https() >>.  See C<encrypted_only>.
976
977 =back
978
979 =head2 SETTINGS RELATED TO HTML GENERATION
980
981 These are only used if you call C<check_ok> (or other functions
982 mentioned in this section).
983
984 Settings whose names are of the form C<gen_...> are hooks which each
985 return an array of strings, normally HTML strings, for use by
986 C<check_ok> (or, in turn, other hooks, or your application).  These
987 are often documented simply by showing the output produced.  In many
988 cases parts of the output are in turn obtained from other hooks.  In
989 some cases the default implementations have been given names for
990 convenient use by your application.  They will be called in array
991 context.
992
993 We'll write C<gettext(something)> even though actually there is a hook
994 to control the translation function used.
995
996 =over
997
998 =item C<handle_divert>($cgi,$authreq,$divert))
999
1000 C<check_ok> calls this hook before producing output of its own.  If
1001 you want to handle some but not all diversions yourself, you may set
1002 this hook.  The hook should either do nothing and return false, or
1003 return true if it has handled the request (or arrange for the request
1004 to be handled).  If the hook returns true then C<check_ok> simply
1005 returns 0.
1006
1007 =item C<gen_login_form>($cgi,$authreq,$divert))
1008
1009 Default: a table (used mostly for layout) containing input fields for
1010 a login form.  Must be within a C<< <form> >> element, but doesn't
1011 generate it.  Has text fields for every entry in
1012 C<username_param_names> (in each case associated with a description
1013 C<< gettext(ucfirst $parameter_name) >>, a password field (with
1014 description C<gettext("Password")>, and a login submit button (with
1015 description C<gettext("Login")>.
1016
1017 Default is available as the module function C<gen_plain_login_form>.
1018
1019 =item C<gen_login_link>($cgi,$authreq))
1020
1021 Default:
1022
1023  <a href="http:...">gettext(Log in again to continue.)</a>
1024
1025 Default is available as the module function C<gen_plain_login_link>.
1026
1027 =item C<gen_postmainpage_form>($cgi,$authreq,$params))
1028
1029 Default: form contents (but not the C<< <form> >> element):
1030
1031 C<$params> (in the form returned by the C<get_params> hook) as hidden
1032 fields, and also:
1033
1034  <input type="submit" ... value=getext('Continue')>
1035
1036 Default is available as the module function C<gen_postmainpage_form>.
1037
1038 =item C<gen_start_html>($cgi,$authreq,$title)
1039
1040 Default: C<$cgi->start_html($title)>
1041
1042 =item C<gen_end_html>($cgi,$authreq,$title)
1043
1044 Default: C<$cgi->end_html($title)>
1045
1046 =item C<gen_footer_html>($cgi,$authreq)>
1047
1048 Default:
1049
1050  <hr><address>
1051  Powered by Free / Libre / Open Source Software
1052  according to the [gen_licence_link_html].
1053  [gen_source_link_html].
1054  </address>
1055
1056 Default is available as the module function C<gen_plain_footer_html>.
1057
1058 =item C<gen_licence_link_html>($cgi,$authreq)>
1059
1060 Default: uses C<url_with_query_params> to generate a URL for
1061 downloading the licence, and returns:
1062   <a href="...">GNU Affero GPL</a>
1063
1064 Default is available as the module function C<gen_plain_licence_link_html>.
1065
1066 =item C<gen_source_link_html>($cgi,$authreq)>
1067
1068 Default: uses C<url_with_query_params> to generate a URL for
1069 downloading the source, and returns:
1070   <a href="...">Source available</a>
1071
1072 Default is available as the module function C<gen_plain_source_link_html>.
1073
1074 =item C<form_entry_size>
1075
1076 Size of generated text entry fields.  Default is 60.
1077
1078 =item C<dummy_param_name_prefix>
1079
1080 Some of CAF's HTML-generating functions need to invent form parameter
1081 names.  They will all start with this string.  Default: C<caf__>.
1082
1083 =head2 SETTINGS FOR SOURCE CODE DOWNLOAD FACILITY
1084
1085 =over
1086
1087 =item C<srcdump_param_name>
1088
1089 Form parameter name used to indicate that this is a source download
1090 request.  If this parameter is supplied, C<check_ok> and
1091 C<check_divert> will arrange for the applicaton source code to be
1092 delivered as the response (in C<check_ok>'s case by doing it itself
1093 and in C<check_divert>'s case by asking your application to do so.
1094
1095 Default is C<caf_srcdump>.
1096
1097 =item C<srcdump_path>
1098
1099 Path to the directory used for storing pre-prepared source downloads.
1100 Defaults to C<caf-srcdump>.
1101
1102 If this is a relative path, it is in C<dir>.
1103
1104 =item C<srcdump_dump($cgi,$authreq,$srcobj)>
1105
1106 Dump the source code (C<$srcobj='source'> or licence data
1107 (C<$srcobj='licence'>).  The default implementation checks that
1108 C<$srcobj> has reasonable syntax and uses the files C<$srcobj.data>
1109 and C<$srcobj.ctype> with the C<dump> hook.
1110
1111 =item C<dump($cgi,$authreq,$contenttype,$datafilehandle)>
1112
1113 Responds to the request by sending the contents of $datafilehandle
1114 (which should just have been opened) and specifying a content type of
1115 $contenttype.
1116
1117 The default implmentation uses the C<print> hook, and also calls
1118 C<$cgi->header('-type' => $contenttype>, and is available as the
1119 module function C<dump_plain>.
1120
1121 =item C<srcdump_prepare($cgi,$verifier)>
1122
1123 Prepares the source code for download when requested.  Invoked by
1124 C<new_verifier>, always, immediately before it returns the
1125 just-created verifier object.
1126
1127 The default implementation is the module function
1128 C<srcdump_dirscan_prepare>, which prepares a manifest, licence file
1129 and source code tarball of tarballs, as follows:
1130
1131 It processes each entry in the return value from C<srcdump_listitems>.
1132 These are the software's include directories and any other directories
1133 containing source code.  It handles C<.> specially (see
1134 C<srcdump_filter_cwd>).
1135
1136 For each entry it looks, relative to that, for the licence as a file
1137 with a name mentioned in C<srcdump_licence_files>.  The first such
1138 file found is considered to be the licence.  It then calls the hook
1139 C<srcdump_process_item> for the entry.
1140
1141 The licence, a manifest file, and all the outputs generated by the
1142 calls to C<srcdump_process_item>, are tarred up and compressed as a
1143 single source tarball.
1144
1145 It uses the directory named by C<srcdump_path> as its directory for
1146 working and output files.  It uses the filename patterns
1147 C<generate.*>, C<licence.*>, C<s.[a-z][a-z][a-z].*>, C<manifest.*>,
1148 C<source.*> in that directory.
1149
1150 =item C<srcdump_process_item>($cgi,$verifier,$dumpdir,$item,\&outfn,\$needlicence,\%dirsdone)>
1151
1152 Processes a single include directory or software entry, so as to
1153 include the source code found there.  Called only by the default
1154 implementation of C<srcdump_prepare>.
1155
1156 C<$dumpdir> is the directory for working and output files.  C<$item>
1157 is the real (no symlinks) absolute path to the item.
1158
1159 C<\$needlicence> is a ref to a scalar: this scalar is undef if we have
1160 already found the licence file; otherwise it is the filename to which
1161 the licence should be copied.  If the referent is undef on entry,
1162 C<srcdump_process_item> needs to see if it finds the licence; if it
1163 does it should copy it to the named file and then set the scalar to
1164 undef.
1165
1166 C<\%dirsdone> is a ref to the hash used by C<srcdump_prepare> to avoid
1167 including a single directory more than once.  If
1168 C<srcdump_process_item> decides to process a directory other than
1169 C<$item> it should check this hash with the real absolute path of the
1170 other directoy as a key: if the hash entry is true, it has already
1171 been done and should be skipped; otherwise the hash entry should be set.
1172
1173 C<\&outfn> is a coderef which C<srcdump_process_item> should call each
1174 time it wants to generate a file which should be included as part of
1175 the source code.  It should be called using one of these patterns:
1176    $outfn->("message for manifest");
1177    $outfile = $outfn->("message for manifest", "extension");
1178 The former simply prints the message into the manifest in the form
1179   none: message for manifest
1180 The latter generates and returns a filename which should then
1181 be created and filled with some appropriate data.  C<"extension">
1182 should be a string for the file extension, eg C<"txt">.  The output
1183 can be written directly to the named file: there is no need to
1184 write to a temporary file and rename.  C<$outfn> writes the filename
1185 and the message to the manifest, in the form
1186   filename leaf: message
1187 In neither case is the actual name of C<$dir> on the system
1188 disclosed per se although of course some of the contents of some of
1189 the files in the source code dump may mention it.
1190
1191 The default implementation is the module function
1192 C<srcdump_process_item>.
1193
1194 It skips directories for which C<srcdump_system_dir> returns true.
1195
1196 It then searches the item and its parent
1197 directories for a vcs metadata directory (one of the names in
1198 C<srcdump_vcs_dirs>); if found, it calls the C<srcdump_byvcs> hook
1199 (after checking and updaeing C<%dirsdone>).
1200 Otherwise it calls the C<srcdump_novcs> hook.
1201
1202 =item C<srcdump_novcs($cgi,$verifier,$dumpdir,$item,$outfn)>
1203
1204 Called by the default implementation of C<srcdump_process_item>, with
1205 the same arguments, if it doesn't find vcs metadata.
1206
1207 The default implementation is the module function C<srcdump_novcs>.
1208
1209 If C<$item> is a directory, it uses C<srcdump_dir_cpio> to prepare a
1210 tarball of all the files under C<$item> which have the world read bit
1211 set.  Directories are not included (and their permissions are
1212 disregarded).  The contents of C<srcdump_excludes> are excluded.
1213
1214 If it's a plain file it uses C<srcdump_file> to include the file.
1215
1216 =item C<srcdump_byvcs($cgi,$verifier,$dumpdir,$item,$outfn,$vcs)>
1217
1218 Called by the default implementation of C<srcdump_process_item>, with
1219 the same arguments, if it finds vcs metadata.  The additional argument
1220 C<$vcs> is derived from the entry of C<srcump_vcs_dirs> which was
1221 used: it's the first sequence of word characters, lowercased.
1222
1223 The default implementation is the module function C<srcdump_byvcs>.
1224 It simply calls C<srcdump_dir_cpio> with a script from the setting
1225 C<srcdump_vcsscript>.
1226
1227 =item C<srcdump_vcs_dirs>
1228
1229 Array ref of leaf names of vcs metadata directories.  Used by the
1230 default implementation of C<srcdump_process_item>.  The default value
1231 is C<['.git','.hg','.bzr','.svn']>.
1232
1233 =item C<srcdump_vcs_script>
1234
1235 Hash ref of scripts for generating vcs metadata.  Used by the default
1236 implementation of C<srcdump_byvcs>.  The keys are values of C<$vcs>
1237 (see C<srcdump_byvcs>); the values are scripts as for
1238 C<srcdump_dir_cpio>.
1239
1240 The default has an entry only for C<git>:
1241   git ls-files -z
1242   git ls-files -z --others --exclude-from=.gitignore
1243   find .git -print0
1244
1245 =item C<srcdump_excludes>
1246
1247 Array ref of exclude glob patterns, used by the default implementation
1248 of C<srcdump_novcs>.  The default value is C<['*~','*.bak','*.tmp','#*#']>.
1249
1250 Entries must not contain C<'> or C<\>.
1251
1252 =item C<srcdump_listitems($cgi,$verifier)>
1253
1254 Returns an array of directories which might contain source code of the
1255 web application and which should be therefore be considered for
1256 including in the source code delivery.
1257
1258 Used by the default implementation of C<srcdump_prepare>.
1259
1260 Entries must be directories, plain files, or nonexistent; they may
1261 also be symlinks which resolve to one of those.
1262
1263 If C<.> is included it may be treated specially - see
1264 C<srcdump_filter_cwd>.
1265
1266 The default implementation returns 
1267 C<(@INC, $ENV{'SCRIPT_FILENAME'}, $0)>.
1268
1269 =item C<srcdump_system_dir($cgi,$verifier,$dir)>
1270
1271 Determines whether C<$dir> is a "system directory", in which any
1272 source code used by the application should nevertheless not be
1273 included in the source code dump.
1274
1275 Used by the default implementation of C<srcdump_item>.
1276
1277 The default implementation is as follows: Things in C</etc/> are
1278 system directories.  Things in C</usr/> are too, unless they are in
1279 C</usr/local/> or C</usr/lib/cgi*>.
1280
1281 =item C<srcdump_filter_cwd>
1282
1283 Boolean which controls the handling of C<.> if it appears in the
1284 return value from C<srcdump_listitems>.  Used only by the default
1285 implementation of C<srcdump_prepare>.
1286
1287 If set to false, C<.> is treated normally and no special action is
1288 taken.
1289
1290 However often the current directory may be C</>, or a data directory,
1291 or some other directory containing data which is confidential, or
1292 should not be included in the public source code distribution for
1293 other reasons.  And for historical reasons Perl has C<@INC> containing
1294 C<.> by default (which is arguably dangerous and wrong).
1295
1296 So the default this setting is true, which has the following effects:
1297
1298 C<.> is not searched for source code even if it appears in C<@INC>.
1299 C<.> is removed from C<@INC> and C<%INC> is checked to see if any
1300 modules appear to have already been loaded by virtue of C<.> appearing
1301 in C<@INC> and if they have it is treated as a fatal error.
1302
1303 Only the literal string C<.> is affected.  If the cwd is included by
1304 any other name it is not treated specially regardless of this setting.
1305
1306 =back
1307
1308 =head1 DATABASE TABLES
1309
1310 In a simple application, you do not need to worry about this.  But if
1311 your application runs on multiple frontend hosts with a shared
1312 database, you may need to create for yourself the tables and indices
1313 used by CGI::Auth::Flexible.
1314
1315 By default, every time CAF starts up, it attempts to execute certain
1316 fixed database statements to create the tables and indices it needs.
1317 These are run with C<$dbh->{PrintError}> set to 0.  The effect with
1318 sqlite (the default database) is that the tables and indices are
1319 created iff they do not already exist, and that no spurious errors are
1320 reported anywhere.
1321
1322 If you use a different database, or just prefer to do things
1323 differently, you can set up the tables yourself and/or disable or
1324 modify the default setup statements, via the C<db_setup_stmts>
1325 setting.
1326
1327 The tables needed are:
1328
1329
1330 xxx document _db_setup_do
1331 xxx make _db_setup_do explicitly overrideable
1332
1333
1334 xxx remaining settings
1335  db_password
1336  username_password_error
1337  login_ok
1338  get_cookie_domain
1339  gettext
1340  print
1341  debug
1342
1343 xxx document cookie usage
1344 xxx document construct_cookie fn
1345
1346 xxx document @default_db_setup_statements
1347
1348 xxx bugs wrong default random on Linux
1349 xxx bugs wrong default random on *BSD
1350 xxx bugs keys not shared should be in db
1351 xxx rename caf_assocsecret default cookie name
1352 xxx mention relationship between login_timeout and cookies