chiark / gitweb /
dgit: Do not execute END blocks in children.
[dgit.git] / dgit
1 #!/usr/bin/perl -w
2 # dgit
3 # Integration between git and Debian-style archives
4 #
5 # Copyright (C)2013-2016 Ian Jackson
6 #
7 # This program is free software: you can redistribute it and/or modify
8 # it under the terms of the GNU General Public License as published by
9 # the Free Software Foundation, either version 3 of the License, or
10 # (at your option) any later version.
11 #
12 # This program is distributed in the hope that it will be useful,
13 # but WITHOUT ANY WARRANTY; without even the implied warranty of
14 # MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
15 # GNU General Public License for more details.
16 #
17 # You should have received a copy of the GNU General Public License
18 # along with this program.  If not, see <http://www.gnu.org/licenses/>.
19
20 use strict;
21
22 use Debian::Dgit;
23 setup_sigwarn();
24
25 use IO::Handle;
26 use Data::Dumper;
27 use LWP::UserAgent;
28 use Dpkg::Control::Hash;
29 use File::Path;
30 use File::Temp qw(tempdir);
31 use File::Basename;
32 use Dpkg::Version;
33 use POSIX;
34 use IPC::Open2;
35 use Digest::SHA;
36 use Digest::MD5;
37 use List::Util qw(any);
38 use List::MoreUtils qw(pairwise);
39 use Text::Glob qw(match_glob);
40 use Fcntl qw(:DEFAULT :flock);
41 use Carp;
42
43 use Debian::Dgit;
44
45 our $our_version = 'UNRELEASED'; ###substituted###
46 our $absurdity = undef; ###substituted###
47
48 our @rpushprotovsn_support = qw(4 3 2); # 4 is new tag format
49 our $protovsn;
50
51 our $isuite;
52 our $idistro;
53 our $package;
54 our @ropts;
55
56 our $sign = 1;
57 our $dryrun_level = 0;
58 our $changesfile;
59 our $buildproductsdir = '..';
60 our $new_package = 0;
61 our $ignoredirty = 0;
62 our $rmonerror = 1;
63 our @deliberatelies;
64 our %previously;
65 our $existing_package = 'dpkg';
66 our $cleanmode;
67 our $changes_since_version;
68 our $rmchanges;
69 our $overwrite_version; # undef: not specified; '': check changelog
70 our $quilt_mode;
71 our $quilt_modes_re = 'linear|smash|auto|nofix|nocheck|gbp|dpm|unapplied';
72 our $dodep14tag;
73 our $dodep14tag_re = 'want|no|always';
74 our $split_brain_save;
75 our $we_are_responder;
76 our $we_are_initiator;
77 our $initiator_tempdir;
78 our $patches_applied_dirtily = 00;
79 our $tagformat_want;
80 our $tagformat;
81 our $tagformatfn;
82 our $chase_dsc_distro=1;
83
84 our %forceopts = map { $_=>0 }
85     qw(unrepresentable unsupported-source-format
86        dsc-changes-mismatch changes-origs-exactly
87        import-gitapply-absurd
88        import-gitapply-no-absurd
89        import-dsc-with-dgit-field);
90
91 our %format_ok = map { $_=>1 } ("1.0","3.0 (native)","3.0 (quilt)");
92
93 our $suite_re = '[-+.0-9a-z]+';
94 our $cleanmode_re = 'dpkg-source(?:-d)?|git|git-ff|check|none';
95 our $orig_f_comp_re = 'orig(?:-[-0-9a-z]+)?';
96 our $orig_f_sig_re = '\\.(?:asc|gpg|pgp)';
97 our $orig_f_tail_re = "$orig_f_comp_re\\.tar(?:\\.\\w+)?(?:$orig_f_sig_re)?";
98
99 our $git_authline_re = '^([^<>]+) \<(\S+)\> (\d+ [-+]\d+)$';
100 our $splitbraincache = 'dgit-intern/quilt-cache';
101 our $rewritemap = 'dgit-rewrite/map';
102
103 our (@git) = qw(git);
104 our (@dget) = qw(dget);
105 our (@curl) = qw(curl);
106 our (@dput) = qw(dput);
107 our (@debsign) = qw(debsign);
108 our (@gpg) = qw(gpg);
109 our (@sbuild) = qw(sbuild);
110 our (@ssh) = 'ssh';
111 our (@dgit) = qw(dgit);
112 our (@aptget) = qw(apt-get);
113 our (@aptcache) = qw(apt-cache);
114 our (@dpkgbuildpackage) = qw(dpkg-buildpackage -i\.git/ -I.git);
115 our (@dpkgsource) = qw(dpkg-source -i\.git/ -I.git);
116 our (@dpkggenchanges) = qw(dpkg-genchanges);
117 our (@mergechanges) = qw(mergechanges -f);
118 our (@gbp_build) = ('');
119 our (@gbp_pq) = ('gbp pq');
120 our (@changesopts) = ('');
121
122 our %opts_opt_map = ('dget' => \@dget, # accept for compatibility
123                      'curl' => \@curl,
124                      'dput' => \@dput,
125                      'debsign' => \@debsign,
126                      'gpg' => \@gpg,
127                      'sbuild' => \@sbuild,
128                      'ssh' => \@ssh,
129                      'dgit' => \@dgit,
130                      'git' => \@git,
131                      'apt-get' => \@aptget,
132                      'apt-cache' => \@aptcache,
133                      'dpkg-source' => \@dpkgsource,
134                      'dpkg-buildpackage' => \@dpkgbuildpackage,
135                      'dpkg-genchanges' => \@dpkggenchanges,
136                      'gbp-build' => \@gbp_build,
137                      'gbp-pq' => \@gbp_pq,
138                      'ch' => \@changesopts,
139                      'mergechanges' => \@mergechanges);
140
141 our %opts_opt_cmdonly = ('gpg' => 1, 'git' => 1);
142 our %opts_cfg_insertpos = map {
143     $_,
144     scalar @{ $opts_opt_map{$_} }
145 } keys %opts_opt_map;
146
147 sub parseopts_late_defaults();
148
149 our $keyid;
150
151 autoflush STDOUT 1;
152
153 our $supplementary_message = '';
154 our $need_split_build_invocation = 0;
155 our $split_brain = 0;
156
157 END {
158     local ($@, $?);
159     return unless forkcheck_mainprocess();
160     print STDERR "! $_\n" foreach $supplementary_message =~ m/^.+$/mg;
161 }
162
163 our $remotename = 'dgit';
164 our @ourdscfield = qw(Dgit Vcs-Dgit-Master);
165 our $csuite;
166 our $instead_distro;
167
168 if (!defined $absurdity) {
169     $absurdity = $0;
170     $absurdity =~ s{/[^/]+$}{/absurd} or die;
171 }
172
173 sub debiantag ($$) {
174     my ($v,$distro) = @_;
175     return $tagformatfn->($v, $distro);
176 }
177
178 sub debiantag_maintview ($$) { 
179     my ($v,$distro) = @_;
180     return "$distro/".dep14_version_mangle $v;
181 }
182
183 sub madformat ($) { $_[0] eq '3.0 (quilt)' }
184
185 sub lbranch () { return "$branchprefix/$csuite"; }
186 my $lbranch_re = '^refs/heads/'.$branchprefix.'/([^/.]+)$';
187 sub lref () { return "refs/heads/".lbranch(); }
188 sub lrref () { return "refs/remotes/$remotename/".server_branch($csuite); }
189 sub rrref () { return server_ref($csuite); }
190
191 sub stripepoch ($) {
192     my ($vsn) = @_;
193     $vsn =~ s/^\d+\://;
194     return $vsn;
195 }
196
197 sub srcfn ($$) {
198     my ($vsn,$sfx) = @_;
199     return "${package}_".(stripepoch $vsn).$sfx
200 }
201
202 sub dscfn ($) {
203     my ($vsn) = @_;
204     return srcfn($vsn,".dsc");
205 }
206
207 sub changespat ($;$) {
208     my ($vsn, $arch) = @_;
209     return "${package}_".(stripepoch $vsn)."_".($arch//'*').".changes";
210 }
211
212 sub upstreamversion ($) {
213     my ($vsn) = @_;
214     $vsn =~ s/-[^-]+$//;
215     return $vsn;
216 }
217
218 our $us = 'dgit';
219 initdebug('');
220
221 our @end;
222 END { 
223     local ($?);
224     return unless forkcheck_mainprocess();
225     foreach my $f (@end) {
226         eval { $f->(); };
227         print STDERR "$us: cleanup: $@" if length $@;
228     }
229 };
230
231 sub badcfg { print STDERR "$us: invalid configuration: @_\n"; exit 12; }
232
233 sub forceable_fail ($$) {
234     my ($forceoptsl, $msg) = @_;
235     fail $msg unless grep { $forceopts{$_} } @$forceoptsl;
236     print STDERR "warning: overriding problem due to --force:\n". $msg;
237 }
238
239 sub forceing ($) {
240     my ($forceoptsl) = @_;
241     my @got = grep { $forceopts{$_} } @$forceoptsl;
242     return 0 unless @got;
243     print STDERR
244  "warning: skipping checks or functionality due to --force-$got[0]\n";
245 }
246
247 sub no_such_package () {
248     print STDERR "$us: package $package does not exist in suite $isuite\n";
249     exit 4;
250 }
251
252 sub changedir ($) {
253     my ($newdir) = @_;
254     printdebug "CD $newdir\n";
255     chdir $newdir or confess "chdir: $newdir: $!";
256 }
257
258 sub deliberately ($) {
259     my ($enquiry) = @_;
260     return !!grep { $_ eq "--deliberately-$enquiry" } @deliberatelies;
261 }
262
263 sub deliberately_not_fast_forward () {
264     foreach (qw(not-fast-forward fresh-repo)) {
265         return 1 if deliberately($_) || deliberately("TEST-dgit-only-$_");
266     }
267 }
268
269 sub quiltmode_splitbrain () {
270     $quilt_mode =~ m/gbp|dpm|unapplied/;
271 }
272
273 sub opts_opt_multi_cmd {
274     my @cmd;
275     push @cmd, split /\s+/, shift @_;
276     push @cmd, @_;
277     @cmd;
278 }
279
280 sub gbp_pq {
281     return opts_opt_multi_cmd @gbp_pq;
282 }
283
284 #---------- remote protocol support, common ----------
285
286 # remote push initiator/responder protocol:
287 #  $ dgit remote-push-build-host <n-rargs> <rargs>... <push-args>...
288 #  where <rargs> is <push-host-dir> <supported-proto-vsn>,... ...
289 #  < dgit-remote-push-ready <actual-proto-vsn>
290 #
291 # occasionally:
292 #
293 #  > progress NBYTES
294 #  [NBYTES message]
295 #
296 #  > supplementary-message NBYTES          # $protovsn >= 3
297 #  [NBYTES message]
298 #
299 # main sequence:
300 #
301 #  > file parsed-changelog
302 #  [indicates that output of dpkg-parsechangelog follows]
303 #  > data-block NBYTES
304 #  > [NBYTES bytes of data (no newline)]
305 #  [maybe some more blocks]
306 #  > data-end
307 #
308 #  > file dsc
309 #  [etc]
310 #
311 #  > file changes
312 #  [etc]
313 #
314 #  > param head DGIT-VIEW-HEAD
315 #  > param csuite SUITE
316 #  > param tagformat old|new
317 #  > param maint-view MAINT-VIEW-HEAD
318 #
319 #  > previously REFNAME=OBJNAME       # if --deliberately-not-fast-forward
320 #                                     # goes into tag, for replay prevention
321 #
322 #  > want signed-tag
323 #  [indicates that signed tag is wanted]
324 #  < data-block NBYTES
325 #  < [NBYTES bytes of data (no newline)]
326 #  [maybe some more blocks]
327 #  < data-end
328 #  < files-end
329 #
330 #  > want signed-dsc-changes
331 #  < data-block NBYTES    [transfer of signed dsc]
332 #  [etc]
333 #  < data-block NBYTES    [transfer of signed changes]
334 #  [etc]
335 #  < files-end
336 #
337 #  > complete
338
339 our $i_child_pid;
340
341 sub i_child_report () {
342     # Sees if our child has died, and reap it if so.  Returns a string
343     # describing how it died if it failed, or undef otherwise.
344     return undef unless $i_child_pid;
345     my $got = waitpid $i_child_pid, WNOHANG;
346     return undef if $got <= 0;
347     die unless $got == $i_child_pid;
348     $i_child_pid = undef;
349     return undef unless $?;
350     return "build host child ".waitstatusmsg();
351 }
352
353 sub badproto ($$) {
354     my ($fh, $m) = @_;
355     fail "connection lost: $!" if $fh->error;
356     fail "protocol violation; $m not expected";
357 }
358
359 sub badproto_badread ($$) {
360     my ($fh, $wh) = @_;
361     fail "connection lost: $!" if $!;
362     my $report = i_child_report();
363     fail $report if defined $report;
364     badproto $fh, "eof (reading $wh)";
365 }
366
367 sub protocol_expect (&$) {
368     my ($match, $fh) = @_;
369     local $_;
370     $_ = <$fh>;
371     defined && chomp or badproto_badread $fh, "protocol message";
372     if (wantarray) {
373         my @r = &$match;
374         return @r if @r;
375     } else {
376         my $r = &$match;
377         return $r if $r;
378     }
379     badproto $fh, "\`$_'";
380 }
381
382 sub protocol_send_file ($$) {
383     my ($fh, $ourfn) = @_;
384     open PF, "<", $ourfn or die "$ourfn: $!";
385     for (;;) {
386         my $d;
387         my $got = read PF, $d, 65536;
388         die "$ourfn: $!" unless defined $got;
389         last if !$got;
390         print $fh "data-block ".length($d)."\n" or die $!;
391         print $fh $d or die $!;
392     }
393     PF->error and die "$ourfn $!";
394     print $fh "data-end\n" or die $!;
395     close PF;
396 }
397
398 sub protocol_read_bytes ($$) {
399     my ($fh, $nbytes) = @_;
400     $nbytes =~ m/^[1-9]\d{0,5}$|^0$/ or badproto \*RO, "bad byte count";
401     my $d;
402     my $got = read $fh, $d, $nbytes;
403     $got==$nbytes or badproto_badread $fh, "data block";
404     return $d;
405 }
406
407 sub protocol_receive_file ($$) {
408     my ($fh, $ourfn) = @_;
409     printdebug "() $ourfn\n";
410     open PF, ">", $ourfn or die "$ourfn: $!";
411     for (;;) {
412         my ($y,$l) = protocol_expect {
413             m/^data-block (.*)$/ ? (1,$1) :
414             m/^data-end$/ ? (0,) :
415             ();
416         } $fh;
417         last unless $y;
418         my $d = protocol_read_bytes $fh, $l;
419         print PF $d or die $!;
420     }
421     close PF or die $!;
422 }
423
424 #---------- remote protocol support, responder ----------
425
426 sub responder_send_command ($) {
427     my ($command) = @_;
428     return unless $we_are_responder;
429     # called even without $we_are_responder
430     printdebug ">> $command\n";
431     print PO $command, "\n" or die $!;
432 }    
433
434 sub responder_send_file ($$) {
435     my ($keyword, $ourfn) = @_;
436     return unless $we_are_responder;
437     printdebug "]] $keyword $ourfn\n";
438     responder_send_command "file $keyword";
439     protocol_send_file \*PO, $ourfn;
440 }
441
442 sub responder_receive_files ($@) {
443     my ($keyword, @ourfns) = @_;
444     die unless $we_are_responder;
445     printdebug "[[ $keyword @ourfns\n";
446     responder_send_command "want $keyword";
447     foreach my $fn (@ourfns) {
448         protocol_receive_file \*PI, $fn;
449     }
450     printdebug "[[\$\n";
451     protocol_expect { m/^files-end$/ } \*PI;
452 }
453
454 #---------- remote protocol support, initiator ----------
455
456 sub initiator_expect (&) {
457     my ($match) = @_;
458     protocol_expect { &$match } \*RO;
459 }
460
461 #---------- end remote code ----------
462
463 sub progress {
464     if ($we_are_responder) {
465         my $m = join '', @_;
466         responder_send_command "progress ".length($m) or die $!;
467         print PO $m or die $!;
468     } else {
469         print @_, "\n";
470     }
471 }
472
473 our $ua;
474
475 sub url_get {
476     if (!$ua) {
477         $ua = LWP::UserAgent->new();
478         $ua->env_proxy;
479     }
480     my $what = $_[$#_];
481     progress "downloading $what...";
482     my $r = $ua->get(@_) or die $!;
483     return undef if $r->code == 404;
484     $r->is_success or fail "failed to fetch $what: ".$r->status_line;
485     return $r->decoded_content(charset => 'none');
486 }
487
488 our ($dscdata,$dscurl,$dsc,$dsc_checked,$skew_warning_vsn);
489
490 sub runcmd {
491     debugcmd "+",@_;
492     $!=0; $?=-1;
493     failedcmd @_ if system @_;
494 }
495
496 sub act_local () { return $dryrun_level <= 1; }
497 sub act_scary () { return !$dryrun_level; }
498
499 sub printdone {
500     if (!$dryrun_level) {
501         progress "$us ok: @_";
502     } else {
503         progress "would be ok: @_ (but dry run only)";
504     }
505 }
506
507 sub dryrun_report {
508     printcmd(\*STDERR,$debugprefix."#",@_);
509 }
510
511 sub runcmd_ordryrun {
512     if (act_scary()) {
513         runcmd @_;
514     } else {
515         dryrun_report @_;
516     }
517 }
518
519 sub runcmd_ordryrun_local {
520     if (act_local()) {
521         runcmd @_;
522     } else {
523         dryrun_report @_;
524     }
525 }
526
527 sub shell_cmd {
528     my ($first_shell, @cmd) = @_;
529     return qw(sh -ec), $first_shell.'; exec "$@"', 'x', @cmd;
530 }
531
532 our $helpmsg = <<END;
533 main usages:
534   dgit [dgit-opts] clone [dgit-opts] package [suite] [./dir|/dir]
535   dgit [dgit-opts] fetch|pull [dgit-opts] [suite]
536   dgit [dgit-opts] build [dpkg-buildpackage-opts]
537   dgit [dgit-opts] sbuild [sbuild-opts]
538   dgit [dgit-opts] push [dgit-opts] [suite]
539   dgit [dgit-opts] rpush build-host:build-dir ...
540 important dgit options:
541   -k<keyid>           sign tag and package with <keyid> instead of default
542   --dry-run -n        do not change anything, but go through the motions
543   --damp-run -L       like --dry-run but make local changes, without signing
544   --new -N            allow introducing a new package
545   --debug -D          increase debug level
546   -c<name>=<value>    set git config option (used directly by dgit too)
547 END
548
549 our $later_warning_msg = <<END;
550 Perhaps the upload is stuck in incoming.  Using the version from git.
551 END
552
553 sub badusage {
554     print STDERR "$us: @_\n", $helpmsg or die $!;
555     exit 8;
556 }
557
558 sub nextarg {
559     @ARGV or badusage "too few arguments";
560     return scalar shift @ARGV;
561 }
562
563 sub cmd_help () {
564     print $helpmsg or die $!;
565     exit 0;
566 }
567
568 our $td = $ENV{DGIT_TEST_DUMMY_DIR} || "DGIT_TEST_DUMMY_DIR-unset";
569
570 our %defcfg = ('dgit.default.distro' => 'debian',
571                'dgit.default.default-suite' => 'unstable',
572                'dgit.default.old-dsc-distro' => 'debian',
573                'dgit-suite.*-security.distro' => 'debian-security',
574                'dgit.default.username' => '',
575                'dgit.default.archive-query-default-component' => 'main',
576                'dgit.default.ssh' => 'ssh',
577                'dgit.default.archive-query' => 'madison:',
578                'dgit.default.sshpsql-dbname' => 'service=projectb',
579                'dgit.default.aptget-components' => 'main',
580                'dgit.default.dgit-tag-format' => 'new,old,maint',
581                'dgit.dsc-url-proto-ok.http'    => 'true',
582                'dgit.dsc-url-proto-ok.https'   => 'true',
583                'dgit.dsc-url-proto-ok.git'     => 'true',
584                'dgit.default.dsc-url-proto-ok' => 'false',
585                # old means "repo server accepts pushes with old dgit tags"
586                # new means "repo server accepts pushes with new dgit tags"
587                # maint means "repo server accepts split brain pushes"
588                # hist means "repo server may have old pushes without new tag"
589                #   ("hist" is implied by "old")
590                'dgit-distro.debian.archive-query' => 'ftpmasterapi:',
591                'dgit-distro.debian.git-check' => 'url',
592                'dgit-distro.debian.git-check-suffix' => '/info/refs',
593                'dgit-distro.debian.new-private-pushers' => 't',
594                'dgit-distro.debian/push.git-url' => '',
595                'dgit-distro.debian/push.git-host' => 'push.dgit.debian.org',
596                'dgit-distro.debian/push.git-user-force' => 'dgit',
597                'dgit-distro.debian/push.git-proto' => 'git+ssh://',
598                'dgit-distro.debian/push.git-path' => '/dgit/debian/repos',
599                'dgit-distro.debian/push.git-create' => 'true',
600                'dgit-distro.debian/push.git-check' => 'ssh-cmd',
601  'dgit-distro.debian.archive-query-url', 'https://api.ftp-master.debian.org/',
602 # 'dgit-distro.debian.archive-query-tls-key',
603 #    '/etc/ssl/certs/%HOST%.pem:/etc/dgit/%HOST%.pem',
604 # ^ this does not work because curl is broken nowadays
605 # Fixing #790093 properly will involve providing providing the key
606 # in some pacagke and maybe updating these paths.
607 #
608 # 'dgit-distro.debian.archive-query-tls-curl-args',
609 #   '--ca-path=/etc/ssl/ca-debian',
610 # ^ this is a workaround but works (only) on DSA-administered machines
611                'dgit-distro.debian.git-url' => 'https://git.dgit.debian.org',
612                'dgit-distro.debian.git-url-suffix' => '',
613                'dgit-distro.debian.upload-host' => 'ftp-master', # for dput
614                'dgit-distro.debian.mirror' => 'http://ftp.debian.org/debian/',
615  'dgit-distro.debian-security.archive-query' => 'aptget:',
616  'dgit-distro.debian-security.mirror' => 'http://security.debian.org/debian-security/',
617  'dgit-distro.debian-security.aptget-suite-map' => 's#-security$#/updates#',
618  'dgit-distro.debian-security.aptget-suite-rmap' => 's#$#-security#',
619  'dgit-distro.debian-security.nominal-distro' => 'debian',
620  'dgit-distro.debian.backports-quirk' => '(squeeze)-backports*',
621  'dgit-distro.debian-backports.mirror' => 'http://backports.debian.org/debian-backports/',
622                'dgit-distro.ubuntu.git-check' => 'false',
623  'dgit-distro.ubuntu.mirror' => 'http://archive.ubuntu.com/ubuntu',
624                'dgit-distro.test-dummy.ssh' => "$td/ssh",
625                'dgit-distro.test-dummy.username' => "alice",
626                'dgit-distro.test-dummy.git-check' => "ssh-cmd",
627                'dgit-distro.test-dummy.git-create' => "ssh-cmd",
628                'dgit-distro.test-dummy.git-url' => "$td/git",
629                'dgit-distro.test-dummy.git-host' => "git",
630                'dgit-distro.test-dummy.git-path' => "$td/git",
631                'dgit-distro.test-dummy.archive-query' => "dummycatapi:",
632                'dgit-distro.test-dummy.archive-query-url' => "file://$td/aq/",
633                'dgit-distro.test-dummy.mirror' => "file://$td/mirror/",
634                'dgit-distro.test-dummy.upload-host' => 'test-dummy',
635                );
636
637 our %gitcfgs;
638 our @gitcfgsources = qw(cmdline local global system);
639
640 sub git_slurp_config () {
641     local ($debuglevel) = $debuglevel-2;
642     local $/="\0";
643
644     # This algoritm is a bit subtle, but this is needed so that for
645     # options which we want to be single-valued, we allow the
646     # different config sources to override properly.  See #835858.
647     foreach my $src (@gitcfgsources) {
648         next if $src eq 'cmdline';
649         # we do this ourselves since git doesn't handle it
650         
651         my @cmd = (@git, qw(config -z --get-regexp), "--$src", qw(.*));
652         debugcmd "|",@cmd;
653
654         open GITS, "-|", @cmd or die $!;
655         while (<GITS>) {
656             chomp or die;
657             printdebug "=> ", (messagequote $_), "\n";
658             m/\n/ or die "$_ ?";
659             push @{ $gitcfgs{$src}{$`} }, $'; #';
660         }
661         $!=0; $?=0;
662         close GITS
663             or ($!==0 && $?==256)
664             or failedcmd @cmd;
665     }
666 }
667
668 sub git_get_config ($) {
669     my ($c) = @_;
670     foreach my $src (@gitcfgsources) {
671         my $l = $gitcfgs{$src}{$c};
672         croak "$l $c" if $l && !ref $l;
673         printdebug"C $c ".(defined $l ?
674                            join " ", map { messagequote "'$_'" } @$l :
675                            "undef")."\n"
676             if $debuglevel >= 4;
677         $l or next;
678         @$l==1 or badcfg "multiple values for $c".
679             " (in $src git config)" if @$l > 1;
680         return $l->[0];
681     }
682     return undef;
683 }
684
685 sub cfg {
686     foreach my $c (@_) {
687         return undef if $c =~ /RETURN-UNDEF/;
688         printdebug "C? $c\n" if $debuglevel >= 5;
689         my $v = git_get_config($c);
690         return $v if defined $v;
691         my $dv = $defcfg{$c};
692         if (defined $dv) {
693             printdebug "CD $c $dv\n" if $debuglevel >= 4;
694             return $dv;
695         }
696     }
697     badcfg "need value for one of: @_\n".
698         "$us: distro or suite appears not to be (properly) supported";
699 }
700
701 sub access_basedistro__noalias () {
702     if (defined $idistro) {
703         return $idistro;
704     } else {    
705         my $def = cfg("dgit-suite.$isuite.distro", 'RETURN-UNDEF');
706         return $def if defined $def;
707         foreach my $src (@gitcfgsources, 'internal') {
708             my $kl = $src eq 'internal' ? \%defcfg : $gitcfgs{$src};
709             next unless $kl;
710             foreach my $k (keys %$kl) {
711                 next unless $k =~ m#^dgit-suite\.(.*)\.distro$#;
712                 my $dpat = $1;
713                 next unless match_glob $dpat, $isuite;
714                 return $kl->{$k};
715             }
716         }
717         return cfg("dgit.default.distro");
718     }
719 }
720
721 sub access_basedistro () {
722     my $noalias = access_basedistro__noalias();
723     my $canon = cfg("dgit-distro.$noalias.alias-canon",'RETURN-UNDEF');
724     return $canon // $noalias;
725 }
726
727 sub access_nomdistro () {
728     my $base = access_basedistro();
729     my $r = cfg("dgit-distro.$base.nominal-distro",'RETURN-UNDEF') // $base;
730     $r =~ m/^$distro_re$/ or badcfg
731  "bad syntax for (nominal) distro \`$r' (does not match /^$distro_re$/)";
732     return $r;
733 }
734
735 sub access_quirk () {
736     # returns (quirk name, distro to use instead or undef, quirk-specific info)
737     my $basedistro = access_basedistro();
738     my $backports_quirk = cfg("dgit-distro.$basedistro.backports-quirk",
739                               'RETURN-UNDEF');
740     if (defined $backports_quirk) {
741         my $re = $backports_quirk;
742         $re =~ s/[^-0-9a-z_\%*()]/\\$&/ig;
743         $re =~ s/\*/.*/g;
744         $re =~ s/\%/([-0-9a-z_]+)/
745             or $re =~ m/[()]/ or badcfg "backports-quirk needs \% or ( )";
746         if ($isuite =~ m/^$re$/) {
747             return ('backports',"$basedistro-backports",$1);
748         }
749     }
750     return ('none',undef);
751 }
752
753 our $access_forpush;
754
755 sub parse_cfg_bool ($$$) {
756     my ($what,$def,$v) = @_;
757     $v //= $def;
758     return
759         $v =~ m/^[ty1]/ ? 1 :
760         $v =~ m/^[fn0]/ ? 0 :
761         badcfg "$what needs t (true, y, 1) or f (false, n, 0) not \`$v'";
762 }       
763
764 sub access_forpush_config () {
765     my $d = access_basedistro();
766
767     return 1 if
768         $new_package &&
769         parse_cfg_bool('new-private-pushers', 0,
770                        cfg("dgit-distro.$d.new-private-pushers",
771                            'RETURN-UNDEF'));
772
773     my $v = cfg("dgit-distro.$d.readonly", 'RETURN-UNDEF');
774     $v //= 'a';
775     return
776         $v =~ m/^[ty1]/ ? 0 : # force readonly,    forpush = 0
777         $v =~ m/^[fn0]/ ? 1 : # force nonreadonly, forpush = 1
778         $v =~ m/^[a]/  ? '' : # auto,              forpush = ''
779         badcfg "readonly needs t (true, y, 1) or f (false, n, 0) or a (auto)";
780 }
781
782 sub access_forpush () {
783     $access_forpush //= access_forpush_config();
784     return $access_forpush;
785 }
786
787 sub pushing () {
788     die "$access_forpush ?" if ($access_forpush // 1) ne 1;
789     badcfg "pushing but distro is configured readonly"
790         if access_forpush_config() eq '0';
791     $access_forpush = 1;
792     $supplementary_message = <<'END' unless $we_are_responder;
793 Push failed, before we got started.
794 You can retry the push, after fixing the problem, if you like.
795 END
796     parseopts_late_defaults();
797 }
798
799 sub notpushing () {
800     parseopts_late_defaults();
801 }
802
803 sub supplementary_message ($) {
804     my ($msg) = @_;
805     if (!$we_are_responder) {
806         $supplementary_message = $msg;
807         return;
808     } elsif ($protovsn >= 3) {
809         responder_send_command "supplementary-message ".length($msg)
810             or die $!;
811         print PO $msg or die $!;
812     }
813 }
814
815 sub access_distros () {
816     # Returns list of distros to try, in order
817     #
818     # We want to try:
819     #    0. `instead of' distro name(s) we have been pointed to
820     #    1. the access_quirk distro, if any
821     #    2a. the user's specified distro, or failing that  } basedistro
822     #    2b. the distro calculated from the suite          }
823     my @l = access_basedistro();
824
825     my (undef,$quirkdistro) = access_quirk();
826     unshift @l, $quirkdistro;
827     unshift @l, $instead_distro;
828     @l = grep { defined } @l;
829
830     push @l, access_nomdistro();
831
832     if (access_forpush()) {
833         @l = map { ("$_/push", $_) } @l;
834     }
835     @l;
836 }
837
838 sub access_cfg_cfgs (@) {
839     my (@keys) = @_;
840     my @cfgs;
841     # The nesting of these loops determines the search order.  We put
842     # the key loop on the outside so that we search all the distros
843     # for each key, before going on to the next key.  That means that
844     # if access_cfg is called with a more specific, and then a less
845     # specific, key, an earlier distro can override the less specific
846     # without necessarily overriding any more specific keys.  (If the
847     # distro wants to override the more specific keys it can simply do
848     # so; whereas if we did the loop the other way around, it would be
849     # impossible to for an earlier distro to override a less specific
850     # key but not the more specific ones without restating the unknown
851     # values of the more specific keys.
852     my @realkeys;
853     my @rundef;
854     # We have to deal with RETURN-UNDEF specially, so that we don't
855     # terminate the search prematurely.
856     foreach (@keys) {
857         if (m/RETURN-UNDEF/) { push @rundef, $_; last; }
858         push @realkeys, $_
859     }
860     foreach my $d (access_distros()) {
861         push @cfgs, map { "dgit-distro.$d.$_" } @realkeys;
862     }
863     push @cfgs, map { "dgit.default.$_" } @realkeys;
864     push @cfgs, @rundef;
865     return @cfgs;
866 }
867
868 sub access_cfg (@) {
869     my (@keys) = @_;
870     my (@cfgs) = access_cfg_cfgs(@keys);
871     my $value = cfg(@cfgs);
872     return $value;
873 }
874
875 sub access_cfg_bool ($$) {
876     my ($def, @keys) = @_;
877     parse_cfg_bool($keys[0], $def, access_cfg(@keys, 'RETURN-UNDEF'));
878 }
879
880 sub string_to_ssh ($) {
881     my ($spec) = @_;
882     if ($spec =~ m/\s/) {
883         return qw(sh -ec), 'exec '.$spec.' "$@"', 'x';
884     } else {
885         return ($spec);
886     }
887 }
888
889 sub access_cfg_ssh () {
890     my $gitssh = access_cfg('ssh', 'RETURN-UNDEF');
891     if (!defined $gitssh) {
892         return @ssh;
893     } else {
894         return string_to_ssh $gitssh;
895     }
896 }
897
898 sub access_runeinfo ($) {
899     my ($info) = @_;
900     return ": dgit ".access_basedistro()." $info ;";
901 }
902
903 sub access_someuserhost ($) {
904     my ($some) = @_;
905     my $user = access_cfg("$some-user-force", 'RETURN-UNDEF');
906     defined($user) && length($user) or
907         $user = access_cfg("$some-user",'username');
908     my $host = access_cfg("$some-host");
909     return length($user) ? "$user\@$host" : $host;
910 }
911
912 sub access_gituserhost () {
913     return access_someuserhost('git');
914 }
915
916 sub access_giturl (;$) {
917     my ($optional) = @_;
918     my $url = access_cfg('git-url','RETURN-UNDEF');
919     my $suffix;
920     if (!length $url) {
921         my $proto = access_cfg('git-proto', 'RETURN-UNDEF');
922         return undef unless defined $proto;
923         $url =
924             $proto.
925             access_gituserhost().
926             access_cfg('git-path');
927     } else {
928         $suffix = access_cfg('git-url-suffix','RETURN-UNDEF');
929     }
930     $suffix //= '.git';
931     return "$url/$package$suffix";
932 }              
933
934 sub parsecontrolfh ($$;$) {
935     my ($fh, $desc, $allowsigned) = @_;
936     our $dpkgcontrolhash_noissigned;
937     my $c;
938     for (;;) {
939         my %opts = ('name' => $desc);
940         $opts{allow_pgp}= $allowsigned || !$dpkgcontrolhash_noissigned;
941         $c = Dpkg::Control::Hash->new(%opts);
942         $c->parse($fh,$desc) or die "parsing of $desc failed";
943         last if $allowsigned;
944         last if $dpkgcontrolhash_noissigned;
945         my $issigned= $c->get_option('is_pgp_signed');
946         if (!defined $issigned) {
947             $dpkgcontrolhash_noissigned= 1;
948             seek $fh, 0,0 or die "seek $desc: $!";
949         } elsif ($issigned) {
950             fail "control file $desc is (already) PGP-signed. ".
951                 " Note that dgit push needs to modify the .dsc and then".
952                 " do the signature itself";
953         } else {
954             last;
955         }
956     }
957     return $c;
958 }
959
960 sub parsecontrol {
961     my ($file, $desc, $allowsigned) = @_;
962     my $fh = new IO::Handle;
963     open $fh, '<', $file or die "$file: $!";
964     my $c = parsecontrolfh($fh,$desc,$allowsigned);
965     $fh->error and die $!;
966     close $fh;
967     return $c;
968 }
969
970 sub getfield ($$) {
971     my ($dctrl,$field) = @_;
972     my $v = $dctrl->{$field};
973     return $v if defined $v;
974     fail "missing field $field in ".$dctrl->get_option('name');
975 }
976
977 sub parsechangelog {
978     my $c = Dpkg::Control::Hash->new(name => 'parsed changelog');
979     my $p = new IO::Handle;
980     my @cmd = (qw(dpkg-parsechangelog), @_);
981     open $p, '-|', @cmd or die $!;
982     $c->parse($p);
983     $?=0; $!=0; close $p or failedcmd @cmd;
984     return $c;
985 }
986
987 sub commit_getclogp ($) {
988     # Returns the parsed changelog hashref for a particular commit
989     my ($objid) = @_;
990     our %commit_getclogp_memo;
991     my $memo = $commit_getclogp_memo{$objid};
992     return $memo if $memo;
993     mkpath '.git/dgit';
994     my $mclog = ".git/dgit/clog-$objid";
995     runcmd shell_cmd "exec >$mclog", @git, qw(cat-file blob),
996         "$objid:debian/changelog";
997     $commit_getclogp_memo{$objid} = parsechangelog("-l$mclog");
998 }
999
1000 sub must_getcwd () {
1001     my $d = getcwd();
1002     defined $d or fail "getcwd failed: $!";
1003     return $d;
1004 }
1005
1006 sub parse_dscdata () {
1007     my $dscfh = new IO::File \$dscdata, '<' or die $!;
1008     printdebug Dumper($dscdata) if $debuglevel>1;
1009     $dsc = parsecontrolfh($dscfh,$dscurl,1);
1010     printdebug Dumper($dsc) if $debuglevel>1;
1011 }
1012
1013 our %rmad;
1014
1015 sub archive_query ($;@) {
1016     my ($method) = shift @_;
1017     fail "this operation does not support multiple comma-separated suites"
1018         if $isuite =~ m/,/;
1019     my $query = access_cfg('archive-query','RETURN-UNDEF');
1020     $query =~ s/^(\w+):// or badcfg "invalid archive-query method \`$query'";
1021     my $proto = $1;
1022     my $data = $'; #';
1023     { no strict qw(refs); &{"${method}_${proto}"}($proto,$data,@_); }
1024 }
1025
1026 sub archive_query_prepend_mirror {
1027     my $m = access_cfg('mirror');
1028     return map { [ $_->[0], $m.$_->[1], @$_[2..$#$_] ] } @_;
1029 }
1030
1031 sub pool_dsc_subpath ($$) {
1032     my ($vsn,$component) = @_; # $package is implict arg
1033     my $prefix = substr($package, 0, $package =~ m/^l/ ? 4 : 1);
1034     return "/pool/$component/$prefix/$package/".dscfn($vsn);
1035 }
1036
1037 sub cfg_apply_map ($$$) {
1038     my ($varref, $what, $mapspec) = @_;
1039     return unless $mapspec;
1040
1041     printdebug "config $what EVAL{ $mapspec; }\n";
1042     $_ = $$varref;
1043     eval "package Dgit::Config; $mapspec;";
1044     die $@ if $@;
1045     $$varref = $_;
1046 }
1047
1048 #---------- `ftpmasterapi' archive query method (nascent) ----------
1049
1050 sub archive_api_query_cmd ($) {
1051     my ($subpath) = @_;
1052     my @cmd = (@curl, qw(-sS));
1053     my $url = access_cfg('archive-query-url');
1054     if ($url =~ m#^https://([-.0-9a-z]+)/#) {
1055         my $host = $1;
1056         my $keys = access_cfg('archive-query-tls-key','RETURN-UNDEF') //'';
1057         foreach my $key (split /\:/, $keys) {
1058             $key =~ s/\%HOST\%/$host/g;
1059             if (!stat $key) {
1060                 fail "for $url: stat $key: $!" unless $!==ENOENT;
1061                 next;
1062             }
1063             fail "config requested specific TLS key but do not know".
1064                 " how to get curl to use exactly that EE key ($key)";
1065 #           push @cmd, "--cacert", $key, "--capath", "/dev/enoent";
1066 #           # Sadly the above line does not work because of changes
1067 #           # to gnutls.   The real fix for #790093 may involve
1068 #           # new curl options.
1069             last;
1070         }
1071         # Fixing #790093 properly will involve providing a value
1072         # for this on clients.
1073         my $kargs = access_cfg('archive-query-tls-curl-ca-args','RETURN-UNDEF');
1074         push @cmd, split / /, $kargs if defined $kargs;
1075     }
1076     push @cmd, $url.$subpath;
1077     return @cmd;
1078 }
1079
1080 sub api_query ($$;$) {
1081     use JSON;
1082     my ($data, $subpath, $ok404) = @_;
1083     badcfg "ftpmasterapi archive query method takes no data part"
1084         if length $data;
1085     my @cmd = archive_api_query_cmd($subpath);
1086     my $url = $cmd[$#cmd];
1087     push @cmd, qw(-w %{http_code});
1088     my $json = cmdoutput @cmd;
1089     unless ($json =~ s/\d+\d+\d$//) {
1090         failedcmd_report_cmd undef, @cmd;
1091         fail "curl failed to print 3-digit HTTP code";
1092     }
1093     my $code = $&;
1094     return undef if $code eq '404' && $ok404;
1095     fail "fetch of $url gave HTTP code $code"
1096         unless $url =~ m#^file://# or $code =~ m/^2/;
1097     return decode_json($json);
1098 }
1099
1100 sub canonicalise_suite_ftpmasterapi {
1101     my ($proto,$data) = @_;
1102     my $suites = api_query($data, 'suites');
1103     my @matched;
1104     foreach my $entry (@$suites) {
1105         next unless grep { 
1106             my $v = $entry->{$_};
1107             defined $v && $v eq $isuite;
1108         } qw(codename name);
1109         push @matched, $entry;
1110     }
1111     fail "unknown suite $isuite" unless @matched;
1112     my $cn;
1113     eval {
1114         @matched==1 or die "multiple matches for suite $isuite\n";
1115         $cn = "$matched[0]{codename}";
1116         defined $cn or die "suite $isuite info has no codename\n";
1117         $cn =~ m/^$suite_re$/ or die "suite $isuite maps to bad codename\n";
1118     };
1119     die "bad ftpmaster api response: $@\n".Dumper(\@matched)
1120         if length $@;
1121     return $cn;
1122 }
1123
1124 sub archive_query_ftpmasterapi {
1125     my ($proto,$data) = @_;
1126     my $info = api_query($data, "dsc_in_suite/$isuite/$package");
1127     my @rows;
1128     my $digester = Digest::SHA->new(256);
1129     foreach my $entry (@$info) {
1130         eval {
1131             my $vsn = "$entry->{version}";
1132             my ($ok,$msg) = version_check $vsn;
1133             die "bad version: $msg\n" unless $ok;
1134             my $component = "$entry->{component}";
1135             $component =~ m/^$component_re$/ or die "bad component";
1136             my $filename = "$entry->{filename}";
1137             $filename && $filename !~ m#[^-+:._~0-9a-zA-Z/]|^[/.]|/[/.]#
1138                 or die "bad filename";
1139             my $sha256sum = "$entry->{sha256sum}";
1140             $sha256sum =~ m/^[0-9a-f]+$/ or die "bad sha256sum";
1141             push @rows, [ $vsn, "/pool/$component/$filename",
1142                           $digester, $sha256sum ];
1143         };
1144         die "bad ftpmaster api response: $@\n".Dumper($entry)
1145             if length $@;
1146     }
1147     @rows = sort { -version_compare($a->[0],$b->[0]) } @rows;
1148     return archive_query_prepend_mirror @rows;
1149 }
1150
1151 sub file_in_archive_ftpmasterapi {
1152     my ($proto,$data,$filename) = @_;
1153     my $pat = $filename;
1154     $pat =~ s/_/\\_/g;
1155     $pat = "%/$pat";
1156     $pat =~ s#[^-+_.0-9a-z/]# sprintf '%%%02x', ord $& #ge;
1157     my $info = api_query($data, "file_in_archive/$pat", 1);
1158 }
1159
1160 #---------- `aptget' archive query method ----------
1161
1162 our $aptget_base;
1163 our $aptget_releasefile;
1164 our $aptget_configpath;
1165
1166 sub aptget_aptget   () { return @aptget,   qw(-c), $aptget_configpath; }
1167 sub aptget_aptcache () { return @aptcache, qw(-c), $aptget_configpath; }
1168
1169 sub aptget_cache_clean {
1170     runcmd_ordryrun_local qw(sh -ec),
1171         'cd "$1"; find -atime +30 -type f -print0 | xargs -0r rm --',
1172         'x', $aptget_base;
1173 }
1174
1175 sub aptget_lock_acquire () {
1176     my $lockfile = "$aptget_base/lock";
1177     open APTGET_LOCK, '>', $lockfile or die "open $lockfile: $!";
1178     flock APTGET_LOCK, LOCK_EX or die "lock $lockfile: $!";
1179 }
1180
1181 sub aptget_prep ($) {
1182     my ($data) = @_;
1183     return if defined $aptget_base;
1184
1185     badcfg "aptget archive query method takes no data part"
1186         if length $data;
1187
1188     my $cache = $ENV{XDG_CACHE_DIR} // "$ENV{HOME}/.cache";
1189
1190     ensuredir $cache;
1191     ensuredir "$cache/dgit";
1192     my $cachekey =
1193         access_cfg('aptget-cachekey','RETURN-UNDEF')
1194         // access_nomdistro();
1195
1196     $aptget_base = "$cache/dgit/aptget";
1197     ensuredir $aptget_base;
1198
1199     my $quoted_base = $aptget_base;
1200     die "$quoted_base contains bad chars, cannot continue"
1201         if $quoted_base =~ m/["\\]/; # apt.conf(5) says no escaping :-/
1202
1203     ensuredir $aptget_base;
1204
1205     aptget_lock_acquire();
1206
1207     aptget_cache_clean();
1208
1209     $aptget_configpath = "$aptget_base/apt.conf#$cachekey";
1210     my $sourceslist = "source.list#$cachekey";
1211
1212     my $aptsuites = $isuite;
1213     cfg_apply_map(\$aptsuites, 'suite map',
1214                   access_cfg('aptget-suite-map', 'RETURN-UNDEF'));
1215
1216     open SRCS, ">", "$aptget_base/$sourceslist" or die $!;
1217     printf SRCS "deb-src %s %s %s\n",
1218         access_cfg('mirror'),
1219         $aptsuites,
1220         access_cfg('aptget-components')
1221         or die $!;
1222
1223     ensuredir "$aptget_base/cache";
1224     ensuredir "$aptget_base/lists";
1225
1226     open CONF, ">", $aptget_configpath or die $!;
1227     print CONF <<END;
1228 Debug::NoLocking "true";
1229 APT::Get::List-Cleanup "false";
1230 #clear APT::Update::Post-Invoke-Success;
1231 Dir::Etc::SourceList "$quoted_base/$sourceslist";
1232 Dir::State::Lists "$quoted_base/lists";
1233 Dir::Etc::preferences "$quoted_base/preferences";
1234 Dir::Cache::srcpkgcache "$quoted_base/cache/srcs#$cachekey";
1235 Dir::Cache::pkgcache "$quoted_base/cache/pkgs#$cachekey";
1236 END
1237
1238     foreach my $key (qw(
1239                         Dir::Cache
1240                         Dir::State
1241                         Dir::Cache::Archives
1242                         Dir::Etc::SourceParts
1243                         Dir::Etc::preferencesparts
1244                       )) {
1245         ensuredir "$aptget_base/$key";
1246         print CONF "$key \"$quoted_base/$key\";\n" or die $!;
1247     };
1248
1249     my $oldatime = (time // die $!) - 1;
1250     foreach my $oldlist (<$aptget_base/lists/*Release>) {
1251         next unless stat_exists $oldlist;
1252         my ($mtime) = (stat _)[9];
1253         utime $oldatime, $mtime, $oldlist or die "$oldlist $!";
1254     }
1255
1256     runcmd_ordryrun_local aptget_aptget(), qw(update);
1257
1258     my @releasefiles;
1259     foreach my $oldlist (<$aptget_base/lists/*Release>) {
1260         next unless stat_exists $oldlist;
1261         my ($atime) = (stat _)[8];
1262         next if $atime == $oldatime;
1263         push @releasefiles, $oldlist;
1264     }
1265     my @inreleasefiles = grep { m#/InRelease$# } @releasefiles;
1266     @releasefiles = @inreleasefiles if @inreleasefiles;
1267     die "apt updated wrong number of Release files (@releasefiles), erk"
1268         unless @releasefiles == 1;
1269
1270     ($aptget_releasefile) = @releasefiles;
1271 }
1272
1273 sub canonicalise_suite_aptget {
1274     my ($proto,$data) = @_;
1275     aptget_prep($data);
1276
1277     my $release = parsecontrol $aptget_releasefile, "Release file", 1;
1278
1279     foreach my $name (qw(Codename Suite)) {
1280         my $val = $release->{$name};
1281         if (defined $val) {
1282             printdebug "release file $name: $val\n";
1283             $val =~ m/^$suite_re$/o or fail
1284  "Release file ($aptget_releasefile) specifies intolerable $name";
1285             cfg_apply_map(\$val, 'suite rmap',
1286                           access_cfg('aptget-suite-rmap', 'RETURN-UNDEF'));
1287             return $val
1288         }
1289     }
1290     return $isuite;
1291 }
1292
1293 sub archive_query_aptget {
1294     my ($proto,$data) = @_;
1295     aptget_prep($data);
1296
1297     ensuredir "$aptget_base/source";
1298     foreach my $old (<$aptget_base/source/*.dsc>) {
1299         unlink $old or die "$old: $!";
1300     }
1301
1302     my $showsrc = cmdoutput aptget_aptcache(), qw(showsrc), $package;
1303     return () unless $showsrc =~ m/^package:\s*\Q$package\E\s*$/mi;
1304     # avoids apt-get source failing with ambiguous error code
1305
1306     runcmd_ordryrun_local
1307         shell_cmd 'cd "$1"/source; shift', $aptget_base,
1308         aptget_aptget(), qw(--download-only --only-source source), $package;
1309
1310     my @dscs = <$aptget_base/source/*.dsc>;
1311     fail "apt-get source did not produce a .dsc" unless @dscs;
1312     fail "apt-get source produced several .dscs (@dscs)" unless @dscs==1;
1313
1314     my $pre_dsc = parsecontrol $dscs[0], $dscs[0], 1;
1315
1316     use URI::Escape;
1317     my $uri = "file://". uri_escape $dscs[0];
1318     $uri =~ s{\%2f}{/}gi;
1319     return [ (getfield $pre_dsc, 'Version'), $uri ];
1320 }
1321
1322 #---------- `dummyapicat' archive query method ----------
1323
1324 sub archive_query_dummycatapi { archive_query_ftpmasterapi @_; }
1325 sub canonicalise_suite_dummycatapi { canonicalise_suite_ftpmasterapi @_; }
1326
1327 sub file_in_archive_dummycatapi ($$$) {
1328     my ($proto,$data,$filename) = @_;
1329     my $mirror = access_cfg('mirror');
1330     $mirror =~ s#^file://#/# or die "$mirror ?";
1331     my @out;
1332     my @cmd = (qw(sh -ec), '
1333             cd "$1"
1334             find -name "$2" -print0 |
1335             xargs -0r sha256sum
1336         ', qw(x), $mirror, $filename);
1337     debugcmd "-|", @cmd;
1338     open FIA, "-|", @cmd or die $!;
1339     while (<FIA>) {
1340         chomp or die;
1341         printdebug "| $_\n";
1342         m/^(\w+)  (\S+)$/ or die "$_ ?";
1343         push @out, { sha256sum => $1, filename => $2 };
1344     }
1345     close FIA or die failedcmd @cmd;
1346     return \@out;
1347 }
1348
1349 #---------- `madison' archive query method ----------
1350
1351 sub archive_query_madison {
1352     return archive_query_prepend_mirror
1353         map { [ @$_[0..1] ] } madison_get_parse(@_);
1354 }
1355
1356 sub madison_get_parse {
1357     my ($proto,$data) = @_;
1358     die unless $proto eq 'madison';
1359     if (!length $data) {
1360         $data= access_cfg('madison-distro','RETURN-UNDEF');
1361         $data //= access_basedistro();
1362     }
1363     $rmad{$proto,$data,$package} ||= cmdoutput
1364         qw(rmadison -asource),"-s$isuite","-u$data",$package;
1365     my $rmad = $rmad{$proto,$data,$package};
1366
1367     my @out;
1368     foreach my $l (split /\n/, $rmad) {
1369         $l =~ m{^ \s*( [^ \t|]+ )\s* \|
1370                   \s*( [^ \t|]+ )\s* \|
1371                   \s*( [^ \t|/]+ )(?:/([^ \t|/]+))? \s* \|
1372                   \s*( [^ \t|]+ )\s* }x or die "$rmad ?";
1373         $1 eq $package or die "$rmad $package ?";
1374         my $vsn = $2;
1375         my $newsuite = $3;
1376         my $component;
1377         if (defined $4) {
1378             $component = $4;
1379         } else {
1380             $component = access_cfg('archive-query-default-component');
1381         }
1382         $5 eq 'source' or die "$rmad ?";
1383         push @out, [$vsn,pool_dsc_subpath($vsn,$component),$newsuite];
1384     }
1385     return sort { -version_compare($a->[0],$b->[0]); } @out;
1386 }
1387
1388 sub canonicalise_suite_madison {
1389     # madison canonicalises for us
1390     my @r = madison_get_parse(@_);
1391     @r or fail
1392         "unable to canonicalise suite using package $package".
1393         " which does not appear to exist in suite $isuite;".
1394         " --existing-package may help";
1395     return $r[0][2];
1396 }
1397
1398 sub file_in_archive_madison { return undef; }
1399
1400 #---------- `sshpsql' archive query method ----------
1401
1402 sub sshpsql ($$$) {
1403     my ($data,$runeinfo,$sql) = @_;
1404     if (!length $data) {
1405         $data= access_someuserhost('sshpsql').':'.
1406             access_cfg('sshpsql-dbname');
1407     }
1408     $data =~ m/:/ or badcfg "invalid sshpsql method string \`$data'";
1409     my ($userhost,$dbname) = ($`,$'); #';
1410     my @rows;
1411     my @cmd = (access_cfg_ssh, $userhost,
1412                access_runeinfo("ssh-psql $runeinfo").
1413                " export LC_MESSAGES=C; export LC_CTYPE=C;".
1414                " ".shellquote qw(psql -A), $dbname, qw(-c), $sql);
1415     debugcmd "|",@cmd;
1416     open P, "-|", @cmd or die $!;
1417     while (<P>) {
1418         chomp or die;
1419         printdebug(">|$_|\n");
1420         push @rows, $_;
1421     }
1422     $!=0; $?=0; close P or failedcmd @cmd;
1423     @rows or die;
1424     my $nrows = pop @rows;
1425     $nrows =~ s/^\((\d+) rows?\)$/$1/ or die "$nrows ?";
1426     @rows == $nrows+1 or die "$nrows ".(scalar @rows)." ?";
1427     @rows = map { [ split /\|/, $_ ] } @rows;
1428     my $ncols = scalar @{ shift @rows };
1429     die if grep { scalar @$_ != $ncols } @rows;
1430     return @rows;
1431 }
1432
1433 sub sql_injection_check {
1434     foreach (@_) { die "$_ $& ?" if m{[^-+=:_.,/0-9a-zA-Z]}; }
1435 }
1436
1437 sub archive_query_sshpsql ($$) {
1438     my ($proto,$data) = @_;
1439     sql_injection_check $isuite, $package;
1440     my @rows = sshpsql($data, "archive-query $isuite $package", <<END);
1441         SELECT source.version, component.name, files.filename, files.sha256sum
1442           FROM source
1443           JOIN src_associations ON source.id = src_associations.source
1444           JOIN suite ON suite.id = src_associations.suite
1445           JOIN dsc_files ON dsc_files.source = source.id
1446           JOIN files_archive_map ON files_archive_map.file_id = dsc_files.file
1447           JOIN component ON component.id = files_archive_map.component_id
1448           JOIN files ON files.id = dsc_files.file
1449          WHERE ( suite.suite_name='$isuite' OR suite.codename='$isuite' )
1450            AND source.source='$package'
1451            AND files.filename LIKE '%.dsc';
1452 END
1453     @rows = sort { -version_compare($a->[0],$b->[0]) } @rows;
1454     my $digester = Digest::SHA->new(256);
1455     @rows = map {
1456         my ($vsn,$component,$filename,$sha256sum) = @$_;
1457         [ $vsn, "/pool/$component/$filename",$digester,$sha256sum ];
1458     } @rows;
1459     return archive_query_prepend_mirror @rows;
1460 }
1461
1462 sub canonicalise_suite_sshpsql ($$) {
1463     my ($proto,$data) = @_;
1464     sql_injection_check $isuite;
1465     my @rows = sshpsql($data, "canonicalise-suite $isuite", <<END);
1466         SELECT suite.codename
1467           FROM suite where suite_name='$isuite' or codename='$isuite';
1468 END
1469     @rows = map { $_->[0] } @rows;
1470     fail "unknown suite $isuite" unless @rows;
1471     die "ambiguous $isuite: @rows ?" if @rows>1;
1472     return $rows[0];
1473 }
1474
1475 sub file_in_archive_sshpsql ($$$) { return undef; }
1476
1477 #---------- `dummycat' archive query method ----------
1478
1479 sub canonicalise_suite_dummycat ($$) {
1480     my ($proto,$data) = @_;
1481     my $dpath = "$data/suite.$isuite";
1482     if (!open C, "<", $dpath) {
1483         $!==ENOENT or die "$dpath: $!";
1484         printdebug "dummycat canonicalise_suite $isuite $dpath ENOENT\n";
1485         return $isuite;
1486     }
1487     $!=0; $_ = <C>;
1488     chomp or die "$dpath: $!";
1489     close C;
1490     printdebug "dummycat canonicalise_suite $isuite $dpath = $_\n";
1491     return $_;
1492 }
1493
1494 sub archive_query_dummycat ($$) {
1495     my ($proto,$data) = @_;
1496     canonicalise_suite();
1497     my $dpath = "$data/package.$csuite.$package";
1498     if (!open C, "<", $dpath) {
1499         $!==ENOENT or die "$dpath: $!";
1500         printdebug "dummycat query $csuite $package $dpath ENOENT\n";
1501         return ();
1502     }
1503     my @rows;
1504     while (<C>) {
1505         next if m/^\#/;
1506         next unless m/\S/;
1507         die unless chomp;
1508         printdebug "dummycat query $csuite $package $dpath | $_\n";
1509         my @row = split /\s+/, $_;
1510         @row==2 or die "$dpath: $_ ?";
1511         push @rows, \@row;
1512     }
1513     C->error and die "$dpath: $!";
1514     close C;
1515     return archive_query_prepend_mirror
1516         sort { -version_compare($a->[0],$b->[0]); } @rows;
1517 }
1518
1519 sub file_in_archive_dummycat () { return undef; }
1520
1521 #---------- tag format handling ----------
1522
1523 sub access_cfg_tagformats () {
1524     split /\,/, access_cfg('dgit-tag-format');
1525 }
1526
1527 sub access_cfg_tagformats_can_splitbrain () {
1528     my %y = map { $_ => 1 } access_cfg_tagformats;
1529     foreach my $needtf (qw(new maint)) {
1530         next if $y{$needtf};
1531         return 0;
1532     }
1533     return 1;
1534 }
1535
1536 sub need_tagformat ($$) {
1537     my ($fmt, $why) = @_;
1538     fail "need to use tag format $fmt ($why) but also need".
1539         " to use tag format $tagformat_want->[0] ($tagformat_want->[1])".
1540         " - no way to proceed"
1541         if $tagformat_want && $tagformat_want->[0] ne $fmt;
1542     $tagformat_want = [$fmt, $why, $tagformat_want->[2] // 0];
1543 }
1544
1545 sub select_tagformat () {
1546     # sets $tagformatfn
1547     return if $tagformatfn && !$tagformat_want;
1548     die 'bug' if $tagformatfn && $tagformat_want;
1549     # ... $tagformat_want assigned after previous select_tagformat
1550
1551     my (@supported) = grep { $_ =~ m/^(?:old|new)$/ } access_cfg_tagformats();
1552     printdebug "select_tagformat supported @supported\n";
1553
1554     $tagformat_want //= [ $supported[0], "distro access configuration", 0 ];
1555     printdebug "select_tagformat specified @$tagformat_want\n";
1556
1557     my ($fmt,$why,$override) = @$tagformat_want;
1558
1559     fail "target distro supports tag formats @supported".
1560         " but have to use $fmt ($why)"
1561         unless $override
1562             or grep { $_ eq $fmt } @supported;
1563
1564     $tagformat_want = undef;
1565     $tagformat = $fmt;
1566     $tagformatfn = ${*::}{"debiantag_$fmt"};
1567
1568     fail "trying to use unknown tag format \`$fmt' ($why) !"
1569         unless $tagformatfn;
1570 }
1571
1572 #---------- archive query entrypoints and rest of program ----------
1573
1574 sub canonicalise_suite () {
1575     return if defined $csuite;
1576     fail "cannot operate on $isuite suite" if $isuite eq 'UNRELEASED';
1577     $csuite = archive_query('canonicalise_suite');
1578     if ($isuite ne $csuite) {
1579         progress "canonical suite name for $isuite is $csuite";
1580     } else {
1581         progress "canonical suite name is $csuite";
1582     }
1583 }
1584
1585 sub get_archive_dsc () {
1586     canonicalise_suite();
1587     my @vsns = archive_query('archive_query');
1588     foreach my $vinfo (@vsns) {
1589         my ($vsn,$vsn_dscurl,$digester,$digest) = @$vinfo;
1590         $dscurl = $vsn_dscurl;
1591         $dscdata = url_get($dscurl);
1592         if (!$dscdata) {
1593             $skew_warning_vsn = $vsn if !defined $skew_warning_vsn;
1594             next;
1595         }
1596         if ($digester) {
1597             $digester->reset();
1598             $digester->add($dscdata);
1599             my $got = $digester->hexdigest();
1600             $got eq $digest or
1601                 fail "$dscurl has hash $got but".
1602                     " archive told us to expect $digest";
1603         }
1604         parse_dscdata();
1605         my $fmt = getfield $dsc, 'Format';
1606         $format_ok{$fmt} or forceable_fail [qw(unsupported-source-format)],
1607             "unsupported source format $fmt, sorry";
1608             
1609         $dsc_checked = !!$digester;
1610         printdebug "get_archive_dsc: Version ".(getfield $dsc, 'Version')."\n";
1611         return;
1612     }
1613     $dsc = undef;
1614     printdebug "get_archive_dsc: nothing in archive, returning undef\n";
1615 }
1616
1617 sub check_for_git ();
1618 sub check_for_git () {
1619     # returns 0 or 1
1620     my $how = access_cfg('git-check');
1621     if ($how eq 'ssh-cmd') {
1622         my @cmd =
1623             (access_cfg_ssh, access_gituserhost(),
1624              access_runeinfo("git-check $package").
1625              " set -e; cd ".access_cfg('git-path').";".
1626              " if test -d $package.git; then echo 1; else echo 0; fi");
1627         my $r= cmdoutput @cmd;
1628         if (defined $r and $r =~ m/^divert (\w+)$/) {
1629             my $divert=$1;
1630             my ($usedistro,) = access_distros();
1631             # NB that if we are pushing, $usedistro will be $distro/push
1632             $instead_distro= cfg("dgit-distro.$usedistro.diverts.$divert");
1633             $instead_distro =~ s{^/}{ access_basedistro()."/" }e;
1634             progress "diverting to $divert (using config for $instead_distro)";
1635             return check_for_git();
1636         }
1637         failedcmd @cmd unless defined $r and $r =~ m/^[01]$/;
1638         return $r+0;
1639     } elsif ($how eq 'url') {
1640         my $prefix = access_cfg('git-check-url','git-url');
1641         my $suffix = access_cfg('git-check-suffix','git-suffix',
1642                                 'RETURN-UNDEF') // '.git';
1643         my $url = "$prefix/$package$suffix";
1644         my @cmd = (@curl, qw(-sS -I), $url);
1645         my $result = cmdoutput @cmd;
1646         $result =~ s/^\S+ 200 .*\n\r?\n//;
1647         # curl -sS -I with https_proxy prints
1648         # HTTP/1.0 200 Connection established
1649         $result =~ m/^\S+ (404|200) /s or
1650             fail "unexpected results from git check query - ".
1651                 Dumper($prefix, $result);
1652         my $code = $1;
1653         if ($code eq '404') {
1654             return 0;
1655         } elsif ($code eq '200') {
1656             return 1;
1657         } else {
1658             die;
1659         }
1660     } elsif ($how eq 'true') {
1661         return 1;
1662     } elsif ($how eq 'false') {
1663         return 0;
1664     } else {
1665         badcfg "unknown git-check \`$how'";
1666     }
1667 }
1668
1669 sub create_remote_git_repo () {
1670     my $how = access_cfg('git-create');
1671     if ($how eq 'ssh-cmd') {
1672         runcmd_ordryrun
1673             (access_cfg_ssh, access_gituserhost(),
1674              access_runeinfo("git-create $package").
1675              "set -e; cd ".access_cfg('git-path').";".
1676              " cp -a _template $package.git");
1677     } elsif ($how eq 'true') {
1678         # nothing to do
1679     } else {
1680         badcfg "unknown git-create \`$how'";
1681     }
1682 }
1683
1684 our ($dsc_hash,$lastpush_mergeinput);
1685 our ($dsc_distro, $dsc_hint_tag, $dsc_hint_url);
1686
1687 our $ud = '.git/dgit/unpack';
1688
1689 sub prep_ud (;$) {
1690     my ($d) = @_;
1691     $d //= $ud;
1692     rmtree($d);
1693     mkpath '.git/dgit';
1694     mkdir $d or die $!;
1695 }
1696
1697 sub mktree_in_ud_here () {
1698     runcmd qw(git init -q);
1699     runcmd qw(git config gc.auto 0);
1700     rmtree('.git/objects');
1701     symlink '../../../../objects','.git/objects' or die $!;
1702 }
1703
1704 sub git_write_tree () {
1705     my $tree = cmdoutput @git, qw(write-tree);
1706     $tree =~ m/^\w+$/ or die "$tree ?";
1707     return $tree;
1708 }
1709
1710 sub git_add_write_tree () {
1711     runcmd @git, qw(add -Af .);
1712     return git_write_tree();
1713 }
1714
1715 sub remove_stray_gits ($) {
1716     my ($what) = @_;
1717     my @gitscmd = qw(find -name .git -prune -print0);
1718     debugcmd "|",@gitscmd;
1719     open GITS, "-|", @gitscmd or die $!;
1720     {
1721         local $/="\0";
1722         while (<GITS>) {
1723             chomp or die;
1724             print STDERR "$us: warning: removing from $what: ",
1725                 (messagequote $_), "\n";
1726             rmtree $_;
1727         }
1728     }
1729     $!=0; $?=0; close GITS or failedcmd @gitscmd;
1730 }
1731
1732 sub mktree_in_ud_from_only_subdir ($;$) {
1733     my ($what,$raw) = @_;
1734
1735     # changes into the subdir
1736     my (@dirs) = <*/.>;
1737     die "expected one subdir but found @dirs ?" unless @dirs==1;
1738     $dirs[0] =~ m#^([^/]+)/\.$# or die;
1739     my $dir = $1;
1740     changedir $dir;
1741
1742     remove_stray_gits($what);
1743     mktree_in_ud_here();
1744     if (!$raw) {
1745         my ($format, $fopts) = get_source_format();
1746         if (madformat($format)) {
1747             rmtree '.pc';
1748         }
1749     }
1750
1751     my $tree=git_add_write_tree();
1752     return ($tree,$dir);
1753 }
1754
1755 our @files_csum_info_fields = 
1756     (['Checksums-Sha256','Digest::SHA', 'new(256)', 'sha256sum'],
1757      ['Checksums-Sha1',  'Digest::SHA', 'new(1)',   'sha1sum'],
1758      ['Files',           'Digest::MD5', 'new()',    'md5sum']);
1759
1760 sub dsc_files_info () {
1761     foreach my $csumi (@files_csum_info_fields) {
1762         my ($fname, $module, $method) = @$csumi;
1763         my $field = $dsc->{$fname};
1764         next unless defined $field;
1765         eval "use $module; 1;" or die $@;
1766         my @out;
1767         foreach (split /\n/, $field) {
1768             next unless m/\S/;
1769             m/^(\w+) (\d+) (\S+)$/ or
1770                 fail "could not parse .dsc $fname line \`$_'";
1771             my $digester = eval "$module"."->$method;" or die $@;
1772             push @out, {
1773                 Hash => $1,
1774                 Bytes => $2,
1775                 Filename => $3,
1776                 Digester => $digester,
1777             };
1778         }
1779         return @out;
1780     }
1781     fail "missing any supported Checksums-* or Files field in ".
1782         $dsc->get_option('name');
1783 }
1784
1785 sub dsc_files () {
1786     map { $_->{Filename} } dsc_files_info();
1787 }
1788
1789 sub files_compare_inputs (@) {
1790     my $inputs = \@_;
1791     my %record;
1792     my %fchecked;
1793
1794     my $showinputs = sub {
1795         return join "; ", map { $_->get_option('name') } @$inputs;
1796     };
1797
1798     foreach my $in (@$inputs) {
1799         my $expected_files;
1800         my $in_name = $in->get_option('name');
1801
1802         printdebug "files_compare_inputs $in_name\n";
1803
1804         foreach my $csumi (@files_csum_info_fields) {
1805             my ($fname) = @$csumi;
1806             printdebug "files_compare_inputs $in_name $fname\n";
1807
1808             my $field = $in->{$fname};
1809             next unless defined $field;
1810
1811             my @files;
1812             foreach (split /\n/, $field) {
1813                 next unless m/\S/;
1814
1815                 my ($info, $f) = m/^(\w+ \d+) (?:\S+ \S+ )?(\S+)$/ or
1816                     fail "could not parse $in_name $fname line \`$_'";
1817
1818                 printdebug "files_compare_inputs $in_name $fname $f\n";
1819
1820                 push @files, $f;
1821
1822                 my $re = \ $record{$f}{$fname};
1823                 if (defined $$re) {
1824                     $fchecked{$f}{$in_name} = 1;
1825                     $$re eq $info or
1826                         fail "hash or size of $f varies in $fname fields".
1827                         " (between: ".$showinputs->().")";
1828                 } else {
1829                     $$re = $info;
1830                 }
1831             }
1832             @files = sort @files;
1833             $expected_files //= \@files;
1834             "@$expected_files" eq "@files" or
1835                 fail "file list in $in_name varies between hash fields!";
1836         }
1837         $expected_files or
1838             fail "$in_name has no files list field(s)";
1839     }
1840     printdebug "files_compare_inputs ".Dumper(\%fchecked, \%record)
1841         if $debuglevel>=2;
1842
1843     grep { keys %$_ == @$inputs-1 } values %fchecked
1844         or fail "no file appears in all file lists".
1845         " (looked in: ".$showinputs->().")";
1846 }
1847
1848 sub is_orig_file_in_dsc ($$) {
1849     my ($f, $dsc_files_info) = @_;
1850     return 0 if @$dsc_files_info <= 1;
1851     # One file means no origs, and the filename doesn't have a "what
1852     # part of dsc" component.  (Consider versions ending `.orig'.)
1853     return 0 unless $f =~ m/\.$orig_f_tail_re$/o;
1854     return 1;
1855 }
1856
1857 sub is_orig_file_of_vsn ($$) {
1858     my ($f, $upstreamvsn) = @_;
1859     my $base = srcfn $upstreamvsn, '';
1860     return 0 unless $f =~ m/^\Q$base\E\.$orig_f_tail_re$/;
1861     return 1;
1862 }
1863
1864 sub changes_update_origs_from_dsc ($$$$) {
1865     my ($dsc, $changes, $upstreamvsn, $changesfile) = @_;
1866     my %changes_f;
1867     printdebug "checking origs needed ($upstreamvsn)...\n";
1868     $_ = getfield $changes, 'Files';
1869     m/^\w+ \d+ (\S+ \S+) \S+$/m or
1870         fail "cannot find section/priority from .changes Files field";
1871     my $placementinfo = $1;
1872     my %changed;
1873     printdebug "checking origs needed placement '$placementinfo'...\n";
1874     foreach my $l (split /\n/, getfield $dsc, 'Files') {
1875         $l =~ m/\S+$/ or next;
1876         my $file = $&;
1877         printdebug "origs $file | $l\n";
1878         next unless is_orig_file_of_vsn $file, $upstreamvsn;
1879         printdebug "origs $file is_orig\n";
1880         my $have = archive_query('file_in_archive', $file);
1881         if (!defined $have) {
1882             print STDERR <<END;
1883 archive does not support .orig check; hope you used --ch:--sa/-sd if needed
1884 END
1885             return;
1886         }
1887         my $found_same = 0;
1888         my @found_differ;
1889         printdebug "origs $file \$#\$have=$#$have\n";
1890         foreach my $h (@$have) {
1891             my $same = 0;
1892             my @differ;
1893             foreach my $csumi (@files_csum_info_fields) {
1894                 my ($fname, $module, $method, $archivefield) = @$csumi;
1895                 next unless defined $h->{$archivefield};
1896                 $_ = $dsc->{$fname};
1897                 next unless defined;
1898                 m/^(\w+) .* \Q$file\E$/m or
1899                     fail ".dsc $fname missing entry for $file";
1900                 if ($h->{$archivefield} eq $1) {
1901                     $same++;
1902                 } else {
1903                     push @differ,
1904  "$archivefield: $h->{$archivefield} (archive) != $1 (local .dsc)";
1905                 }
1906             }
1907             die "$file ".Dumper($h)." ?!" if $same && @differ;
1908             $found_same++
1909                 if $same;
1910             push @found_differ, "archive $h->{filename}: ".join "; ", @differ
1911                 if @differ;
1912         }
1913         printdebug "origs $file f.same=$found_same".
1914             " #f._differ=$#found_differ\n";
1915         if (@found_differ && !$found_same) {
1916             fail join "\n",
1917                 "archive contains $file with different checksum",
1918                 @found_differ;
1919         }
1920         # Now we edit the changes file to add or remove it
1921         foreach my $csumi (@files_csum_info_fields) {
1922             my ($fname, $module, $method, $archivefield) = @$csumi;
1923             next unless defined $changes->{$fname};
1924             if ($found_same) {
1925                 # in archive, delete from .changes if it's there
1926                 $changed{$file} = "removed" if
1927                     $changes->{$fname} =~ s/^.* \Q$file\E$(?:)\n//m;
1928             } elsif ($changes->{$fname} =~ m/^.* \Q$file\E$(?:)\n/m) {
1929                 # not in archive, but it's here in the .changes
1930             } else {
1931                 my $dsc_data = getfield $dsc, $fname;
1932                 $dsc_data =~ m/^(.* \Q$file\E$)\n/m or die "$dsc_data $file ?";
1933                 my $extra = $1;
1934                 $extra =~ s/ \d+ /$&$placementinfo /
1935                     or die "$fname $extra >$dsc_data< ?"
1936                     if $fname eq 'Files';
1937                 $changes->{$fname} .= "\n". $extra;
1938                 $changed{$file} = "added";
1939             }
1940         }
1941     }
1942     if (%changed) {
1943         foreach my $file (keys %changed) {
1944             progress sprintf
1945                 "edited .changes for archive .orig contents: %s %s",
1946                 $changed{$file}, $file;
1947         }
1948         my $chtmp = "$changesfile.tmp";
1949         $changes->save($chtmp);
1950         if (act_local()) {
1951             rename $chtmp,$changesfile or die "$changesfile $!";
1952         } else {
1953             progress "[new .changes left in $changesfile]";
1954         }
1955     } else {
1956         progress "$changesfile already has appropriate .orig(s) (if any)";
1957     }
1958 }
1959
1960 sub make_commit ($) {
1961     my ($file) = @_;
1962     return cmdoutput @git, qw(hash-object -w -t commit), $file;
1963 }
1964
1965 sub make_commit_text ($) {
1966     my ($text) = @_;
1967     my ($out, $in);
1968     my @cmd = (@git, qw(hash-object -w -t commit --stdin));
1969     debugcmd "|",@cmd;
1970     print Dumper($text) if $debuglevel > 1;
1971     my $child = open2($out, $in, @cmd) or die $!;
1972     my $h;
1973     eval {
1974         print $in $text or die $!;
1975         close $in or die $!;
1976         $h = <$out>;
1977         $h =~ m/^\w+$/ or die;
1978         $h = $&;
1979         printdebug "=> $h\n";
1980     };
1981     close $out;
1982     waitpid $child, 0 == $child or die "$child $!";
1983     $? and failedcmd @cmd;
1984     return $h;
1985 }
1986
1987 sub clogp_authline ($) {
1988     my ($clogp) = @_;
1989     my $author = getfield $clogp, 'Maintainer';
1990     $author =~ s#,.*##ms;
1991     my $date = cmdoutput qw(date), '+%s %z', qw(-d), getfield($clogp,'Date');
1992     my $authline = "$author $date";
1993     $authline =~ m/$git_authline_re/o or
1994         fail "unexpected commit author line format \`$authline'".
1995         " (was generated from changelog Maintainer field)";
1996     return ($1,$2,$3) if wantarray;
1997     return $authline;
1998 }
1999
2000 sub vendor_patches_distro ($$) {
2001     my ($checkdistro, $what) = @_;
2002     return unless defined $checkdistro;
2003
2004     my $series = "debian/patches/\L$checkdistro\E.series";
2005     printdebug "checking for vendor-specific $series ($what)\n";
2006
2007     if (!open SERIES, "<", $series) {
2008         die "$series $!" unless $!==ENOENT;
2009         return;
2010     }
2011     while (<SERIES>) {
2012         next unless m/\S/;
2013         next if m/^\s+\#/;
2014
2015         print STDERR <<END;
2016
2017 Unfortunately, this source package uses a feature of dpkg-source where
2018 the same source package unpacks to different source code on different
2019 distros.  dgit cannot safely operate on such packages on affected
2020 distros, because the meaning of source packages is not stable.
2021
2022 Please ask the distro/maintainer to remove the distro-specific series
2023 files and use a different technique (if necessary, uploading actually
2024 different packages, if different distros are supposed to have
2025 different code).
2026
2027 END
2028         fail "Found active distro-specific series file for".
2029             " $checkdistro ($what): $series, cannot continue";
2030     }
2031     die "$series $!" if SERIES->error;
2032     close SERIES;
2033 }
2034
2035 sub check_for_vendor_patches () {
2036     # This dpkg-source feature doesn't seem to be documented anywhere!
2037     # But it can be found in the changelog (reformatted):
2038
2039     #   commit  4fa01b70df1dc4458daee306cfa1f987b69da58c
2040     #   Author: Raphael Hertzog <hertzog@debian.org>
2041     #   Date: Sun  Oct  3  09:36:48  2010 +0200
2042
2043     #   dpkg-source: correctly create .pc/.quilt_series with alternate
2044     #   series files
2045     #   
2046     #   If you have debian/patches/ubuntu.series and you were
2047     #   unpacking the source package on ubuntu, quilt was still
2048     #   directed to debian/patches/series instead of
2049     #   debian/patches/ubuntu.series.
2050     #   
2051     #   debian/changelog                        |    3 +++
2052     #   scripts/Dpkg/Source/Package/V3/quilt.pm |    4 +++-
2053     #   2 files changed, 6 insertions(+), 1 deletion(-)
2054
2055     use Dpkg::Vendor;
2056     vendor_patches_distro($ENV{DEB_VENDOR}, "DEB_VENDOR");
2057     vendor_patches_distro(Dpkg::Vendor::get_current_vendor(),
2058                          "Dpkg::Vendor \`current vendor'");
2059     vendor_patches_distro(access_basedistro(),
2060                           "(base) distro being accessed");
2061     vendor_patches_distro(access_nomdistro(),
2062                           "(nominal) distro being accessed");
2063 }
2064
2065 sub generate_commits_from_dsc () {
2066     # See big comment in fetch_from_archive, below.
2067     # See also README.dsc-import.
2068     prep_ud();
2069     changedir $ud;
2070
2071     my @dfi = dsc_files_info();
2072     foreach my $fi (@dfi) {
2073         my $f = $fi->{Filename};
2074         die "$f ?" if $f =~ m#/|^\.|\.dsc$|\.tmp$#;
2075         my $upper_f = "../../../../$f";
2076
2077         printdebug "considering reusing $f: ";
2078
2079         if (link_ltarget "$upper_f,fetch", $f) {
2080             printdebug "linked (using ...,fetch).\n";
2081         } elsif ((printdebug "($!) "),
2082                  $! != ENOENT) {
2083             fail "accessing ../$f,fetch: $!";
2084         } elsif (link_ltarget $upper_f, $f) {
2085             printdebug "linked.\n";
2086         } elsif ((printdebug "($!) "),
2087                  $! != ENOENT) {
2088             fail "accessing ../$f: $!";
2089         } else {
2090             printdebug "absent.\n";
2091         }
2092
2093         my $refetched;
2094         complete_file_from_dsc('.', $fi, \$refetched)
2095             or next;
2096
2097         printdebug "considering saving $f: ";
2098
2099         if (link $f, $upper_f) {
2100             printdebug "linked.\n";
2101         } elsif ((printdebug "($!) "),
2102                  $! != EEXIST) {
2103             fail "saving ../$f: $!";
2104         } elsif (!$refetched) {
2105             printdebug "no need.\n";
2106         } elsif (link $f, "$upper_f,fetch") {
2107             printdebug "linked (using ...,fetch).\n";
2108         } elsif ((printdebug "($!) "),
2109                  $! != EEXIST) {
2110             fail "saving ../$f,fetch: $!";
2111         } else {
2112             printdebug "cannot.\n";
2113         }
2114     }
2115
2116     # We unpack and record the orig tarballs first, so that we only
2117     # need disk space for one private copy of the unpacked source.
2118     # But we can't make them into commits until we have the metadata
2119     # from the debian/changelog, so we record the tree objects now and
2120     # make them into commits later.
2121     my @tartrees;
2122     my $upstreamv = upstreamversion $dsc->{version};
2123     my $orig_f_base = srcfn $upstreamv, '';
2124
2125     foreach my $fi (@dfi) {
2126         # We actually import, and record as a commit, every tarball
2127         # (unless there is only one file, in which case there seems
2128         # little point.
2129
2130         my $f = $fi->{Filename};
2131         printdebug "import considering $f ";
2132         (printdebug "only one dfi\n"), next if @dfi == 1;
2133         (printdebug "not tar\n"), next unless $f =~ m/\.tar(\.\w+)?$/;
2134         (printdebug "signature\n"), next if $f =~ m/$orig_f_sig_re$/o;
2135         my $compr_ext = $1;
2136
2137         my ($orig_f_part) =
2138             $f =~ m/^\Q$orig_f_base\E\.([^._]+)?\.tar(?:\.\w+)?$/;
2139
2140         printdebug "Y ", (join ' ', map { $_//"(none)" }
2141                           $compr_ext, $orig_f_part
2142                          ), "\n";
2143
2144         my $input = new IO::File $f, '<' or die "$f $!";
2145         my $compr_pid;
2146         my @compr_cmd;
2147
2148         if (defined $compr_ext) {
2149             my $cname =
2150                 Dpkg::Compression::compression_guess_from_filename $f;
2151             fail "Dpkg::Compression cannot handle file $f in source package"
2152                 if defined $compr_ext && !defined $cname;
2153             my $compr_proc =
2154                 new Dpkg::Compression::Process compression => $cname;
2155             my @compr_cmd = $compr_proc->get_uncompress_cmdline();
2156             my $compr_fh = new IO::Handle;
2157             my $compr_pid = open $compr_fh, "-|" // die $!;
2158             if (!$compr_pid) {
2159                 open STDIN, "<&", $input or die $!;
2160                 exec @compr_cmd;
2161                 die "dgit (child): exec $compr_cmd[0]: $!\n";
2162             }
2163             $input = $compr_fh;
2164         }
2165
2166         rmtree "_unpack-tar";
2167         mkdir "_unpack-tar" or die $!;
2168         my @tarcmd = qw(tar -x -f -
2169                         --no-same-owner --no-same-permissions
2170                         --no-acls --no-xattrs --no-selinux);
2171         my $tar_pid = fork // die $!;
2172         if (!$tar_pid) {
2173             chdir "_unpack-tar" or die $!;
2174             open STDIN, "<&", $input or die $!;
2175             exec @tarcmd;
2176             die "dgit (child): exec $tarcmd[0]: $!";
2177         }
2178         $!=0; (waitpid $tar_pid, 0) == $tar_pid or die $!;
2179         !$? or failedcmd @tarcmd;
2180
2181         close $input or
2182             (@compr_cmd ? failedcmd @compr_cmd
2183              : die $!);
2184         # finally, we have the results in "tarball", but maybe
2185         # with the wrong permissions
2186
2187         runcmd qw(chmod -R +rwX _unpack-tar);
2188         changedir "_unpack-tar";
2189         remove_stray_gits($f);
2190         mktree_in_ud_here();
2191         
2192         my ($tree) = git_add_write_tree();
2193         my $tentries = cmdoutput @git, qw(ls-tree -z), $tree;
2194         if ($tentries =~ m/^\d+ tree (\w+)\t[^\000]+\000$/s) {
2195             $tree = $1;
2196             printdebug "one subtree $1\n";
2197         } else {
2198             printdebug "multiple subtrees\n";
2199         }
2200         changedir "..";
2201         rmtree "_unpack-tar";
2202
2203         my $ent = [ $f, $tree ];
2204         push @tartrees, {
2205             Orig => !!$orig_f_part,
2206             Sort => (!$orig_f_part         ? 2 :
2207                      $orig_f_part =~ m/-/g ? 1 :
2208                                              0),
2209             F => $f,
2210             Tree => $tree,
2211         };
2212     }
2213
2214     @tartrees = sort {
2215         # put any without "_" first (spec is not clear whether files
2216         # are always in the usual order).  Tarballs without "_" are
2217         # the main orig or the debian tarball.
2218         $a->{Sort} <=> $b->{Sort} or
2219         $a->{F}    cmp $b->{F}
2220     } @tartrees;
2221
2222     my $any_orig = grep { $_->{Orig} } @tartrees;
2223
2224     my $dscfn = "$package.dsc";
2225
2226     my $treeimporthow = 'package';
2227
2228     open D, ">", $dscfn or die "$dscfn: $!";
2229     print D $dscdata or die "$dscfn: $!";
2230     close D or die "$dscfn: $!";
2231     my @cmd = qw(dpkg-source);
2232     push @cmd, '--no-check' if $dsc_checked;
2233     if (madformat $dsc->{format}) {
2234         push @cmd, '--skip-patches';
2235         $treeimporthow = 'unpatched';
2236     }
2237     push @cmd, qw(-x --), $dscfn;
2238     runcmd @cmd;
2239
2240     my ($tree,$dir) = mktree_in_ud_from_only_subdir("source package");
2241     if (madformat $dsc->{format}) { 
2242         check_for_vendor_patches();
2243     }
2244
2245     my $dappliedtree;
2246     if (madformat $dsc->{format}) {
2247         my @pcmd = qw(dpkg-source --before-build .);
2248         runcmd shell_cmd 'exec >/dev/null', @pcmd;
2249         rmtree '.pc';
2250         $dappliedtree = git_add_write_tree();
2251     }
2252
2253     my @clogcmd = qw(dpkg-parsechangelog --format rfc822 --all);
2254     debugcmd "|",@clogcmd;
2255     open CLOGS, "-|", @clogcmd or die $!;
2256
2257     my $clogp;
2258     my $r1clogp;
2259
2260     printdebug "import clog search...\n";
2261
2262     for (;;) {
2263         my $stanzatext = do { local $/=""; <CLOGS>; };
2264         printdebug "import clogp ".Dumper($stanzatext) if $debuglevel>1;
2265         last if !defined $stanzatext;
2266
2267         my $desc = "package changelog, entry no.$.";
2268         open my $stanzafh, "<", \$stanzatext or die;
2269         my $thisstanza = parsecontrolfh $stanzafh, $desc, 1;
2270         $clogp //= $thisstanza;
2271
2272         printdebug "import clog $thisstanza->{version} $desc...\n";
2273
2274         last if !$any_orig; # we don't need $r1clogp
2275
2276         # We look for the first (most recent) changelog entry whose
2277         # version number is lower than the upstream version of this
2278         # package.  Then the last (least recent) previous changelog
2279         # entry is treated as the one which introduced this upstream
2280         # version and used for the synthetic commits for the upstream
2281         # tarballs.
2282
2283         # One might think that a more sophisticated algorithm would be
2284         # necessary.  But: we do not want to scan the whole changelog
2285         # file.  Stopping when we see an earlier version, which
2286         # necessarily then is an earlier upstream version, is the only
2287         # realistic way to do that.  Then, either the earliest
2288         # changelog entry we have seen so far is indeed the earliest
2289         # upload of this upstream version; or there are only changelog
2290         # entries relating to later upstream versions (which is not
2291         # possible unless the changelog and .dsc disagree about the
2292         # version).  Then it remains to choose between the physically
2293         # last entry in the file, and the one with the lowest version
2294         # number.  If these are not the same, we guess that the
2295         # versions were created in a non-monotic order rather than
2296         # that the changelog entries have been misordered.
2297
2298         printdebug "import clog $thisstanza->{version} vs $upstreamv...\n";
2299
2300         last if version_compare($thisstanza->{version}, $upstreamv) < 0;
2301         $r1clogp = $thisstanza;
2302
2303         printdebug "import clog $r1clogp->{version} becomes r1\n";
2304     }
2305     die $! if CLOGS->error;
2306     close CLOGS or $?==SIGPIPE or failedcmd @clogcmd;
2307
2308     $clogp or fail "package changelog has no entries!";
2309
2310     my $authline = clogp_authline $clogp;
2311     my $changes = getfield $clogp, 'Changes';
2312     my $cversion = getfield $clogp, 'Version';
2313
2314     if (@tartrees) {
2315         $r1clogp //= $clogp; # maybe there's only one entry;
2316         my $r1authline = clogp_authline $r1clogp;
2317         # Strictly, r1authline might now be wrong if it's going to be
2318         # unused because !$any_orig.  Whatever.
2319
2320         printdebug "import tartrees authline   $authline\n";
2321         printdebug "import tartrees r1authline $r1authline\n";
2322
2323         foreach my $tt (@tartrees) {
2324             printdebug "import tartree $tt->{F} $tt->{Tree}\n";
2325
2326             $tt->{Commit} = make_commit_text($tt->{Orig} ? <<END_O : <<END_T);
2327 tree $tt->{Tree}
2328 author $r1authline
2329 committer $r1authline
2330
2331 Import $tt->{F}
2332
2333 [dgit import orig $tt->{F}]
2334 END_O
2335 tree $tt->{Tree}
2336 author $authline
2337 committer $authline
2338
2339 Import $tt->{F}
2340
2341 [dgit import tarball $package $cversion $tt->{F}]
2342 END_T
2343         }
2344     }
2345
2346     printdebug "import main commit\n";
2347
2348     open C, ">../commit.tmp" or die $!;
2349     print C <<END or die $!;
2350 tree $tree
2351 END
2352     print C <<END or die $! foreach @tartrees;
2353 parent $_->{Commit}
2354 END
2355     print C <<END or die $!;
2356 author $authline
2357 committer $authline
2358
2359 $changes
2360
2361 [dgit import $treeimporthow $package $cversion]
2362 END
2363
2364     close C or die $!;
2365     my $rawimport_hash = make_commit qw(../commit.tmp);
2366
2367     if (madformat $dsc->{format}) {
2368         printdebug "import apply patches...\n";
2369
2370         # regularise the state of the working tree so that
2371         # the checkout of $rawimport_hash works nicely.
2372         my $dappliedcommit = make_commit_text(<<END);
2373 tree $dappliedtree
2374 author $authline
2375 committer $authline
2376
2377 [dgit dummy commit]
2378 END
2379         runcmd @git, qw(checkout -q -b dapplied), $dappliedcommit;
2380
2381         runcmd @git, qw(checkout -q -b unpa), $rawimport_hash;
2382
2383         # We need the answers to be reproducible
2384         my @authline = clogp_authline($clogp);
2385         local $ENV{GIT_COMMITTER_NAME} =  $authline[0];
2386         local $ENV{GIT_COMMITTER_EMAIL} = $authline[1];
2387         local $ENV{GIT_COMMITTER_DATE} =  $authline[2];
2388         local $ENV{GIT_AUTHOR_NAME} =  $authline[0];
2389         local $ENV{GIT_AUTHOR_EMAIL} = $authline[1];
2390         local $ENV{GIT_AUTHOR_DATE} =  $authline[2];
2391
2392         my $path = $ENV{PATH} or die;
2393
2394         foreach my $use_absurd (qw(0 1)) {
2395             runcmd @git, qw(checkout -q unpa);
2396             runcmd @git, qw(update-ref -d refs/heads/patch-queue/unpa);
2397             local $ENV{PATH} = $path;
2398             if ($use_absurd) {
2399                 chomp $@;
2400                 progress "warning: $@";
2401                 $path = "$absurdity:$path";
2402                 progress "$us: trying slow absurd-git-apply...";
2403                 rename "../../gbp-pq-output","../../gbp-pq-output.0"
2404                     or $!==ENOENT
2405                     or die $!;
2406             }
2407             eval {
2408                 die "forbid absurd git-apply\n" if $use_absurd
2409                     && forceing [qw(import-gitapply-no-absurd)];
2410                 die "only absurd git-apply!\n" if !$use_absurd
2411                     && forceing [qw(import-gitapply-absurd)];
2412
2413                 local $ENV{DGIT_ABSURD_DEBUG} = $debuglevel if $use_absurd;
2414                 local $ENV{PATH} = $path                    if $use_absurd;
2415
2416                 my @showcmd = (gbp_pq, qw(import));
2417                 my @realcmd = shell_cmd
2418                     'exec >/dev/null 2>>../../gbp-pq-output', @showcmd;
2419                 debugcmd "+",@realcmd;
2420                 if (system @realcmd) {
2421                     die +(shellquote @showcmd).
2422                         " failed: ".
2423                         failedcmd_waitstatus()."\n";
2424                 }
2425
2426                 my $gapplied = git_rev_parse('HEAD');
2427                 my $gappliedtree = cmdoutput @git, qw(rev-parse HEAD:);
2428                 $gappliedtree eq $dappliedtree or
2429                     fail <<END;
2430 gbp-pq import and dpkg-source disagree!
2431  gbp-pq import gave commit $gapplied
2432  gbp-pq import gave tree $gappliedtree
2433  dpkg-source --before-build gave tree $dappliedtree
2434 END
2435                 $rawimport_hash = $gapplied;
2436             };
2437             last unless $@;
2438         }
2439         if ($@) {
2440             { local $@; eval { runcmd qw(cat ../../gbp-pq-output); }; }
2441             die $@;
2442         }
2443     }
2444
2445     progress "synthesised git commit from .dsc $cversion";
2446
2447     my $rawimport_mergeinput = {
2448         Commit => $rawimport_hash,
2449         Info => "Import of source package",
2450     };
2451     my @output = ($rawimport_mergeinput);
2452
2453     if ($lastpush_mergeinput) {
2454         my $oldclogp = mergeinfo_getclogp($lastpush_mergeinput);
2455         my $oversion = getfield $oldclogp, 'Version';
2456         my $vcmp =
2457             version_compare($oversion, $cversion);
2458         if ($vcmp < 0) {
2459             @output = ($rawimport_mergeinput, $lastpush_mergeinput,
2460                 { Message => <<END, ReverseParents => 1 });
2461 Record $package ($cversion) in archive suite $csuite
2462 END
2463         } elsif ($vcmp > 0) {
2464             print STDERR <<END or die $!;
2465
2466 Version actually in archive:   $cversion (older)
2467 Last version pushed with dgit: $oversion (newer or same)
2468 $later_warning_msg
2469 END
2470             @output = $lastpush_mergeinput;
2471         } else {
2472             # Same version.  Use what's in the server git branch,
2473             # discarding our own import.  (This could happen if the
2474             # server automatically imports all packages into git.)
2475             @output = $lastpush_mergeinput;
2476         }
2477     }
2478     changedir '../../../..';
2479     rmtree($ud);
2480     return @output;
2481 }
2482
2483 sub complete_file_from_dsc ($$;$) {
2484     our ($dstdir, $fi, $refetched) = @_;
2485     # Ensures that we have, in $dstdir, the file $fi, with the correct
2486     # contents.  (Downloading it from alongside $dscurl if necessary.)
2487     # If $refetched is defined, can overwrite "$dstdir/$fi->{Filename}"
2488     # and will set $$refetched=1 if it did so (or tried to).
2489
2490     my $f = $fi->{Filename};
2491     my $tf = "$dstdir/$f";
2492     my $downloaded = 0;
2493
2494     my $got;
2495     my $checkhash = sub {
2496         open F, "<", "$tf" or die "$tf: $!";
2497         $fi->{Digester}->reset();
2498         $fi->{Digester}->addfile(*F);
2499         F->error and die $!;
2500         my $got = $fi->{Digester}->hexdigest();
2501         return $got eq $fi->{Hash};
2502     };
2503
2504     if (stat_exists $tf) {
2505         if ($checkhash->()) {
2506             progress "using existing $f";
2507             return 1;
2508         }
2509         if (!$refetched) {
2510             fail "file $f has hash $got but .dsc".
2511                 " demands hash $fi->{Hash} ".
2512                 "(perhaps you should delete this file?)";
2513         }
2514         progress "need to fetch correct version of $f";
2515         unlink $tf or die "$tf $!";
2516         $$refetched = 1;
2517     } else {
2518         printdebug "$tf does not exist, need to fetch\n";
2519     }
2520
2521     my $furl = $dscurl;
2522     $furl =~ s{/[^/]+$}{};
2523     $furl .= "/$f";
2524     die "$f ?" unless $f =~ m/^\Q${package}\E_/;
2525     die "$f ?" if $f =~ m#/#;
2526     runcmd_ordryrun_local @curl,qw(-f -o),$tf,'--',"$furl";
2527     return 0 if !act_local();
2528
2529     $checkhash->() or
2530         fail "file $f has hash $got but .dsc".
2531             " demands hash $fi->{Hash} ".
2532             "(got wrong file from archive!)";
2533
2534     return 1;
2535 }
2536
2537 sub ensure_we_have_orig () {
2538     my @dfi = dsc_files_info();
2539     foreach my $fi (@dfi) {
2540         my $f = $fi->{Filename};
2541         next unless is_orig_file_in_dsc($f, \@dfi);
2542         complete_file_from_dsc('..', $fi)
2543             or next;
2544     }
2545 }
2546
2547 #---------- git fetch ----------
2548
2549 sub lrfetchrefs () { return "refs/dgit-fetch/".access_basedistro(); }
2550 sub lrfetchref () { return lrfetchrefs.'/'.server_branch($csuite); }
2551
2552 # We fetch some parts of lrfetchrefs/*.  Ideally we delete these
2553 # locally fetched refs because they have unhelpful names and clutter
2554 # up gitk etc.  So we track whether we have "used up" head ref (ie,
2555 # whether we have made another local ref which refers to this object).
2556 #
2557 # (If we deleted them unconditionally, then we might end up
2558 # re-fetching the same git objects each time dgit fetch was run.)
2559 #
2560 # So, leach use of lrfetchrefs needs to be accompanied by arrangements
2561 # in git_fetch_us to fetch the refs in question, and possibly a call
2562 # to lrfetchref_used.
2563
2564 our (%lrfetchrefs_f, %lrfetchrefs_d);
2565 # $lrfetchrefs_X{lrfetchrefs."/heads/whatever"} = $objid
2566
2567 sub lrfetchref_used ($) {
2568     my ($fullrefname) = @_;
2569     my $objid = $lrfetchrefs_f{$fullrefname};
2570     $lrfetchrefs_d{$fullrefname} = $objid if defined $objid;
2571 }
2572
2573 sub git_lrfetch_sane {
2574     my ($supplementary, @specs) = @_;
2575     # Make a 'refs/'.lrfetchrefs.'/*' be just like on server,
2576     # at least as regards @specs.  Also leave the results in
2577     # %lrfetchrefs_f, and arrange for lrfetchref_used to be
2578     # able to clean these up.
2579     #
2580     # With $supplementary==1, @specs must not contain wildcards
2581     # and we add to our previous fetches (non-atomically).
2582
2583     # This is rather miserable:
2584     # When git fetch --prune is passed a fetchspec ending with a *,
2585     # it does a plausible thing.  If there is no * then:
2586     # - it matches subpaths too, even if the supplied refspec
2587     #   starts refs, and behaves completely madly if the source
2588     #   has refs/refs/something.  (See, for example, Debian #NNNN.)
2589     # - if there is no matching remote ref, it bombs out the whole
2590     #   fetch.
2591     # We want to fetch a fixed ref, and we don't know in advance
2592     # if it exists, so this is not suitable.
2593     #
2594     # Our workaround is to use git ls-remote.  git ls-remote has its
2595     # own qairks.  Notably, it has the absurd multi-tail-matching
2596     # behaviour: git ls-remote R refs/foo can report refs/foo AND
2597     # refs/refs/foo etc.
2598     #
2599     # Also, we want an idempotent snapshot, but we have to make two
2600     # calls to the remote: one to git ls-remote and to git fetch.  The
2601     # solution is use git ls-remote to obtain a target state, and
2602     # git fetch to try to generate it.  If we don't manage to generate
2603     # the target state, we try again.
2604
2605     my $url = access_giturl();
2606
2607     printdebug "git_lrfetch_sane suppl=$supplementary specs @specs\n";
2608
2609     my $specre = join '|', map {
2610         my $x = $_;
2611         $x =~ s/\W/\\$&/g;
2612         my $wildcard = $x =~ s/\\\*$/.*/;
2613         die if $wildcard && $supplementary;
2614         "(?:refs/$x)";
2615     } @specs;
2616     printdebug "git_lrfetch_sane specre=$specre\n";
2617     my $wanted_rref = sub {
2618         local ($_) = @_;
2619         return m/^(?:$specre)$/;
2620     };
2621
2622     my $fetch_iteration = 0;
2623     FETCH_ITERATION:
2624     for (;;) {
2625         printdebug "git_lrfetch_sane iteration $fetch_iteration\n";
2626         if (++$fetch_iteration > 10) {
2627             fail "too many iterations trying to get sane fetch!";
2628         }
2629
2630         my @look = map { "refs/$_" } @specs;
2631         my @lcmd = (@git, qw(ls-remote -q --refs), $url, @look);
2632         debugcmd "|",@lcmd;
2633
2634         my %wantr;
2635         open GITLS, "-|", @lcmd or die $!;
2636         while (<GITLS>) {
2637             printdebug "=> ", $_;
2638             m/^(\w+)\s+(\S+)\n/ or die "ls-remote $_ ?";
2639             my ($objid,$rrefname) = ($1,$2);
2640             if (!$wanted_rref->($rrefname)) {
2641                 print STDERR <<END;
2642 warning: git ls-remote @look reported $rrefname; this is silly, ignoring it.
2643 END
2644                 next;
2645             }
2646             $wantr{$rrefname} = $objid;
2647         }
2648         $!=0; $?=0;
2649         close GITLS or failedcmd @lcmd;
2650
2651         # OK, now %want is exactly what we want for refs in @specs
2652         my @fspecs = map {
2653             !m/\*$/ && !exists $wantr{"refs/$_"} ? () :
2654             "+refs/$_:".lrfetchrefs."/$_";
2655         } @specs;
2656
2657         printdebug "git_lrfetch_sane fspecs @fspecs\n";
2658
2659         my @fcmd = (@git, qw(fetch -p -n -q), $url, @fspecs);
2660         runcmd_ordryrun_local @fcmd if @fspecs;
2661
2662         if (!$supplementary) {
2663             %lrfetchrefs_f = ();
2664         }
2665         my %objgot;
2666
2667         git_for_each_ref(lrfetchrefs, sub {
2668             my ($objid,$objtype,$lrefname,$reftail) = @_;
2669             $lrfetchrefs_f{$lrefname} = $objid;
2670             $objgot{$objid} = 1;
2671         });
2672
2673         if ($supplementary) {
2674             last;
2675         }
2676
2677         foreach my $lrefname (sort keys %lrfetchrefs_f) {
2678             my $rrefname = 'refs'.substr($lrefname, length lrfetchrefs);
2679             if (!exists $wantr{$rrefname}) {
2680                 if ($wanted_rref->($rrefname)) {
2681                     printdebug <<END;
2682 git-fetch @fspecs created $lrefname which git ls-remote @look didn't list.
2683 END
2684                 } else {
2685                     print STDERR <<END
2686 warning: git fetch @fspecs created $lrefname; this is silly, deleting it.
2687 END
2688                 }
2689                 runcmd_ordryrun_local @git, qw(update-ref -d), $lrefname;
2690                 delete $lrfetchrefs_f{$lrefname};
2691                 next;
2692             }
2693         }
2694         foreach my $rrefname (sort keys %wantr) {
2695             my $lrefname = lrfetchrefs.substr($rrefname, 4);
2696             my $got = $lrfetchrefs_f{$lrefname} // '<none>';
2697             my $want = $wantr{$rrefname};
2698             next if $got eq $want;
2699             if (!defined $objgot{$want}) {
2700                 print STDERR <<END;
2701 warning: git ls-remote suggests we want $lrefname
2702 warning:  and it should refer to $want
2703 warning:  but git fetch didn't fetch that object to any relevant ref.
2704 warning:  This may be due to a race with someone updating the server.
2705 warning:  Will try again...
2706 END
2707                 next FETCH_ITERATION;
2708             }
2709             printdebug <<END;
2710 git-fetch @fspecs made $lrefname=$got but want git ls-remote @look says $want
2711 END
2712             runcmd_ordryrun_local @git, qw(update-ref -m),
2713                 "dgit fetch git fetch fixup", $lrefname, $want;
2714             $lrfetchrefs_f{$lrefname} = $want;
2715         }
2716         last;
2717     }
2718
2719     if (defined $csuite) {
2720         printdebug "git_lrfetch_sane: tidying any old suite lrfetchrefs\n";
2721         git_for_each_ref("refs/dgit-fetch/$csuite", sub {
2722             my ($objid,$objtype,$lrefname,$reftail) = @_;
2723             next if $lrfetchrefs_f{$lrefname}; # $csuite eq $distro ?
2724             runcmd_ordryrun_local @git, qw(update-ref -d), $lrefname;
2725         });
2726     }
2727
2728     printdebug "git_lrfetch_sane: git fetch --no-insane emulation complete\n",
2729         Dumper(\%lrfetchrefs_f);
2730 }
2731
2732 sub git_fetch_us () {
2733     # Want to fetch only what we are going to use, unless
2734     # deliberately-not-ff, in which case we must fetch everything.
2735
2736     my @specs = deliberately_not_fast_forward ? qw(tags/*) :
2737         map { "tags/$_" }
2738         (quiltmode_splitbrain
2739          ? (map { $_->('*',access_nomdistro) }
2740             \&debiantag_new, \&debiantag_maintview)
2741          : debiantags('*',access_nomdistro));
2742     push @specs, server_branch($csuite);
2743     push @specs, $rewritemap;
2744     push @specs, qw(heads/*) if deliberately_not_fast_forward;
2745
2746     git_lrfetch_sane 0, @specs;
2747
2748     my %here;
2749     my @tagpats = debiantags('*',access_nomdistro);
2750
2751     git_for_each_ref([map { "refs/tags/$_" } @tagpats], sub {
2752         my ($objid,$objtype,$fullrefname,$reftail) = @_;
2753         printdebug "currently $fullrefname=$objid\n";
2754         $here{$fullrefname} = $objid;
2755     });
2756     git_for_each_ref([map { lrfetchrefs."/tags/".$_ } @tagpats], sub {
2757         my ($objid,$objtype,$fullrefname,$reftail) = @_;
2758         my $lref = "refs".substr($fullrefname, length(lrfetchrefs));
2759         printdebug "offered $lref=$objid\n";
2760         if (!defined $here{$lref}) {
2761             my @upd = (@git, qw(update-ref), $lref, $objid, '');
2762             runcmd_ordryrun_local @upd;
2763             lrfetchref_used $fullrefname;
2764         } elsif ($here{$lref} eq $objid) {
2765             lrfetchref_used $fullrefname;
2766         } else {
2767             print STDERR \
2768                 "Not updateting $lref from $here{$lref} to $objid.\n";
2769         }
2770     });
2771 }
2772
2773 #---------- dsc and archive handling ----------
2774
2775 sub mergeinfo_getclogp ($) {
2776     # Ensures thit $mi->{Clogp} exists and returns it
2777     my ($mi) = @_;
2778     $mi->{Clogp} = commit_getclogp($mi->{Commit});
2779 }
2780
2781 sub mergeinfo_version ($) {
2782     return getfield( (mergeinfo_getclogp $_[0]), 'Version' );
2783 }
2784
2785 sub fetch_from_archive_record_1 ($) {
2786     my ($hash) = @_;
2787     runcmd @git, qw(update-ref -m), "dgit fetch $csuite",
2788             'DGIT_ARCHIVE', $hash;
2789     cmdoutput @git, qw(log -n2), $hash;
2790     # ... gives git a chance to complain if our commit is malformed
2791 }
2792
2793 sub fetch_from_archive_record_2 ($) {
2794     my ($hash) = @_;
2795     my @upd_cmd = (@git, qw(update-ref -m), 'dgit fetch', lrref(), $hash);
2796     if (act_local()) {
2797         cmdoutput @upd_cmd;
2798     } else {
2799         dryrun_report @upd_cmd;
2800     }
2801 }
2802
2803 sub parse_dsc_field ($$) {
2804     my ($dsc, $what) = @_;
2805     my $f;
2806     foreach my $field (@ourdscfield) {
2807         $f = $dsc->{$field};
2808         last if defined $f;
2809     }
2810     if (!defined $f) {
2811         progress "$what: NO git hash";
2812     } elsif (($dsc_hash, $dsc_distro, $dsc_hint_tag, $dsc_hint_url)
2813              = $f =~ m/^(\w+)\s+($distro_re)\s+($versiontag_re)\s+(\S+)(?:\s|$)/) {
2814         progress "$what: specified git info ($dsc_distro)";
2815         $dsc_hint_tag = [ $dsc_hint_tag ];
2816     } elsif ($f =~ m/^\w+\s*$/) {
2817         $dsc_hash = $&;
2818         $dsc_distro //= cfg qw(dgit.default.old-dsc-distro
2819                                dgit.default.distro);
2820         $dsc_hint_tag = [ debiantags +(getfield $dsc, 'Version'),
2821                           $dsc_distro ];
2822         progress "$what: specified git hash";
2823     } else {
2824         fail "$what: invalid Dgit info";
2825     }
2826 }
2827
2828 sub resolve_dsc_field_commit ($$) {
2829     my ($already_distro, $already_mapref) = @_;
2830
2831     return unless defined $dsc_hash;
2832
2833     my $mapref =
2834         defined $already_mapref &&
2835         ($already_distro eq $dsc_distro || !$chase_dsc_distro)
2836         ? $already_mapref : undef;
2837
2838     my $do_fetch;
2839     $do_fetch = sub {
2840         my ($what, @fetch) = @_;
2841
2842         local $idistro = $dsc_distro;
2843         my $lrf = lrfetchrefs;
2844
2845         if (!$chase_dsc_distro) {
2846             progress
2847                 "not chasing .dsc distro $dsc_distro: not fetching $what";
2848             return 0;
2849         }
2850
2851         progress
2852             ".dsc names distro $dsc_distro: fetching $what";
2853
2854         my $url = access_giturl();
2855         if (!defined $url) {
2856             defined $dsc_hint_url or fail <<END;
2857 .dsc Dgit metadata is in context of distro $dsc_distro
2858 for which we have no configured url and .dsc provides no hint
2859 END
2860             my $proto =
2861                 $dsc_hint_url =~ m#^([-+0-9a-zA-Z]+):# ? $1 :
2862                 $dsc_hint_url =~ m#^/# ? 'file' : 'bad-syntax';
2863             parse_cfg_bool "dsc-url-proto-ok", 'false',
2864                 cfg("dgit.dsc-url-proto-ok.$proto",
2865                     "dgit.default.dsc-url-proto-ok")
2866                 or fail <<END;
2867 .dsc Dgit metadata is in context of distro $dsc_distro
2868 for which we have no configured url;
2869 .dsc provices hinted url with protocol $proto which is unsafe.
2870 (can be overridden by config - consult documentation)
2871 END
2872             $url = $dsc_hint_url;
2873         }
2874
2875         git_lrfetch_sane 1, @fetch;
2876
2877         return $lrf;
2878     };
2879
2880     my $rewrite_enable = do {
2881         local $idistro = $dsc_distro;
2882         access_cfg('rewrite-map-enable', 'RETURN-UNDEF');
2883     };
2884
2885     if (parse_cfg_bool 'rewrite-map-enable', 'true', $rewrite_enable) {
2886         if (!defined $mapref) {
2887             my $lrf = $do_fetch->("rewrite map", $rewritemap) or return;
2888             $mapref = $lrf.'/'.$rewritemap;
2889         }
2890         my $rewritemapdata = git_cat_file $mapref.':map';
2891         if (defined $rewritemapdata
2892             && $rewritemapdata =~ m/^$dsc_hash(?:[ \t](\w+))/m) {
2893             progress
2894                 "server's git history rewrite map contains a relevant entry!";
2895
2896             $dsc_hash = $1;
2897             if (defined $dsc_hash) {
2898                 progress "using rewritten git hash in place of .dsc value";
2899             } else {
2900                 progress "server data says .dsc hash is to be disregarded";
2901             }
2902         }
2903     }
2904
2905     if (!defined git_cat_file $dsc_hash) {
2906         my @tags = map { "tags/".$_ } @$dsc_hint_tag;
2907         my $lrf = $do_fetch->("additional commits", @tags) &&
2908             defined git_cat_file $dsc_hash
2909             or fail <<END;
2910 .dsc Dgit metadata requires commit $dsc_hash
2911 but we could not obtain that object anywhere.
2912 END
2913         foreach my $t (@tags) {
2914             my $fullrefname = $lrf.'/'.$t;
2915             print STDERR "CHK $t $fullrefname ".Dumper(\%lrfetchrefs_f);
2916             next unless $lrfetchrefs_f{$fullrefname};
2917             next unless is_fast_fwd "$fullrefname~0", $dsc_hash;
2918             lrfetchref_used $fullrefname;
2919         }
2920     }
2921 }
2922
2923 sub fetch_from_archive () {
2924     ensure_setup_existing_tree();
2925
2926     # Ensures that lrref() is what is actually in the archive, one way
2927     # or another, according to us - ie this client's
2928     # appropritaely-updated archive view.  Also returns the commit id.
2929     # If there is nothing in the archive, leaves lrref alone and
2930     # returns undef.  git_fetch_us must have already been called.
2931     get_archive_dsc();
2932
2933     if ($dsc) {
2934         parse_dsc_field($dsc, 'last upload to archive');
2935         resolve_dsc_field_commit access_basedistro,
2936             lrfetchrefs."/".$rewritemap
2937     } else {
2938         progress "no version available from the archive";
2939     }
2940
2941     # If the archive's .dsc has a Dgit field, there are three
2942     # relevant git commitids we need to choose between and/or merge
2943     # together:
2944     #   1. $dsc_hash: the Dgit field from the archive
2945     #   2. $lastpush_hash: the suite branch on the dgit git server
2946     #   3. $lastfetch_hash: our local tracking brach for the suite
2947     #
2948     # These may all be distinct and need not be in any fast forward
2949     # relationship:
2950     #
2951     # If the dsc was pushed to this suite, then the server suite
2952     # branch will have been updated; but it might have been pushed to
2953     # a different suite and copied by the archive.  Conversely a more
2954     # recent version may have been pushed with dgit but not appeared
2955     # in the archive (yet).
2956     #
2957     # $lastfetch_hash may be awkward because archive imports
2958     # (particularly, imports of Dgit-less .dscs) are performed only as
2959     # needed on individual clients, so different clients may perform a
2960     # different subset of them - and these imports are only made
2961     # public during push.  So $lastfetch_hash may represent a set of
2962     # imports different to a subsequent upload by a different dgit
2963     # client.
2964     #
2965     # Our approach is as follows:
2966     #
2967     # As between $dsc_hash and $lastpush_hash: if $lastpush_hash is a
2968     # descendant of $dsc_hash, then it was pushed by a dgit user who
2969     # had based their work on $dsc_hash, so we should prefer it.
2970     # Otherwise, $dsc_hash was installed into this suite in the
2971     # archive other than by a dgit push, and (necessarily) after the
2972     # last dgit push into that suite (since a dgit push would have
2973     # been descended from the dgit server git branch); thus, in that
2974     # case, we prefer the archive's version (and produce a
2975     # pseudo-merge to overwrite the dgit server git branch).
2976     #
2977     # (If there is no Dgit field in the archive's .dsc then
2978     # generate_commit_from_dsc uses the version numbers to decide
2979     # whether the suite branch or the archive is newer.  If the suite
2980     # branch is newer it ignores the archive's .dsc; otherwise it
2981     # generates an import of the .dsc, and produces a pseudo-merge to
2982     # overwrite the suite branch with the archive contents.)
2983     #
2984     # The outcome of that part of the algorithm is the `public view',
2985     # and is same for all dgit clients: it does not depend on any
2986     # unpublished history in the local tracking branch.
2987     #
2988     # As between the public view and the local tracking branch: The
2989     # local tracking branch is only updated by dgit fetch, and
2990     # whenever dgit fetch runs it includes the public view in the
2991     # local tracking branch.  Therefore if the public view is not
2992     # descended from the local tracking branch, the local tracking
2993     # branch must contain history which was imported from the archive
2994     # but never pushed; and, its tip is now out of date.  So, we make
2995     # a pseudo-merge to overwrite the old imports and stitch the old
2996     # history in.
2997     #
2998     # Finally: we do not necessarily reify the public view (as
2999     # described above).  This is so that we do not end up stacking two
3000     # pseudo-merges.  So what we actually do is figure out the inputs
3001     # to any public view pseudo-merge and put them in @mergeinputs.
3002
3003     my @mergeinputs;
3004     # $mergeinputs[]{Commit}
3005     # $mergeinputs[]{Info}
3006     # $mergeinputs[0] is the one whose tree we use
3007     # @mergeinputs is in the order we use in the actual commit)
3008     #
3009     # Also:
3010     # $mergeinputs[]{Message} is a commit message to use
3011     # $mergeinputs[]{ReverseParents} if def specifies that parent
3012     #                                list should be in opposite order
3013     # Such an entry has no Commit or Info.  It applies only when found
3014     # in the last entry.  (This ugliness is to support making
3015     # identical imports to previous dgit versions.)
3016
3017     my $lastpush_hash = git_get_ref(lrfetchref());
3018     printdebug "previous reference hash=$lastpush_hash\n";
3019     $lastpush_mergeinput = $lastpush_hash && {
3020         Commit => $lastpush_hash,
3021         Info => "dgit suite branch on dgit git server",
3022     };
3023
3024     my $lastfetch_hash = git_get_ref(lrref());
3025     printdebug "fetch_from_archive: lastfetch=$lastfetch_hash\n";
3026     my $lastfetch_mergeinput = $lastfetch_hash && {
3027         Commit => $lastfetch_hash,
3028         Info => "dgit client's archive history view",
3029     };
3030
3031     my $dsc_mergeinput = $dsc_hash && {
3032         Commit => $dsc_hash,
3033         Info => "Dgit field in .dsc from archive",
3034     };
3035
3036     my $cwd = getcwd();
3037     my $del_lrfetchrefs = sub {
3038         changedir $cwd;
3039         my $gur;
3040         printdebug "del_lrfetchrefs...\n";
3041         foreach my $fullrefname (sort keys %lrfetchrefs_d) {
3042             my $objid = $lrfetchrefs_d{$fullrefname};
3043             printdebug "del_lrfetchrefs: $objid $fullrefname\n";
3044             if (!$gur) {
3045                 $gur ||= new IO::Handle;
3046                 open $gur, "|-", qw(git update-ref --stdin) or die $!;
3047             }
3048             printf $gur "delete %s %s\n", $fullrefname, $objid;
3049         }
3050         if ($gur) {
3051             close $gur or failedcmd "git update-ref delete lrfetchrefs";
3052         }
3053     };
3054
3055     if (defined $dsc_hash) {
3056         ensure_we_have_orig();
3057         if (!$lastpush_hash || $dsc_hash eq $lastpush_hash) {
3058             @mergeinputs = $dsc_mergeinput
3059         } elsif (is_fast_fwd($dsc_hash,$lastpush_hash)) {
3060             print STDERR <<END or die $!;
3061
3062 Git commit in archive is behind the last version allegedly pushed/uploaded.
3063 Commit referred to by archive: $dsc_hash
3064 Last version pushed with dgit: $lastpush_hash
3065 $later_warning_msg
3066 END
3067             @mergeinputs = ($lastpush_mergeinput);
3068         } else {
3069             # Archive has .dsc which is not a descendant of the last dgit
3070             # push.  This can happen if the archive moves .dscs about.
3071             # Just follow its lead.
3072             if (is_fast_fwd($lastpush_hash,$dsc_hash)) {
3073                 progress "archive .dsc names newer git commit";
3074                 @mergeinputs = ($dsc_mergeinput);
3075             } else {
3076                 progress "archive .dsc names other git commit, fixing up";
3077                 @mergeinputs = ($dsc_mergeinput, $lastpush_mergeinput);
3078             }
3079         }
3080     } elsif ($dsc) {
3081         @mergeinputs = generate_commits_from_dsc();
3082         # We have just done an import.  Now, our import algorithm might
3083         # have been improved.  But even so we do not want to generate
3084         # a new different import of the same package.  So if the
3085         # version numbers are the same, just use our existing version.
3086         # If the version numbers are different, the archive has changed
3087         # (perhaps, rewound).
3088         if ($lastfetch_mergeinput &&
3089             !version_compare( (mergeinfo_version $lastfetch_mergeinput),
3090                               (mergeinfo_version $mergeinputs[0]) )) {
3091             @mergeinputs = ($lastfetch_mergeinput);
3092         }
3093     } elsif ($lastpush_hash) {
3094         # only in git, not in the archive yet
3095         @mergeinputs = ($lastpush_mergeinput);
3096         print STDERR <<END or die $!;
3097
3098 Package not found in the archive, but has allegedly been pushed using dgit.
3099 $later_warning_msg
3100 END
3101     } else {
3102         printdebug "nothing found!\n";
3103         if (defined $skew_warning_vsn) {
3104             print STDERR <<END or die $!;
3105
3106 Warning: relevant archive skew detected.
3107 Archive allegedly contains $skew_warning_vsn
3108 But we were not able to obtain any version from the archive or git.
3109
3110 END
3111         }
3112         unshift @end, $del_lrfetchrefs;
3113         return undef;
3114     }
3115
3116     if ($lastfetch_hash &&
3117         !grep {
3118             my $h = $_->{Commit};
3119             $h and is_fast_fwd($lastfetch_hash, $h);
3120             # If true, one of the existing parents of this commit
3121             # is a descendant of the $lastfetch_hash, so we'll
3122             # be ff from that automatically.
3123         } @mergeinputs
3124         ) {
3125         # Otherwise:
3126         push @mergeinputs, $lastfetch_mergeinput;
3127     }
3128
3129     printdebug "fetch mergeinfos:\n";
3130     foreach my $mi (@mergeinputs) {
3131         if ($mi->{Info}) {
3132             printdebug " commit $mi->{Commit} $mi->{Info}\n";
3133         } else {
3134             printdebug sprintf " ReverseParents=%d Message=%s",
3135                 $mi->{ReverseParents}, $mi->{Message};
3136         }
3137     }
3138
3139     my $compat_info= pop @mergeinputs
3140         if $mergeinputs[$#mergeinputs]{Message};
3141
3142     @mergeinputs = grep { defined $_->{Commit} } @mergeinputs;
3143
3144     my $hash;
3145     if (@mergeinputs > 1) {
3146         # here we go, then:
3147         my $tree_commit = $mergeinputs[0]{Commit};
3148
3149         my $tree = cmdoutput @git, qw(cat-file commit), $tree_commit;
3150         $tree =~ m/\n\n/;  $tree = $`;
3151         $tree =~ m/^tree (\w+)$/m or die "$dsc_hash tree ?";
3152         $tree = $1;
3153
3154         # We use the changelog author of the package in question the
3155         # author of this pseudo-merge.  This is (roughly) correct if
3156         # this commit is simply representing aa non-dgit upload.
3157         # (Roughly because it does not record sponsorship - but we
3158         # don't have sponsorship info because that's in the .changes,
3159         # which isn't in the archivw.)
3160         #
3161         # But, it might be that we are representing archive history
3162         # updates (including in-archive copies).  These are not really
3163         # the responsibility of the person who created the .dsc, but
3164         # there is no-one whose name we should better use.  (The
3165         # author of the .dsc-named commit is clearly worse.)
3166
3167         my $useclogp = mergeinfo_getclogp $mergeinputs[0];
3168         my $author = clogp_authline $useclogp;
3169         my $cversion = getfield $useclogp, 'Version';
3170
3171         my $mcf = ".git/dgit/mergecommit";
3172         open MC, ">", $mcf or die "$mcf $!";
3173         print MC <<END or die $!;
3174 tree $tree
3175 END
3176
3177         my @parents = grep { $_->{Commit} } @mergeinputs;
3178         @parents = reverse @parents if $compat_info->{ReverseParents};
3179         print MC <<END or die $! foreach @parents;
3180 parent $_->{Commit}
3181 END
3182
3183         print MC <<END or die $!;
3184 author $author
3185 committer $author
3186
3187 END
3188
3189         if (defined $compat_info->{Message}) {
3190             print MC $compat_info->{Message} or die $!;
3191         } else {
3192             print MC <<END or die $!;
3193 Record $package ($cversion) in archive suite $csuite
3194
3195 Record that
3196 END
3197             my $message_add_info = sub {
3198                 my ($mi) = (@_);
3199                 my $mversion = mergeinfo_version $mi;
3200                 printf MC "  %-20s %s\n", $mversion, $mi->{Info}
3201                     or die $!;
3202             };
3203
3204             $message_add_info->($mergeinputs[0]);
3205             print MC <<END or die $!;
3206 should be treated as descended from
3207 END
3208             $message_add_info->($_) foreach @mergeinputs[1..$#mergeinputs];
3209         }
3210
3211         close MC or die $!;
3212         $hash = make_commit $mcf;
3213     } else {
3214         $hash = $mergeinputs[0]{Commit};
3215     }
3216     printdebug "fetch hash=$hash\n";
3217
3218     my $chkff = sub {
3219         my ($lasth, $what) = @_;
3220         return unless $lasth;
3221         die "$lasth $hash $what ?" unless is_fast_fwd($lasth, $hash);
3222     };
3223
3224     $chkff->($lastpush_hash, 'dgit repo server tip (last push)')
3225         if $lastpush_hash;
3226     $chkff->($lastfetch_hash, 'local tracking tip (last fetch)');
3227
3228     fetch_from_archive_record_1($hash);
3229
3230     if (defined $skew_warning_vsn) {
3231         mkpath '.git/dgit';
3232         printdebug "SKEW CHECK WANT $skew_warning_vsn\n";
3233         my $gotclogp = commit_getclogp($hash);
3234         my $got_vsn = getfield $gotclogp, 'Version';
3235         printdebug "SKEW CHECK GOT $got_vsn\n";
3236         if (version_compare($got_vsn, $skew_warning_vsn) < 0) {
3237             print STDERR <<END or die $!;
3238
3239 Warning: archive skew detected.  Using the available version:
3240 Archive allegedly contains    $skew_warning_vsn
3241 We were able to obtain only   $got_vsn
3242
3243 END
3244         }
3245     }
3246
3247     if ($lastfetch_hash ne $hash) {
3248         fetch_from_archive_record_2($hash);
3249     }
3250
3251     lrfetchref_used lrfetchref();
3252
3253     unshift @end, $del_lrfetchrefs;
3254     return $hash;
3255 }
3256
3257 sub set_local_git_config ($$) {
3258     my ($k, $v) = @_;
3259     runcmd @git, qw(config), $k, $v;
3260 }
3261
3262 sub setup_mergechangelogs (;$) {
3263     my ($always) = @_;
3264     return unless $always || access_cfg_bool(1, 'setup-mergechangelogs');
3265
3266     my $driver = 'dpkg-mergechangelogs';
3267     my $cb = "merge.$driver";
3268     my $attrs = '.git/info/attributes';
3269     ensuredir '.git/info';
3270
3271     open NATTRS, ">", "$attrs.new" or die "$attrs.new $!";
3272     if (!open ATTRS, "<", $attrs) {
3273         $!==ENOENT or die "$attrs: $!";
3274     } else {
3275         while (<ATTRS>) {
3276             chomp;
3277             next if m{^debian/changelog\s};
3278             print NATTRS $_, "\n" or die $!;
3279         }
3280         ATTRS->error and die $!;
3281         close ATTRS;
3282     }
3283     print NATTRS "debian/changelog merge=$driver\n" or die $!;
3284     close NATTRS;
3285
3286     set_local_git_config "$cb.name", 'debian/changelog merge driver';
3287     set_local_git_config "$cb.driver", 'dpkg-mergechangelogs -m %O %A %B %A';
3288
3289     rename "$attrs.new", "$attrs" or die "$attrs: $!";
3290 }
3291
3292 sub setup_useremail (;$) {
3293     my ($always) = @_;
3294     return unless $always || access_cfg_bool(1, 'setup-useremail');
3295
3296     my $setup = sub {
3297         my ($k, $envvar) = @_;
3298         my $v = access_cfg("user-$k", 'RETURN-UNDEF') // $ENV{$envvar};
3299         return unless defined $v;
3300         set_local_git_config "user.$k", $v;
3301     };
3302
3303     $setup->('email', 'DEBEMAIL');
3304     $setup->('name', 'DEBFULLNAME');
3305 }
3306
3307 sub ensure_setup_existing_tree () {
3308     my $k = "remote.$remotename.skipdefaultupdate";
3309     my $c = git_get_config $k;
3310     return if defined $c;
3311     set_local_git_config $k, 'true';
3312 }
3313
3314 sub setup_new_tree () {
3315     setup_mergechangelogs();
3316     setup_useremail();
3317 }
3318
3319 sub multisuite_suite_child ($$$) {
3320     my ($tsuite, $merginputs, $fn) = @_;
3321     # in child, sets things up, calls $fn->(), and returns undef
3322     # in parent, returns canonical suite name for $tsuite
3323     my $canonsuitefh = IO::File::new_tmpfile;
3324     my $pid = fork // die $!;
3325     if (!$pid) {
3326         forkcheck_setup();
3327         $isuite = $tsuite;
3328         $us .= " [$isuite]";
3329         $debugprefix .= " ";
3330         progress "fetching $tsuite...";
3331         canonicalise_suite();
3332         print $canonsuitefh $csuite, "\n" or die $!;
3333         close $canonsuitefh or die $!;
3334         $fn->();
3335         return undef;
3336     }
3337     waitpid $pid,0 == $pid or die $!;
3338     fail "failed to obtain $tsuite: ".waitstatusmsg() if $? && $?!=256*4;
3339     seek $canonsuitefh,0,0 or die $!;
3340     local $csuite = <$canonsuitefh>;
3341     die $! unless defined $csuite && chomp $csuite;
3342     if ($? == 256*4) {
3343         printdebug "multisuite $tsuite missing\n";
3344         return $csuite;
3345     }
3346     printdebug "multisuite $tsuite ok (canon=$csuite)\n";
3347     push @$merginputs, {
3348         Ref => lrref,
3349         Info => $csuite,
3350     };
3351     return $csuite;
3352 }
3353
3354 sub fork_for_multisuite ($) {
3355     my ($before_fetch_merge) = @_;
3356     # if nothing unusual, just returns ''
3357     #
3358     # if multisuite:
3359     # returns 0 to caller in child, to do first of the specified suites
3360     # in child, $csuite is not yet set
3361     #
3362     # returns 1 to caller in parent, to finish up anything needed after
3363     # in parent, $csuite is set to canonicalised portmanteau
3364
3365     my $org_isuite = $isuite;
3366     my @suites = split /\,/, $isuite;
3367     return '' unless @suites > 1;
3368     printdebug "fork_for_multisuite: @suites\n";
3369
3370     my @mergeinputs;
3371
3372     my $cbasesuite = multisuite_suite_child($suites[0], \@mergeinputs,
3373                                             sub { });
3374     return 0 unless defined $cbasesuite;
3375
3376     fail "package $package missing in (base suite) $cbasesuite"
3377         unless @mergeinputs;
3378
3379     my @csuites = ($cbasesuite);
3380
3381     $before_fetch_merge->();
3382
3383     foreach my $tsuite (@suites[1..$#suites]) {
3384         my $csubsuite = multisuite_suite_child($tsuite, \@mergeinputs,
3385                                                sub {
3386             @end = ();
3387             fetch();
3388             exit 0;
3389         });
3390         # xxx collecte the ref here
3391
3392         $csubsuite =~ s/^\Q$cbasesuite\E-/-/;
3393         push @csuites, $csubsuite;
3394     }
3395
3396     foreach my $mi (@mergeinputs) {
3397         my $ref = git_get_ref $mi->{Ref};
3398         die "$mi->{Ref} ?" unless length $ref;
3399         $mi->{Commit} = $ref;
3400     }
3401
3402     $csuite = join ",", @csuites;
3403
3404     my $previous = git_get_ref lrref;
3405     if ($previous) {
3406         unshift @mergeinputs, {
3407             Commit => $previous,
3408             Info => "local combined tracking branch",
3409             Warning =>
3410  "archive seems to have rewound: local tracking branch is ahead!",
3411         };
3412     }
3413
3414     foreach my $ix (0..$#mergeinputs) {
3415         $mergeinputs[$ix]{Index} = $ix;
3416     }
3417
3418     @mergeinputs = sort {
3419         -version_compare(mergeinfo_version $a,
3420                          mergeinfo_version $b) # highest version first
3421             or
3422         $a->{Index} <=> $b->{Index}; # earliest in spec first
3423     } @mergeinputs;
3424
3425     my @needed;
3426
3427   NEEDED:
3428     foreach my $mi (@mergeinputs) {
3429         printdebug "multisuite merge check $mi->{Info}\n";
3430         foreach my $previous (@needed) {
3431             next unless is_fast_fwd $mi->{Commit}, $previous->{Commit};
3432             printdebug "multisuite merge un-needed $previous->{Info}\n";
3433             next NEEDED;
3434         }
3435         push @needed, $mi;
3436         printdebug "multisuite merge this-needed\n";
3437         $mi->{Character} = '+';
3438     }
3439
3440     $needed[0]{Character} = '*';
3441
3442     my $output = $needed[0]{Commit};
3443
3444     if (@needed > 1) {
3445         printdebug "multisuite merge nontrivial\n";
3446         my $tree = cmdoutput qw(git rev-parse), $needed[0]{Commit}.':';
3447
3448         my $commit = "tree $tree\n";
3449         my $msg = "Combine archive branches $csuite [dgit]\n\n".
3450             "Input branches:\n";
3451
3452         foreach my $mi (sort { $a->{Index} <=> $b->{Index} } @mergeinputs) {
3453             printdebug "multisuite merge include $mi->{Info}\n";
3454             $mi->{Character} //= ' ';
3455             $commit .= "parent $mi->{Commit}\n";
3456             $msg .= sprintf " %s  %-25s %s\n",
3457                 $mi->{Character},
3458                 (mergeinfo_version $mi),
3459                 $mi->{Info};
3460         }
3461         my $authline = clogp_authline mergeinfo_getclogp $needed[0];
3462         $msg .= "\nKey\n".
3463             " * marks the highest version branch, which choose to use\n".
3464             " + marks each branch which was not already an ancestor\n\n".
3465             "[dgit multi-suite $csuite]\n";
3466         $commit .=
3467             "author $authline\n".
3468             "committer $authline\n\n";
3469         $output = make_commit_text $commit.$msg;
3470         printdebug "multisuite merge generated $output\n";
3471     }
3472
3473     fetch_from_archive_record_1($output);
3474     fetch_from_archive_record_2($output);
3475
3476     progress "calculated combined tracking suite $csuite";
3477
3478     return 1;
3479 }
3480
3481 sub clone_set_head () {
3482     open H, "> .git/HEAD" or die $!;
3483     print H "ref: ".lref()."\n" or die $!;
3484     close H or die $!;
3485 }
3486 sub clone_finish ($) {
3487     my ($dstdir) = @_;
3488     runcmd @git, qw(reset --hard), lrref();
3489     runcmd qw(bash -ec), <<'END';
3490         set -o pipefail
3491         git ls-tree -r --name-only -z HEAD | \
3492         xargs -0r touch -h -r . --
3493 END
3494     printdone "ready for work in $dstdir";
3495 }
3496
3497 sub clone ($) {
3498     my ($dstdir) = @_;
3499     badusage "dry run makes no sense with clone" unless act_local();
3500
3501     my $multi_fetched = fork_for_multisuite(sub {
3502         printdebug "multi clone before fetch merge\n";
3503         changedir $dstdir;
3504     });
3505     if ($multi_fetched) {
3506         printdebug "multi clone after fetch merge\n";
3507         clone_set_head();
3508         clone_finish($dstdir);
3509         exit 0;
3510     }
3511     printdebug "clone main body\n";
3512
3513     canonicalise_suite();
3514     my $hasgit = check_for_git();
3515     mkdir $dstdir or fail "create \`$dstdir': $!";
3516     changedir $dstdir;
3517     runcmd @git, qw(init -q);
3518     clone_set_head();
3519     my $giturl = access_giturl(1);
3520     if (defined $giturl) {
3521         runcmd @git, qw(remote add), 'origin', $giturl;
3522     }
3523     if ($hasgit) {
3524         progress "fetching existing git history";
3525         git_fetch_us();
3526         runcmd_ordryrun_local @git, qw(fetch origin);
3527     } else {
3528         progress "starting new git history";
3529     }
3530     fetch_from_archive() or no_such_package;
3531     my $vcsgiturl = $dsc->{'Vcs-Git'};
3532     if (length $vcsgiturl) {
3533         $vcsgiturl =~ s/\s+-b\s+\S+//g;
3534         runcmd @git, qw(remote add vcs-git), $vcsgiturl;
3535     }
3536     setup_new_tree();
3537     clone_finish($dstdir);
3538 }
3539
3540 sub fetch () {
3541     canonicalise_suite();
3542     if (check_for_git()) {
3543         git_fetch_us();
3544     }
3545     fetch_from_archive() or no_such_package();
3546     printdone "fetched into ".lrref();
3547 }
3548
3549 sub pull () {
3550     my $multi_fetched = fork_for_multisuite(sub { });
3551     fetch() unless $multi_fetched; # parent
3552     return if $multi_fetched eq '0'; # child
3553     runcmd_ordryrun_local @git, qw(merge -m),"Merge from $csuite [dgit]",
3554         lrref();
3555     printdone "fetched to ".lrref()." and merged into HEAD";
3556 }
3557
3558 sub check_not_dirty () {
3559     foreach my $f (qw(local-options local-patch-header)) {
3560         if (stat_exists "debian/source/$f") {
3561             fail "git tree contains debian/source/$f";
3562         }
3563     }
3564
3565     return if $ignoredirty;
3566
3567     my @cmd = (@git, qw(diff --quiet HEAD));
3568     debugcmd "+",@cmd;
3569     $!=0; $?=-1; system @cmd;
3570     return if !$?;
3571     if ($?==256) {
3572         fail "working tree is dirty (does not match HEAD)";
3573     } else {
3574         failedcmd @cmd;
3575     }
3576 }
3577
3578 sub commit_admin ($) {
3579     my ($m) = @_;
3580     progress "$m";
3581     runcmd_ordryrun_local @git, qw(commit -m), $m;
3582 }
3583
3584 sub commit_quilty_patch () {
3585     my $output = cmdoutput @git, qw(status --porcelain);
3586     my %adds;
3587     foreach my $l (split /\n/, $output) {
3588         next unless $l =~ m/\S/;
3589         if ($l =~ m{^(?:\?\?| M) (.pc|debian/patches)}) {
3590             $adds{$1}++;
3591         }
3592     }
3593     delete $adds{'.pc'}; # if there wasn't one before, don't add it
3594     if (!%adds) {
3595         progress "nothing quilty to commit, ok.";
3596         return;
3597     }
3598     my @adds = map { s/[][*?\\]/\\$&/g; $_; } sort keys %adds;
3599     runcmd_ordryrun_local @git, qw(add -f), @adds;
3600     commit_admin <<END
3601 Commit Debian 3.0 (quilt) metadata
3602
3603 [dgit ($our_version) quilt-fixup]
3604 END
3605 }
3606
3607 sub get_source_format () {
3608     my %options;
3609     if (open F, "debian/source/options") {
3610         while (<F>) {
3611             next if m/^\s*\#/;
3612             next unless m/\S/;
3613             s/\s+$//; # ignore missing final newline
3614             if (m/\s*\#\s*/) {
3615                 my ($k, $v) = ($`, $'); #');
3616                 $v =~ s/^"(.*)"$/$1/;
3617                 $options{$k} = $v;
3618             } else {
3619                 $options{$_} = 1;
3620             }
3621         }
3622         F->error and die $!;
3623         close F;
3624     } else {
3625         die $! unless $!==&ENOENT;
3626     }
3627
3628     if (!open F, "debian/source/format") {
3629         die $! unless $!==&ENOENT;
3630         return '';
3631     }
3632     $_ = <F>;
3633     F->error and die $!;
3634     chomp;
3635     return ($_, \%options);
3636 }
3637
3638 sub madformat_wantfixup ($) {
3639     my ($format) = @_;
3640     return 0 unless $format eq '3.0 (quilt)';
3641     our $quilt_mode_warned;
3642     if ($quilt_mode eq 'nocheck') {
3643         progress "Not doing any fixup of \`$format' due to".
3644             " ----no-quilt-fixup or --quilt=nocheck"
3645             unless $quilt_mode_warned++;
3646         return 0;
3647     }
3648     progress "Format \`$format', need to check/update patch stack"
3649         unless $quilt_mode_warned++;
3650     return 1;
3651 }
3652
3653 sub maybe_split_brain_save ($$$) {
3654     my ($headref, $dgitview, $msg) = @_;
3655     # => message fragment "$saved" describing disposition of $dgitview
3656     return "commit id $dgitview" unless defined $split_brain_save;
3657     my @cmd = (shell_cmd "cd ../../../..",
3658                @git, qw(update-ref -m),
3659                "dgit --dgit-view-save $msg HEAD=$headref",
3660                $split_brain_save, $dgitview);
3661     runcmd @cmd;
3662     return "and left in $split_brain_save";
3663 }
3664
3665 # An "infopair" is a tuple [ $thing, $what ]
3666 # (often $thing is a commit hash; $what is a description)
3667
3668 sub infopair_cond_equal ($$) {
3669     my ($x,$y) = @_;
3670     $x->[0] eq $y->[0] or fail <<END;
3671 $x->[1] ($x->[0]) not equal to $y->[1] ($y->[0])
3672 END
3673 };
3674
3675 sub infopair_lrf_tag_lookup ($$) {
3676     my ($tagnames, $what) = @_;
3677     # $tagname may be an array ref
3678     my @tagnames = ref $tagnames ? @$tagnames : ($tagnames);
3679     printdebug "infopair_lrfetchref_tag_lookup $what @tagnames\n";
3680     foreach my $tagname (@tagnames) {
3681         my $lrefname = lrfetchrefs."/tags/$tagname";
3682         my $tagobj = $lrfetchrefs_f{$lrefname};
3683         next unless defined $tagobj;
3684         printdebug "infopair_lrfetchref_tag_lookup $tagobj $tagname $what\n";
3685         return [ git_rev_parse($tagobj), $what ];
3686     }
3687     fail @tagnames==1 ? <<END : <<END;
3688 Wanted tag $what (@tagnames) on dgit server, but not found
3689 END
3690 Wanted tag $what (one of: @tagnames) on dgit server, but not found
3691 END
3692 }
3693
3694 sub infopair_cond_ff ($$) {
3695     my ($anc,$desc) = @_;
3696     is_fast_fwd($anc->[0], $desc->[0]) or fail <<END;
3697 $anc->[1] ($anc->[0]) .. $desc->[1] ($desc->[0]) is not fast forward
3698 END
3699 };
3700
3701 sub pseudomerge_version_check ($$) {
3702     my ($clogp, $archive_hash) = @_;
3703
3704     my $arch_clogp = commit_getclogp $archive_hash;
3705     my $i_arch_v = [ (getfield $arch_clogp, 'Version'),
3706                      'version currently in archive' ];
3707     if (defined $overwrite_version) {
3708         if (length $overwrite_version) {
3709             infopair_cond_equal([ $overwrite_version,
3710                                   '--overwrite= version' ],
3711                                 $i_arch_v);
3712         } else {
3713             my $v = $i_arch_v->[0];
3714             progress "Checking package changelog for archive version $v ...";
3715             eval {
3716                 my @xa = ("-f$v", "-t$v");
3717                 my $vclogp = parsechangelog @xa;
3718                 my $cv = [ (getfield $vclogp, 'Version'),
3719                            "Version field from dpkg-parsechangelog @xa" ];
3720                 infopair_cond_equal($i_arch_v, $cv);
3721             };
3722             if ($@) {
3723                 $@ =~ s/^dgit: //gm;
3724                 fail "$@".
3725                     "Perhaps debian/changelog does not mention $v ?";
3726             }
3727         }
3728     }
3729     
3730     printdebug "pseudomerge_version_check i_arch_v @$i_arch_v\n";
3731     return $i_arch_v;
3732 }
3733
3734 sub pseudomerge_make_commit ($$$$ $$) {
3735     my ($clogp, $dgitview, $archive_hash, $i_arch_v,
3736         $msg_cmd, $msg_msg) = @_;
3737     progress "Declaring that HEAD inciudes all changes in $i_arch_v->[0]...";
3738
3739     my $tree = cmdoutput qw(git rev-parse), "${dgitview}:";
3740     my $authline = clogp_authline $clogp;
3741
3742     chomp $msg_msg;
3743     $msg_cmd .=
3744         !defined $overwrite_version ? ""
3745         : !length  $overwrite_version ? " --overwrite"
3746         : " --overwrite=".$overwrite_version;
3747
3748     mkpath '.git/dgit';
3749     my $pmf = ".git/dgit/pseudomerge";
3750     open MC, ">", $pmf or die "$pmf $!";
3751     print MC <<END or die $!;
3752 tree $tree
3753 parent $dgitview
3754 parent $archive_hash
3755 author $authline
3756 committer $authline
3757
3758 $msg_msg
3759
3760 [$msg_cmd]
3761 END
3762     close MC or die $!;
3763
3764     return make_commit($pmf);
3765 }
3766
3767 sub splitbrain_pseudomerge ($$$$) {
3768     my ($clogp, $maintview, $dgitview, $archive_hash) = @_;
3769     # => $merged_dgitview
3770     printdebug "splitbrain_pseudomerge...\n";
3771     #
3772     #     We:      debian/PREVIOUS    HEAD($maintview)
3773     # expect:          o ----------------- o
3774     #                    \                   \
3775     #                     o                   o
3776     #                 a/d/PREVIOUS        $dgitview
3777     #                $archive_hash              \
3778     #  If so,                \                   \
3779     #  we do:                 `------------------ o
3780     #   this:                                   $dgitview'
3781     #
3782
3783     return $dgitview unless defined $archive_hash;
3784
3785     printdebug "splitbrain_pseudomerge...\n";
3786
3787     my $i_arch_v = pseudomerge_version_check($clogp, $archive_hash);
3788
3789     if (!defined $overwrite_version) {
3790         progress "Checking that HEAD inciudes all changes in archive...";
3791     }
3792
3793     return $dgitview if is_fast_fwd $archive_hash, $dgitview;
3794
3795     if (defined $overwrite_version) {
3796     } elsif (!eval {
3797         my $t_dep14 = debiantag_maintview $i_arch_v->[0], access_nomdistro;
3798         my $i_dep14 = infopair_lrf_tag_lookup($t_dep14, "maintainer view tag");
3799         my $t_dgit = debiantag_new $i_arch_v->[0], access_nomdistro;
3800         my $i_dgit = infopair_lrf_tag_lookup($t_dgit, "dgit view tag");
3801         my $i_archive = [ $archive_hash, "current archive contents" ];
3802
3803         printdebug "splitbrain_pseudomerge i_archive @$i_archive\n";
3804
3805         infopair_cond_equal($i_dgit, $i_archive);
3806         infopair_cond_ff($i_dep14, $i_dgit);
3807         infopair_cond_ff($i_dep14, [ $maintview, 'HEAD' ]);
3808         1;
3809     }) {
3810         print STDERR <<END;
3811 $us: check failed (maybe --overwrite is needed, consult documentation)
3812 END
3813         die "$@";
3814     }
3815
3816     my $r = pseudomerge_make_commit
3817         $clogp, $dgitview, $archive_hash, $i_arch_v,
3818         "dgit --quilt=$quilt_mode",
3819         (defined $overwrite_version ? <<END_OVERWR : <<END_MAKEFF);
3820 Declare fast forward from $i_arch_v->[0]
3821 END_OVERWR
3822 Make fast forward from $i_arch_v->[0]
3823 END_MAKEFF
3824
3825     maybe_split_brain_save $maintview, $r, "pseudomerge";
3826
3827     progress "Made pseudo-merge of $i_arch_v->[0] into dgit view.";
3828     return $r;
3829 }       
3830
3831 sub plain_overwrite_pseudomerge ($$$) {
3832     my ($clogp, $head, $archive_hash) = @_;
3833
3834     printdebug "plain_overwrite_pseudomerge...";
3835
3836     my $i_arch_v = pseudomerge_version_check($clogp, $archive_hash);
3837
3838     return $head if is_fast_fwd $archive_hash, $head;
3839
3840     my $m = "Declare fast forward from $i_arch_v->[0]";
3841
3842     my $r = pseudomerge_make_commit
3843         $clogp, $head, $archive_hash, $i_arch_v,
3844         "dgit", $m;
3845
3846     runcmd @git, qw(update-ref -m), $m, 'HEAD', $r, $head;
3847
3848     progress "Make pseudo-merge of $i_arch_v->[0] into your HEAD.";
3849     return $r;
3850 }
3851
3852 sub push_parse_changelog ($) {
3853     my ($clogpfn) = @_;
3854
3855     my $clogp = Dpkg::Control::Hash->new();
3856     $clogp->load($clogpfn) or die;
3857
3858     my $clogpackage = getfield $clogp, 'Source';
3859     $package //= $clogpackage;
3860     fail "-p specified $package but changelog specified $clogpackage"
3861         unless $package eq $clogpackage;
3862     my $cversion = getfield $clogp, 'Version';
3863
3864     if (!$we_are_initiator) {
3865         # rpush initiator can't do this because it doesn't have $isuite yet
3866         my $tag = debiantag($cversion, access_nomdistro);
3867         runcmd @git, qw(check-ref-format), $tag;
3868     }
3869
3870     my $dscfn = dscfn($cversion);
3871
3872     return ($clogp, $cversion, $dscfn);
3873 }
3874
3875 sub push_parse_dsc ($$$) {
3876     my ($dscfn,$dscfnwhat, $cversion) = @_;
3877     $dsc = parsecontrol($dscfn,$dscfnwhat);
3878     my $dversion = getfield $dsc, 'Version';
3879     my $dscpackage = getfield $dsc, 'Source';
3880     ($dscpackage eq $package && $dversion eq $cversion) or
3881         fail "$dscfn is for $dscpackage $dversion".
3882             " but debian/changelog is for $package $cversion";
3883 }
3884
3885 sub push_tagwants ($$$$) {
3886     my ($cversion, $dgithead, $maintviewhead, $tfbase) = @_;
3887     my @tagwants;
3888     push @tagwants, {
3889         TagFn => \&debiantag,
3890         Objid => $dgithead,
3891         TfSuffix => '',
3892         View => 'dgit',
3893     };
3894     if (defined $maintviewhead) {
3895         push @tagwants, {
3896             TagFn => \&debiantag_maintview,
3897             Objid => $maintviewhead,
3898             TfSuffix => '-maintview',
3899             View => 'maint',
3900         };
3901     } elsif ($dodep14tag eq 'no' ? 0
3902              : $dodep14tag eq 'want' ? access_cfg_tagformats_can_splitbrain
3903              : $dodep14tag eq 'always'
3904              ? (access_cfg_tagformats_can_splitbrain or fail <<END)
3905 --dep14tag-always (or equivalent in config) means server must support
3906  both "new" and "maint" tag formats, but config says it doesn't.
3907 END
3908             : die "$dodep14tag ?") {
3909         push @tagwants, {
3910             TagFn => \&debiantag_maintview,
3911             Objid => $dgithead,
3912             TfSuffix => '-dgit',
3913             View => 'dgit',
3914         };
3915     };
3916     foreach my $tw (@tagwants) {
3917         $tw->{Tag} = $tw->{TagFn}($cversion, access_nomdistro);
3918         $tw->{Tfn} = sub { $tfbase.$tw->{TfSuffix}.$_[0]; };
3919     }
3920     printdebug 'push_tagwants: ', Dumper(\@_, \@tagwants);
3921     return @tagwants;
3922 }
3923
3924 sub push_mktags ($$ $$ $) {
3925     my ($clogp,$dscfn,
3926         $changesfile,$changesfilewhat,
3927         $tagwants) = @_;
3928
3929     die unless $tagwants->[0]{View} eq 'dgit';
3930
3931     my $declaredistro = access_nomdistro();
3932     my $reader_giturl = do { local $access_forpush=0; access_giturl(); };
3933     $dsc->{$ourdscfield[0]} = join " ",
3934         $tagwants->[0]{Objid}, $declaredistro, $tagwants->[0]{Tag},
3935         $reader_giturl;
3936     $dsc->save("$dscfn.tmp") or die $!;
3937
3938     my $changes = parsecontrol($changesfile,$changesfilewhat);
3939     foreach my $field (qw(Source Distribution Version)) {
3940         $changes->{$field} eq $clogp->{$field} or
3941             fail "changes field $field \`$changes->{$field}'".
3942                 " does not match changelog \`$clogp->{$field}'";
3943     }
3944
3945     my $cversion = getfield $clogp, 'Version';
3946     my $clogsuite = getfield $clogp, 'Distribution';
3947
3948     # We make the git tag by hand because (a) that makes it easier
3949     # to control the "tagger" (b) we can do remote signing
3950     my $authline = clogp_authline $clogp;
3951     my $delibs = join(" ", "",@deliberatelies);
3952
3953     my $mktag = sub {
3954         my ($tw) = @_;
3955         my $tfn = $tw->{Tfn};
3956         my $head = $tw->{Objid};
3957         my $tag = $tw->{Tag};
3958
3959         open TO, '>', $tfn->('.tmp') or die $!;
3960         print TO <<END or die $!;
3961 object $head
3962 type commit
3963 tag $tag
3964 tagger $authline
3965
3966 END
3967         if ($tw->{View} eq 'dgit') {
3968             print TO <<END or die $!;
3969 $package release $cversion for $clogsuite ($csuite) [dgit]
3970 [dgit distro=$declaredistro$delibs]
3971 END
3972             foreach my $ref (sort keys %previously) {
3973                 print TO <<END or die $!;
3974 [dgit previously:$ref=$previously{$ref}]
3975 END
3976             }
3977         } elsif ($tw->{View} eq 'maint') {
3978             print TO <<END or die $!;
3979 $package release $cversion for $clogsuite ($csuite)
3980 (maintainer view tag generated by dgit --quilt=$quilt_mode)
3981 END
3982         } else {
3983             die Dumper($tw)."?";
3984         }
3985
3986         close TO or die $!;
3987
3988         my $tagobjfn = $tfn->('.tmp');
3989         if ($sign) {
3990             if (!defined $keyid) {
3991                 $keyid = access_cfg('keyid','RETURN-UNDEF');
3992             }
3993             if (!defined $keyid) {
3994                 $keyid = getfield $clogp, 'Maintainer';
3995             }
3996             unlink $tfn->('.tmp.asc') or $!==&ENOENT or die $!;
3997             my @sign_cmd = (@gpg, qw(--detach-sign --armor));
3998             push @sign_cmd, qw(-u),$keyid if defined $keyid;
3999             push @sign_cmd, $tfn->('.tmp');
4000             runcmd_ordryrun @sign_cmd;
4001             if (act_scary()) {
4002                 $tagobjfn = $tfn->('.signed.tmp');
4003                 runcmd shell_cmd "exec >$tagobjfn", qw(cat --),
4004                     $tfn->('.tmp'), $tfn->('.tmp.asc');
4005             }
4006         }
4007         return $tagobjfn;
4008     };
4009
4010     my @r = map { $mktag->($_); } @$tagwants;
4011     return @r;
4012 }
4013
4014 sub sign_changes ($) {
4015     my ($changesfile) = @_;
4016     if ($sign) {
4017         my @debsign_cmd = @debsign;
4018         push @debsign_cmd, "-k$keyid" if defined $keyid;
4019         push @debsign_cmd, "-p$gpg[0]" if $gpg[0] ne 'gpg';
4020         push @debsign_cmd, $changesfile;
4021         runcmd_ordryrun @debsign_cmd;
4022     }
4023 }
4024
4025 sub dopush () {
4026     printdebug "actually entering push\n";
4027
4028     supplementary_message(<<'END');
4029 Push failed, while checking state of the archive.
4030 You can retry the push, after fixing the problem, if you like.
4031 END
4032     if (check_for_git()) {
4033         git_fetch_us();
4034     }
4035     my $archive_hash = fetch_from_archive();
4036     if (!$archive_hash) {
4037         $new_package or
4038             fail "package appears to be new in this suite;".
4039                 " if this is intentional, use --new";
4040     }
4041
4042     supplementary_message(<<'END');
4043 Push failed, while preparing your push.
4044 You can retry the push, after fixing the problem, if you like.
4045 END
4046
4047     need_tagformat 'new', "quilt mode $quilt_mode"
4048         if quiltmode_splitbrain;
4049
4050     prep_ud();
4051
4052     access_giturl(); # check that success is vaguely likely
4053     rpush_handle_protovsn_bothends() if $we_are_initiator;
4054     select_tagformat();
4055
4056     my $clogpfn = ".git/dgit/changelog.822.tmp";
4057     runcmd shell_cmd "exec >$clogpfn", qw(dpkg-parsechangelog);
4058
4059     responder_send_file('parsed-changelog', $clogpfn);
4060
4061     my ($clogp, $cversion, $dscfn) =
4062         push_parse_changelog("$clogpfn");
4063
4064     my $dscpath = "$buildproductsdir/$dscfn";
4065     stat_exists $dscpath or
4066         fail "looked for .dsc $dscpath, but $!;".
4067             " maybe you forgot to build";
4068
4069     responder_send_file('dsc', $dscpath);
4070
4071     push_parse_dsc($dscpath, $dscfn, $cversion);
4072
4073     my $format = getfield $dsc, 'Format';
4074     printdebug "format $format\n";
4075
4076     my $actualhead = git_rev_parse('HEAD');
4077     my $dgithead = $actualhead;
4078     my $maintviewhead = undef;
4079
4080     my $upstreamversion = upstreamversion $clogp->{Version};
4081
4082     if (madformat_wantfixup($format)) {
4083         # user might have not used dgit build, so maybe do this now:
4084         if (quiltmode_splitbrain()) {
4085             changedir $ud;
4086             quilt_make_fake_dsc($upstreamversion);
4087             my $cachekey;
4088             ($dgithead, $cachekey) =
4089                 quilt_check_splitbrain_cache($actualhead, $upstreamversion);
4090             $dgithead or fail
4091  "--quilt=$quilt_mode but no cached dgit view:
4092  perhaps tree changed since dgit build[-source] ?";
4093             $split_brain = 1;
4094             $dgithead = splitbrain_pseudomerge($clogp,
4095                                                $actualhead, $dgithead,
4096                                                $archive_hash);
4097             $maintviewhead = $actualhead;
4098             changedir '../../../..';
4099             prep_ud(); # so _only_subdir() works, below
4100         } else {
4101             commit_quilty_patch();
4102         }
4103     }
4104
4105     if (defined $overwrite_version && !defined $maintviewhead) {
4106         $dgithead = plain_overwrite_pseudomerge($clogp,
4107                                                 $dgithead,
4108                                                 $archive_hash);
4109     }
4110
4111     check_not_dirty();
4112
4113     my $forceflag = '';
4114     if ($archive_hash) {
4115         if (is_fast_fwd($archive_hash, $dgithead)) {
4116             # ok
4117         } elsif (deliberately_not_fast_forward) {
4118             $forceflag = '+';
4119         } else {
4120             fail "dgit push: HEAD is not a descendant".
4121                 " of the archive's version.\n".
4122                 "To overwrite the archive's contents,".
4123                 " pass --overwrite[=VERSION].\n".
4124                 "To rewind history, if permitted by the archive,".
4125                 " use --deliberately-not-fast-forward.";
4126         }
4127     }
4128
4129     changedir $ud;
4130     progress "checking that $dscfn corresponds to HEAD";
4131     runcmd qw(dpkg-source -x --),
4132         $dscpath =~ m#^/# ? $dscpath : "../../../$dscpath";
4133     my ($tree,$dir) = mktree_in_ud_from_only_subdir("source package");
4134     check_for_vendor_patches() if madformat($dsc->{format});
4135     changedir '../../../..';
4136     my @diffcmd = (@git, qw(diff --quiet), $tree, $dgithead);
4137     debugcmd "+",@diffcmd;
4138     $!=0; $?=-1;
4139     my $r = system @diffcmd;
4140     if ($r) {
4141         if ($r==256) {
4142             my $diffs = cmdoutput @git, qw(diff --stat), $tree, $dgithead;
4143             fail <<END
4144 HEAD specifies a different tree to $dscfn:
4145 $diffs
4146 Perhaps you forgot to build.  Or perhaps there is a problem with your
4147  source tree (see dgit(7) for some hints).  To see a full diff, run
4148    git diff $tree HEAD
4149 END
4150         } else {
4151             failedcmd @diffcmd;
4152         }
4153     }
4154     if (!$changesfile) {
4155         my $pat = changespat $cversion;
4156         my @cs = glob "$buildproductsdir/$pat";
4157         fail "failed to find unique changes file".
4158             " (looked for $pat in $buildproductsdir);".
4159             " perhaps you need to use dgit -C"
4160             unless @cs==1;
4161         ($changesfile) = @cs;
4162     } else {
4163         $changesfile = "$buildproductsdir/$changesfile";
4164     }
4165
4166     # Check that changes and .dsc agree enough
4167     $changesfile =~ m{[^/]*$};
4168     my $changes = parsecontrol($changesfile,$&);
4169     files_compare_inputs($dsc, $changes)
4170         unless forceing [qw(dsc-changes-mismatch)];
4171
4172     # Perhaps adjust .dsc to contain right set of origs
4173     changes_update_origs_from_dsc($dsc, $changes, $upstreamversion,
4174                                   $changesfile)
4175         unless forceing [qw(changes-origs-exactly)];
4176
4177     # Checks complete, we're going to try and go ahead:
4178
4179     responder_send_file('changes',$changesfile);
4180     responder_send_command("param head $dgithead");
4181     responder_send_command("param csuite $csuite");
4182     responder_send_command("param isuite $isuite");
4183     responder_send_command("param tagformat $tagformat");
4184     if (defined $maintviewhead) {
4185         die unless ($protovsn//4) >= 4;
4186         responder_send_command("param maint-view $maintviewhead");
4187     }
4188
4189     if (deliberately_not_fast_forward) {
4190         git_for_each_ref(lrfetchrefs, sub {
4191             my ($objid,$objtype,$lrfetchrefname,$reftail) = @_;
4192             my $rrefname= substr($lrfetchrefname, length(lrfetchrefs) + 1);
4193             responder_send_command("previously $rrefname=$objid");
4194             $previously{$rrefname} = $objid;
4195         });
4196     }
4197
4198     my @tagwants = push_tagwants($cversion, $dgithead, $maintviewhead,
4199                                  ".git/dgit/tag");
4200     my @tagobjfns;
4201
4202     supplementary_message(<<'END');
4203 Push failed, while signing the tag.
4204 You can retry the push, after fixing the problem, if you like.
4205 END
4206     # If we manage to sign but fail to record it anywhere, it's fine.
4207     if ($we_are_responder) {
4208         @tagobjfns = map { $_->{Tfn}('.signed-tmp') } @tagwants;
4209         responder_receive_files('signed-tag', @tagobjfns);
4210     } else {
4211         @tagobjfns = push_mktags($clogp,$dscpath,
4212                               $changesfile,$changesfile,
4213                               \@tagwants);
4214     }
4215     supplementary_message(<<'END');
4216 Push failed, *after* signing the tag.
4217 If you want to try again, you should use a new version number.
4218 END
4219
4220     pairwise { $a->{TagObjFn} = $b } @tagwants, @tagobjfns;
4221
4222     foreach my $tw (@tagwants) {
4223         my $tag = $tw->{Tag};
4224         my $tagobjfn = $tw->{TagObjFn};
4225         my $tag_obj_hash =
4226             cmdoutput @git, qw(hash-object -w -t tag), $tagobjfn;
4227         runcmd_ordryrun @git, qw(verify-tag), $tag_obj_hash;
4228         runcmd_ordryrun_local
4229             @git, qw(update-ref), "refs/tags/$tag", $tag_obj_hash;
4230     }
4231
4232     supplementary_message(<<'END');
4233 Push failed, while updating the remote git repository - see messages above.
4234 If you want to try again, you should use a new version number.
4235 END
4236     if (!check_for_git()) {
4237         create_remote_git_repo();
4238     }
4239
4240     my @pushrefs = $forceflag.$dgithead.":".rrref();
4241     foreach my $tw (@tagwants) {
4242         push @pushrefs, $forceflag."refs/tags/$tw->{Tag}";
4243     }
4244
4245     runcmd_ordryrun @git,
4246         qw(-c push.followTags=false push), access_giturl(), @pushrefs;
4247     runcmd_ordryrun @git, qw(update-ref -m), 'dgit push', lrref(), $dgithead;
4248
4249     supplementary_message(<<'END');
4250 Push failed, while obtaining signatures on the .changes and .dsc.
4251 If it was just that the signature failed, you may try again by using
4252 debsign by hand to sign the changes
4253    $changesfile
4254 and then dput to complete the upload.
4255 If you need to change the package, you must use a new version number.
4256 END
4257     if ($we_are_responder) {
4258         my $dryrunsuffix = act_local() ? "" : ".tmp";
4259         responder_receive_files('signed-dsc-changes',
4260                                 "$dscpath$dryrunsuffix",
4261                                 "$changesfile$dryrunsuffix");
4262     } else {
4263         if (act_local()) {
4264             rename "$dscpath.tmp",$dscpath or die "$dscfn $!";
4265         } else {
4266             progress "[new .dsc left in $dscpath.tmp]";
4267         }
4268         sign_changes $changesfile;
4269     }
4270
4271     supplementary_message(<<END);
4272 Push failed, while uploading package(s) to the archive server.
4273 You can retry the upload of exactly these same files with dput of:
4274   $changesfile
4275 If that .changes file is broken, you will need to use a new version
4276 number for your next attempt at the upload.
4277 END
4278     my $host = access_cfg('upload-host','RETURN-UNDEF');
4279     my @hostarg = defined($host) ? ($host,) : ();
4280     runcmd_ordryrun @dput, @hostarg, $changesfile;
4281     printdone "pushed and uploaded $cversion";
4282
4283     supplementary_message('');
4284     responder_send_command("complete");
4285 }
4286
4287 sub cmd_clone {
4288     parseopts();
4289     my $dstdir;
4290     badusage "-p is not allowed with clone; specify as argument instead"
4291         if defined $package;
4292     if (@ARGV==1) {
4293         ($package) = @ARGV;
4294     } elsif (@ARGV==2 && $ARGV[1] =~ m#^\w#) {
4295         ($package,$isuite) = @ARGV;
4296     } elsif (@ARGV==2 && $ARGV[1] =~ m#^[./]#) {
4297         ($package,$dstdir) = @ARGV;
4298     } elsif (@ARGV==3) {
4299         ($package,$isuite,$dstdir) = @ARGV;
4300     } else {
4301         badusage "incorrect arguments to dgit clone";
4302     }
4303     notpushing();
4304
4305     $dstdir ||= "$package";
4306     if (stat_exists $dstdir) {
4307         fail "$dstdir already exists";
4308     }
4309
4310     my $cwd_remove;
4311     if ($rmonerror && !$dryrun_level) {
4312         $cwd_remove= getcwd();
4313         unshift @end, sub { 
4314             return unless defined $cwd_remove;
4315             if (!chdir "$cwd_remove") {
4316                 return if $!==&ENOENT;
4317                 die "chdir $cwd_remove: $!";
4318             }
4319             printdebug "clone rmonerror removing $dstdir\n";
4320             if (stat $dstdir) {
4321                 rmtree($dstdir) or die "remove $dstdir: $!\n";
4322             } elsif (grep { $! == $_ }
4323                      (ENOENT, ENOTDIR, EACCES, EPERM, ELOOP)) {
4324             } else {
4325                 print STDERR "check whether to remove $dstdir: $!\n";
4326             }
4327         };
4328     }
4329
4330     clone($dstdir);
4331     $cwd_remove = undef;
4332 }
4333
4334 sub branchsuite () {
4335     my $branch = cmdoutput_errok @git, qw(symbolic-ref HEAD);
4336     if ($branch =~ m#$lbranch_re#o) {
4337         return $1;
4338     } else {
4339         return undef;
4340     }
4341 }
4342
4343 sub fetchpullargs () {
4344     if (!defined $package) {
4345         my $sourcep = parsecontrol('debian/control','debian/control');
4346         $package = getfield $sourcep, 'Source';
4347     }
4348     if (@ARGV==0) {
4349         $isuite = branchsuite();
4350         if (!$isuite) {
4351             my $clogp = parsechangelog();
4352             my $clogsuite = getfield $clogp, 'Distribution';
4353             $isuite= $clogsuite if $clogsuite ne 'UNRELEASED';
4354         }
4355     } elsif (@ARGV==1) {
4356         ($isuite) = @ARGV;
4357     } else {
4358         badusage "incorrect arguments to dgit fetch or dgit pull";
4359     }
4360     notpushing();
4361 }
4362
4363 sub cmd_fetch {
4364     parseopts();
4365     fetchpullargs();
4366     my $multi_fetched = fork_for_multisuite(sub { });
4367     exit 0 if $multi_fetched;
4368     fetch();
4369 }
4370
4371 sub cmd_pull {
4372     parseopts();
4373     fetchpullargs();
4374     if (quiltmode_splitbrain()) {
4375         my ($format, $fopts) = get_source_format();
4376         madformat($format) and fail <<END
4377 dgit pull not yet supported in split view mode (--quilt=$quilt_mode)
4378 END
4379     }
4380     pull();
4381 }
4382
4383 sub cmd_push {
4384     parseopts();