chiark / gitweb /
83013b898448046d69711064908354b98736b7a9
[dgit.git] / dgit
1 #!/usr/bin/perl -w
2 # dgit
3 # Integration between git and Debian-style archives
4 #
5 # Copyright (C)2013-2016 Ian Jackson
6 #
7 # This program is free software: you can redistribute it and/or modify
8 # it under the terms of the GNU General Public License as published by
9 # the Free Software Foundation, either version 3 of the License, or
10 # (at your option) any later version.
11 #
12 # This program is distributed in the hope that it will be useful,
13 # but WITHOUT ANY WARRANTY; without even the implied warranty of
14 # MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
15 # GNU General Public License for more details.
16 #
17 # You should have received a copy of the GNU General Public License
18 # along with this program.  If not, see <http://www.gnu.org/licenses/>.
19
20 use strict;
21
22 use Debian::Dgit qw(:DEFAULT :playground);
23 setup_sigwarn();
24
25 use IO::Handle;
26 use Data::Dumper;
27 use LWP::UserAgent;
28 use Dpkg::Control::Hash;
29 use File::Path;
30 use File::Temp qw(tempdir);
31 use File::Basename;
32 use Dpkg::Version;
33 use POSIX;
34 use IPC::Open2;
35 use Digest::SHA;
36 use Digest::MD5;
37 use List::MoreUtils qw(pairwise);
38 use Text::Glob qw(match_glob);
39 use Fcntl qw(:DEFAULT :flock);
40 use Carp;
41
42 use Debian::Dgit;
43
44 our $our_version = 'UNRELEASED'; ###substituted###
45 our $absurdity = undef; ###substituted###
46
47 our @rpushprotovsn_support = qw(4 3 2); # 4 is new tag format
48 our $protovsn;
49
50 our $cmd;
51 our $subcommand;
52 our $isuite;
53 our $idistro;
54 our $package;
55 our @ropts;
56
57 our $sign = 1;
58 our $dryrun_level = 0;
59 our $changesfile;
60 our $buildproductsdir = '..';
61 our $new_package = 0;
62 our $ignoredirty = 0;
63 our $rmonerror = 1;
64 our @deliberatelies;
65 our %previously;
66 our $existing_package = 'dpkg';
67 our $cleanmode;
68 our $changes_since_version;
69 our $rmchanges;
70 our $overwrite_version; # undef: not specified; '': check changelog
71 our $quilt_mode;
72 our $quilt_modes_re = 'linear|smash|auto|nofix|nocheck|gbp|dpm|unapplied';
73 our $dodep14tag;
74 our $split_brain_save;
75 our $we_are_responder;
76 our $we_are_initiator;
77 our $initiator_tempdir;
78 our $patches_applied_dirtily = 00;
79 our $tagformat_want;
80 our $tagformat;
81 our $tagformatfn;
82 our $chase_dsc_distro=1;
83
84 our %forceopts = map { $_=>0 }
85     qw(unrepresentable unsupported-source-format
86        dsc-changes-mismatch changes-origs-exactly
87        import-gitapply-absurd
88        import-gitapply-no-absurd
89        import-dsc-with-dgit-field);
90
91 our %format_ok = map { $_=>1 } ("1.0","3.0 (native)","3.0 (quilt)");
92
93 our $suite_re = '[-+.0-9a-z]+';
94 our $cleanmode_re = 'dpkg-source(?:-d)?|git|git-ff|check|none';
95 our $orig_f_comp_re = 'orig(?:-[-0-9a-z]+)?';
96 our $orig_f_sig_re = '\\.(?:asc|gpg|pgp)';
97 our $orig_f_tail_re = "$orig_f_comp_re\\.tar(?:\\.\\w+)?(?:$orig_f_sig_re)?";
98
99 our $git_authline_re = '^([^<>]+) \<(\S+)\> (\d+ [-+]\d+)$';
100 our $splitbraincache = 'dgit-intern/quilt-cache';
101 our $rewritemap = 'dgit-rewrite/map';
102
103 our (@git) = qw(git);
104 our (@dget) = qw(dget);
105 our (@curl) = (qw(curl --proto-redir), '-all,http,https', qw(-L));
106 our (@dput) = qw(dput);
107 our (@debsign) = qw(debsign);
108 our (@gpg) = qw(gpg);
109 our (@sbuild) = qw(sbuild);
110 our (@ssh) = 'ssh';
111 our (@dgit) = qw(dgit);
112 our (@aptget) = qw(apt-get);
113 our (@aptcache) = qw(apt-cache);
114 our (@dpkgbuildpackage) = qw(dpkg-buildpackage -i\.git/ -I.git);
115 our (@dpkgsource) = qw(dpkg-source -i\.git/ -I.git);
116 our (@dpkggenchanges) = qw(dpkg-genchanges);
117 our (@mergechanges) = qw(mergechanges -f);
118 our (@gbp_build) = ('');
119 our (@gbp_pq) = ('gbp pq');
120 our (@changesopts) = ('');
121
122 our %opts_opt_map = ('dget' => \@dget, # accept for compatibility
123                      'curl' => \@curl,
124                      'dput' => \@dput,
125                      'debsign' => \@debsign,
126                      'gpg' => \@gpg,
127                      'sbuild' => \@sbuild,
128                      'ssh' => \@ssh,
129                      'dgit' => \@dgit,
130                      'git' => \@git,
131                      'apt-get' => \@aptget,
132                      'apt-cache' => \@aptcache,
133                      'dpkg-source' => \@dpkgsource,
134                      'dpkg-buildpackage' => \@dpkgbuildpackage,
135                      'dpkg-genchanges' => \@dpkggenchanges,
136                      'gbp-build' => \@gbp_build,
137                      'gbp-pq' => \@gbp_pq,
138                      'ch' => \@changesopts,
139                      'mergechanges' => \@mergechanges);
140
141 our %opts_opt_cmdonly = ('gpg' => 1, 'git' => 1);
142 our %opts_cfg_insertpos = map {
143     $_,
144     scalar @{ $opts_opt_map{$_} }
145 } keys %opts_opt_map;
146
147 sub parseopts_late_defaults();
148 sub setup_gitattrs(;$);
149 sub check_gitattrs($$);
150
151 our $keyid;
152
153 autoflush STDOUT 1;
154
155 our $supplementary_message = '';
156 our $need_split_build_invocation = 0;
157 our $split_brain = 0;
158
159 END {
160     local ($@, $?);
161     return unless forkcheck_mainprocess();
162     print STDERR "! $_\n" foreach $supplementary_message =~ m/^.+$/mg;
163 }
164
165 our $remotename = 'dgit';
166 our @ourdscfield = qw(Dgit Vcs-Dgit-Master);
167 our $csuite;
168 our $instead_distro;
169
170 if (!defined $absurdity) {
171     $absurdity = $0;
172     $absurdity =~ s{/[^/]+$}{/absurd} or die;
173 }
174
175 sub debiantag ($$) {
176     my ($v,$distro) = @_;
177     return $tagformatfn->($v, $distro);
178 }
179
180 sub debiantag_maintview ($$) { 
181     my ($v,$distro) = @_;
182     return "$distro/".dep14_version_mangle $v;
183 }
184
185 sub madformat ($) { $_[0] eq '3.0 (quilt)' }
186
187 sub lbranch () { return "$branchprefix/$csuite"; }
188 my $lbranch_re = '^refs/heads/'.$branchprefix.'/([^/.]+)$';
189 sub lref () { return "refs/heads/".lbranch(); }
190 sub lrref () { return "refs/remotes/$remotename/".server_branch($csuite); }
191 sub rrref () { return server_ref($csuite); }
192
193 sub stripepoch ($) {
194     my ($vsn) = @_;
195     $vsn =~ s/^\d+\://;
196     return $vsn;
197 }
198
199 sub srcfn ($$) {
200     my ($vsn,$sfx) = @_;
201     return "${package}_".(stripepoch $vsn).$sfx
202 }
203
204 sub dscfn ($) {
205     my ($vsn) = @_;
206     return srcfn($vsn,".dsc");
207 }
208
209 sub changespat ($;$) {
210     my ($vsn, $arch) = @_;
211     return "${package}_".(stripepoch $vsn)."_".($arch//'*').".changes";
212 }
213
214 sub upstreamversion ($) {
215     my ($vsn) = @_;
216     $vsn =~ s/-[^-]+$//;
217     return $vsn;
218 }
219
220 our $us = 'dgit';
221 initdebug('');
222
223 our @end;
224 END { 
225     local ($?);
226     return unless forkcheck_mainprocess();
227     foreach my $f (@end) {
228         eval { $f->(); };
229         print STDERR "$us: cleanup: $@" if length $@;
230     }
231 };
232
233 sub badcfg { print STDERR "$us: invalid configuration: @_\n"; exit 12; }
234
235 sub forceable_fail ($$) {
236     my ($forceoptsl, $msg) = @_;
237     fail $msg unless grep { $forceopts{$_} } @$forceoptsl;
238     print STDERR "warning: overriding problem due to --force:\n". $msg;
239 }
240
241 sub forceing ($) {
242     my ($forceoptsl) = @_;
243     my @got = grep { $forceopts{$_} } @$forceoptsl;
244     return 0 unless @got;
245     print STDERR
246  "warning: skipping checks or functionality due to --force-$got[0]\n";
247 }
248
249 sub no_such_package () {
250     print STDERR "$us: package $package does not exist in suite $isuite\n";
251     exit 4;
252 }
253
254 sub deliberately ($) {
255     my ($enquiry) = @_;
256     return !!grep { $_ eq "--deliberately-$enquiry" } @deliberatelies;
257 }
258
259 sub deliberately_not_fast_forward () {
260     foreach (qw(not-fast-forward fresh-repo)) {
261         return 1 if deliberately($_) || deliberately("TEST-dgit-only-$_");
262     }
263 }
264
265 sub quiltmode_splitbrain () {
266     $quilt_mode =~ m/gbp|dpm|unapplied/;
267 }
268
269 sub opts_opt_multi_cmd {
270     my @cmd;
271     push @cmd, split /\s+/, shift @_;
272     push @cmd, @_;
273     @cmd;
274 }
275
276 sub gbp_pq {
277     return opts_opt_multi_cmd @gbp_pq;
278 }
279
280 sub dgit_privdir () {
281     our $dgit_privdir_made //= ensure_a_playground 'dgit';
282 }
283
284 #---------- remote protocol support, common ----------
285
286 # remote push initiator/responder protocol:
287 #  $ dgit remote-push-build-host <n-rargs> <rargs>... <push-args>...
288 #  where <rargs> is <push-host-dir> <supported-proto-vsn>,... ...
289 #  < dgit-remote-push-ready <actual-proto-vsn>
290 #
291 # occasionally:
292 #
293 #  > progress NBYTES
294 #  [NBYTES message]
295 #
296 #  > supplementary-message NBYTES          # $protovsn >= 3
297 #  [NBYTES message]
298 #
299 # main sequence:
300 #
301 #  > file parsed-changelog
302 #  [indicates that output of dpkg-parsechangelog follows]
303 #  > data-block NBYTES
304 #  > [NBYTES bytes of data (no newline)]
305 #  [maybe some more blocks]
306 #  > data-end
307 #
308 #  > file dsc
309 #  [etc]
310 #
311 #  > file changes
312 #  [etc]
313 #
314 #  > param head DGIT-VIEW-HEAD
315 #  > param csuite SUITE
316 #  > param tagformat old|new
317 #  > param maint-view MAINT-VIEW-HEAD
318 #
319 #  > param buildinfo-filename P_V_X.buildinfo   # zero or more times
320 #  > file buildinfo                             # for buildinfos to sign
321 #
322 #  > previously REFNAME=OBJNAME       # if --deliberately-not-fast-forward
323 #                                     # goes into tag, for replay prevention
324 #
325 #  > want signed-tag
326 #  [indicates that signed tag is wanted]
327 #  < data-block NBYTES
328 #  < [NBYTES bytes of data (no newline)]
329 #  [maybe some more blocks]
330 #  < data-end
331 #  < files-end
332 #
333 #  > want signed-dsc-changes
334 #  < data-block NBYTES    [transfer of signed dsc]
335 #  [etc]
336 #  < data-block NBYTES    [transfer of signed changes]
337 #  [etc]
338 #  < data-block NBYTES    [transfer of each signed buildinfo
339 #  [etc]                   same number and order as "file buildinfo"]
340 #  ...
341 #  < files-end
342 #
343 #  > complete
344
345 our $i_child_pid;
346
347 sub i_child_report () {
348     # Sees if our child has died, and reap it if so.  Returns a string
349     # describing how it died if it failed, or undef otherwise.
350     return undef unless $i_child_pid;
351     my $got = waitpid $i_child_pid, WNOHANG;
352     return undef if $got <= 0;
353     die unless $got == $i_child_pid;
354     $i_child_pid = undef;
355     return undef unless $?;
356     return "build host child ".waitstatusmsg();
357 }
358
359 sub badproto ($$) {
360     my ($fh, $m) = @_;
361     fail "connection lost: $!" if $fh->error;
362     fail "protocol violation; $m not expected";
363 }
364
365 sub badproto_badread ($$) {
366     my ($fh, $wh) = @_;
367     fail "connection lost: $!" if $!;
368     my $report = i_child_report();
369     fail $report if defined $report;
370     badproto $fh, "eof (reading $wh)";
371 }
372
373 sub protocol_expect (&$) {
374     my ($match, $fh) = @_;
375     local $_;
376     $_ = <$fh>;
377     defined && chomp or badproto_badread $fh, "protocol message";
378     if (wantarray) {
379         my @r = &$match;
380         return @r if @r;
381     } else {
382         my $r = &$match;
383         return $r if $r;
384     }
385     badproto $fh, "\`$_'";
386 }
387
388 sub protocol_send_file ($$) {
389     my ($fh, $ourfn) = @_;
390     open PF, "<", $ourfn or die "$ourfn: $!";
391     for (;;) {
392         my $d;
393         my $got = read PF, $d, 65536;
394         die "$ourfn: $!" unless defined $got;
395         last if !$got;
396         print $fh "data-block ".length($d)."\n" or die $!;
397         print $fh $d or die $!;
398     }
399     PF->error and die "$ourfn $!";
400     print $fh "data-end\n" or die $!;
401     close PF;
402 }
403
404 sub protocol_read_bytes ($$) {
405     my ($fh, $nbytes) = @_;
406     $nbytes =~ m/^[1-9]\d{0,5}$|^0$/ or badproto \*RO, "bad byte count";
407     my $d;
408     my $got = read $fh, $d, $nbytes;
409     $got==$nbytes or badproto_badread $fh, "data block";
410     return $d;
411 }
412
413 sub protocol_receive_file ($$) {
414     my ($fh, $ourfn) = @_;
415     printdebug "() $ourfn\n";
416     open PF, ">", $ourfn or die "$ourfn: $!";
417     for (;;) {
418         my ($y,$l) = protocol_expect {
419             m/^data-block (.*)$/ ? (1,$1) :
420             m/^data-end$/ ? (0,) :
421             ();
422         } $fh;
423         last unless $y;
424         my $d = protocol_read_bytes $fh, $l;
425         print PF $d or die $!;
426     }
427     close PF or die $!;
428 }
429
430 #---------- remote protocol support, responder ----------
431
432 sub responder_send_command ($) {
433     my ($command) = @_;
434     return unless $we_are_responder;
435     # called even without $we_are_responder
436     printdebug ">> $command\n";
437     print PO $command, "\n" or die $!;
438 }    
439
440 sub responder_send_file ($$) {
441     my ($keyword, $ourfn) = @_;
442     return unless $we_are_responder;
443     printdebug "]] $keyword $ourfn\n";
444     responder_send_command "file $keyword";
445     protocol_send_file \*PO, $ourfn;
446 }
447
448 sub responder_receive_files ($@) {
449     my ($keyword, @ourfns) = @_;
450     die unless $we_are_responder;
451     printdebug "[[ $keyword @ourfns\n";
452     responder_send_command "want $keyword";
453     foreach my $fn (@ourfns) {
454         protocol_receive_file \*PI, $fn;
455     }
456     printdebug "[[\$\n";
457     protocol_expect { m/^files-end$/ } \*PI;
458 }
459
460 #---------- remote protocol support, initiator ----------
461
462 sub initiator_expect (&) {
463     my ($match) = @_;
464     protocol_expect { &$match } \*RO;
465 }
466
467 #---------- end remote code ----------
468
469 sub progress {
470     if ($we_are_responder) {
471         my $m = join '', @_;
472         responder_send_command "progress ".length($m) or die $!;
473         print PO $m or die $!;
474     } else {
475         print @_, "\n";
476     }
477 }
478
479 our $ua;
480
481 sub url_get {
482     if (!$ua) {
483         $ua = LWP::UserAgent->new();
484         $ua->env_proxy;
485     }
486     my $what = $_[$#_];
487     progress "downloading $what...";
488     my $r = $ua->get(@_) or die $!;
489     return undef if $r->code == 404;
490     $r->is_success or fail "failed to fetch $what: ".$r->status_line;
491     return $r->decoded_content(charset => 'none');
492 }
493
494 our ($dscdata,$dscurl,$dsc,$dsc_checked,$skew_warning_vsn);
495
496 sub act_local () { return $dryrun_level <= 1; }
497 sub act_scary () { return !$dryrun_level; }
498
499 sub printdone {
500     if (!$dryrun_level) {
501         progress "$us ok: @_";
502     } else {
503         progress "would be ok: @_ (but dry run only)";
504     }
505 }
506
507 sub dryrun_report {
508     printcmd(\*STDERR,$debugprefix."#",@_);
509 }
510
511 sub runcmd_ordryrun {
512     if (act_scary()) {
513         runcmd @_;
514     } else {
515         dryrun_report @_;
516     }
517 }
518
519 sub runcmd_ordryrun_local {
520     if (act_local()) {
521         runcmd @_;
522     } else {
523         dryrun_report @_;
524     }
525 }
526
527 sub shell_cmd {
528     my ($first_shell, @cmd) = @_;
529     return qw(sh -ec), $first_shell.'; exec "$@"', 'x', @cmd;
530 }
531
532 our $helpmsg = <<END;
533 main usages:
534   dgit [dgit-opts] clone [dgit-opts] package [suite] [./dir|/dir]
535   dgit [dgit-opts] fetch|pull [dgit-opts] [suite]
536   dgit [dgit-opts] build [dpkg-buildpackage-opts]
537   dgit [dgit-opts] sbuild [sbuild-opts]
538   dgit [dgit-opts] push [dgit-opts] [suite]
539   dgit [dgit-opts] rpush build-host:build-dir ...
540 important dgit options:
541   -k<keyid>           sign tag and package with <keyid> instead of default
542   --dry-run -n        do not change anything, but go through the motions
543   --damp-run -L       like --dry-run but make local changes, without signing
544   --new -N            allow introducing a new package
545   --debug -D          increase debug level
546   -c<name>=<value>    set git config option (used directly by dgit too)
547 END
548
549 our $later_warning_msg = <<END;
550 Perhaps the upload is stuck in incoming.  Using the version from git.
551 END
552
553 sub badusage {
554     print STDERR "$us: @_\n", $helpmsg or die $!;
555     exit 8;
556 }
557
558 sub nextarg {
559     @ARGV or badusage "too few arguments";
560     return scalar shift @ARGV;
561 }
562
563 sub pre_help () {
564     not_necessarily_a_tree();
565 }
566 sub cmd_help () {
567     print $helpmsg or die $!;
568     exit 0;
569 }
570
571 our $td = $ENV{DGIT_TEST_DUMMY_DIR} || "DGIT_TEST_DUMMY_DIR-unset";
572
573 our %defcfg = ('dgit.default.distro' => 'debian',
574                'dgit.default.default-suite' => 'unstable',
575                'dgit.default.old-dsc-distro' => 'debian',
576                'dgit-suite.*-security.distro' => 'debian-security',
577                'dgit.default.username' => '',
578                'dgit.default.archive-query-default-component' => 'main',
579                'dgit.default.ssh' => 'ssh',
580                'dgit.default.archive-query' => 'madison:',
581                'dgit.default.sshpsql-dbname' => 'service=projectb',
582                'dgit.default.aptget-components' => 'main',
583                'dgit.default.dgit-tag-format' => 'new,old,maint',
584                'dgit.dsc-url-proto-ok.http'    => 'true',
585                'dgit.dsc-url-proto-ok.https'   => 'true',
586                'dgit.dsc-url-proto-ok.git'     => 'true',
587                'dgit.default.dsc-url-proto-ok' => 'false',
588                # old means "repo server accepts pushes with old dgit tags"
589                # new means "repo server accepts pushes with new dgit tags"
590                # maint means "repo server accepts split brain pushes"
591                # hist means "repo server may have old pushes without new tag"
592                #   ("hist" is implied by "old")
593                'dgit-distro.debian.archive-query' => 'ftpmasterapi:',
594                'dgit-distro.debian.git-check' => 'url',
595                'dgit-distro.debian.git-check-suffix' => '/info/refs',
596                'dgit-distro.debian.new-private-pushers' => 't',
597                'dgit-distro.debian/push.git-url' => '',
598                'dgit-distro.debian/push.git-host' => 'push.dgit.debian.org',
599                'dgit-distro.debian/push.git-user-force' => 'dgit',
600                'dgit-distro.debian/push.git-proto' => 'git+ssh://',
601                'dgit-distro.debian/push.git-path' => '/dgit/debian/repos',
602                'dgit-distro.debian/push.git-create' => 'true',
603                'dgit-distro.debian/push.git-check' => 'ssh-cmd',
604  'dgit-distro.debian.archive-query-url', 'https://api.ftp-master.debian.org/',
605 # 'dgit-distro.debian.archive-query-tls-key',
606 #    '/etc/ssl/certs/%HOST%.pem:/etc/dgit/%HOST%.pem',
607 # ^ this does not work because curl is broken nowadays
608 # Fixing #790093 properly will involve providing providing the key
609 # in some pacagke and maybe updating these paths.
610 #
611 # 'dgit-distro.debian.archive-query-tls-curl-args',
612 #   '--ca-path=/etc/ssl/ca-debian',
613 # ^ this is a workaround but works (only) on DSA-administered machines
614                'dgit-distro.debian.git-url' => 'https://git.dgit.debian.org',
615                'dgit-distro.debian.git-url-suffix' => '',
616                'dgit-distro.debian.upload-host' => 'ftp-master', # for dput
617                'dgit-distro.debian.mirror' => 'http://ftp.debian.org/debian/',
618  'dgit-distro.debian-security.archive-query' => 'aptget:',
619  'dgit-distro.debian-security.mirror' => 'http://security.debian.org/debian-security/',
620  'dgit-distro.debian-security.aptget-suite-map' => 's#-security$#/updates#',
621  'dgit-distro.debian-security.aptget-suite-rmap' => 's#$#-security#',
622  'dgit-distro.debian-security.nominal-distro' => 'debian',
623  'dgit-distro.debian.backports-quirk' => '(squeeze)-backports*',
624  'dgit-distro.debian-backports.mirror' => 'http://backports.debian.org/debian-backports/',
625                'dgit-distro.ubuntu.git-check' => 'false',
626  'dgit-distro.ubuntu.mirror' => 'http://archive.ubuntu.com/ubuntu',
627                'dgit-distro.test-dummy.ssh' => "$td/ssh",
628                'dgit-distro.test-dummy.username' => "alice",
629                'dgit-distro.test-dummy.git-check' => "ssh-cmd",
630                'dgit-distro.test-dummy.git-create' => "ssh-cmd",
631                'dgit-distro.test-dummy.git-url' => "$td/git",
632                'dgit-distro.test-dummy.git-host' => "git",
633                'dgit-distro.test-dummy.git-path' => "$td/git",
634                'dgit-distro.test-dummy.archive-query' => "dummycatapi:",
635                'dgit-distro.test-dummy.archive-query-url' => "file://$td/aq/",
636                'dgit-distro.test-dummy.mirror' => "file://$td/mirror/",
637                'dgit-distro.test-dummy.upload-host' => 'test-dummy',
638                );
639
640 our %gitcfgs;
641 our @gitcfgsources = qw(cmdline local global system);
642 our $invoked_in_git_tree = 1;
643
644 sub git_slurp_config () {
645     # This algoritm is a bit subtle, but this is needed so that for
646     # options which we want to be single-valued, we allow the
647     # different config sources to override properly.  See #835858.
648     foreach my $src (@gitcfgsources) {
649         next if $src eq 'cmdline';
650         # we do this ourselves since git doesn't handle it
651
652         $gitcfgs{$src} = git_slurp_config_src $src;
653     }
654 }
655
656 sub git_get_config ($) {
657     my ($c) = @_;
658     foreach my $src (@gitcfgsources) {
659         my $l = $gitcfgs{$src}{$c};
660         confess "internal error ($l $c)" if $l && !ref $l;
661         printdebug"C $c ".(defined $l ?
662                            join " ", map { messagequote "'$_'" } @$l :
663                            "undef")."\n"
664             if $debuglevel >= 4;
665         $l or next;
666         @$l==1 or badcfg "multiple values for $c".
667             " (in $src git config)" if @$l > 1;
668         return $l->[0];
669     }
670     return undef;
671 }
672
673 sub cfg {
674     foreach my $c (@_) {
675         return undef if $c =~ /RETURN-UNDEF/;
676         printdebug "C? $c\n" if $debuglevel >= 5;
677         my $v = git_get_config($c);
678         return $v if defined $v;
679         my $dv = $defcfg{$c};
680         if (defined $dv) {
681             printdebug "CD $c $dv\n" if $debuglevel >= 4;
682             return $dv;
683         }
684     }
685     badcfg "need value for one of: @_\n".
686         "$us: distro or suite appears not to be (properly) supported";
687 }
688
689 sub not_necessarily_a_tree () {
690     # needs to be called from pre_*
691     @gitcfgsources = grep { $_ ne 'local' } @gitcfgsources;
692     $invoked_in_git_tree = 0;
693 }
694
695 sub access_basedistro__noalias () {
696     if (defined $idistro) {
697         return $idistro;
698     } else {    
699         my $def = cfg("dgit-suite.$isuite.distro", 'RETURN-UNDEF');
700         return $def if defined $def;
701         foreach my $src (@gitcfgsources, 'internal') {
702             my $kl = $src eq 'internal' ? \%defcfg : $gitcfgs{$src};
703             next unless $kl;
704             foreach my $k (keys %$kl) {
705                 next unless $k =~ m#^dgit-suite\.(.*)\.distro$#;
706                 my $dpat = $1;
707                 next unless match_glob $dpat, $isuite;
708                 return $kl->{$k};
709             }
710         }
711         return cfg("dgit.default.distro");
712     }
713 }
714
715 sub access_basedistro () {
716     my $noalias = access_basedistro__noalias();
717     my $canon = cfg("dgit-distro.$noalias.alias-canon",'RETURN-UNDEF');
718     return $canon // $noalias;
719 }
720
721 sub access_nomdistro () {
722     my $base = access_basedistro();
723     my $r = cfg("dgit-distro.$base.nominal-distro",'RETURN-UNDEF') // $base;
724     $r =~ m/^$distro_re$/ or badcfg
725  "bad syntax for (nominal) distro \`$r' (does not match /^$distro_re$/)";
726     return $r;
727 }
728
729 sub access_quirk () {
730     # returns (quirk name, distro to use instead or undef, quirk-specific info)
731     my $basedistro = access_basedistro();
732     my $backports_quirk = cfg("dgit-distro.$basedistro.backports-quirk",
733                               'RETURN-UNDEF');
734     if (defined $backports_quirk) {
735         my $re = $backports_quirk;
736         $re =~ s/[^-0-9a-z_\%*()]/\\$&/ig;
737         $re =~ s/\*/.*/g;
738         $re =~ s/\%/([-0-9a-z_]+)/
739             or $re =~ m/[()]/ or badcfg "backports-quirk needs \% or ( )";
740         if ($isuite =~ m/^$re$/) {
741             return ('backports',"$basedistro-backports",$1);
742         }
743     }
744     return ('none',undef);
745 }
746
747 our $access_forpush;
748
749 sub parse_cfg_bool ($$$) {
750     my ($what,$def,$v) = @_;
751     $v //= $def;
752     return
753         $v =~ m/^[ty1]/ ? 1 :
754         $v =~ m/^[fn0]/ ? 0 :
755         badcfg "$what needs t (true, y, 1) or f (false, n, 0) not \`$v'";
756 }       
757
758 sub access_forpush_config () {
759     my $d = access_basedistro();
760
761     return 1 if
762         $new_package &&
763         parse_cfg_bool('new-private-pushers', 0,
764                        cfg("dgit-distro.$d.new-private-pushers",
765                            'RETURN-UNDEF'));
766
767     my $v = cfg("dgit-distro.$d.readonly", 'RETURN-UNDEF');
768     $v //= 'a';
769     return
770         $v =~ m/^[ty1]/ ? 0 : # force readonly,    forpush = 0
771         $v =~ m/^[fn0]/ ? 1 : # force nonreadonly, forpush = 1
772         $v =~ m/^[a]/  ? '' : # auto,              forpush = ''
773         badcfg "readonly needs t (true, y, 1) or f (false, n, 0) or a (auto)";
774 }
775
776 sub access_forpush () {
777     $access_forpush //= access_forpush_config();
778     return $access_forpush;
779 }
780
781 sub pushing () {
782     die "$access_forpush ?" if ($access_forpush // 1) ne 1;
783     badcfg "pushing but distro is configured readonly"
784         if access_forpush_config() eq '0';
785     $access_forpush = 1;
786     $supplementary_message = <<'END' unless $we_are_responder;
787 Push failed, before we got started.
788 You can retry the push, after fixing the problem, if you like.
789 END
790     parseopts_late_defaults();
791 }
792
793 sub notpushing () {
794     parseopts_late_defaults();
795 }
796
797 sub supplementary_message ($) {
798     my ($msg) = @_;
799     if (!$we_are_responder) {
800         $supplementary_message = $msg;
801         return;
802     } elsif ($protovsn >= 3) {
803         responder_send_command "supplementary-message ".length($msg)
804             or die $!;
805         print PO $msg or die $!;
806     }
807 }
808
809 sub access_distros () {
810     # Returns list of distros to try, in order
811     #
812     # We want to try:
813     #    0. `instead of' distro name(s) we have been pointed to
814     #    1. the access_quirk distro, if any
815     #    2a. the user's specified distro, or failing that  } basedistro
816     #    2b. the distro calculated from the suite          }
817     my @l = access_basedistro();
818
819     my (undef,$quirkdistro) = access_quirk();
820     unshift @l, $quirkdistro;
821     unshift @l, $instead_distro;
822     @l = grep { defined } @l;
823
824     push @l, access_nomdistro();
825
826     if (access_forpush()) {
827         @l = map { ("$_/push", $_) } @l;
828     }
829     @l;
830 }
831
832 sub access_cfg_cfgs (@) {
833     my (@keys) = @_;
834     my @cfgs;
835     # The nesting of these loops determines the search order.  We put
836     # the key loop on the outside so that we search all the distros
837     # for each key, before going on to the next key.  That means that
838     # if access_cfg is called with a more specific, and then a less
839     # specific, key, an earlier distro can override the less specific
840     # without necessarily overriding any more specific keys.  (If the
841     # distro wants to override the more specific keys it can simply do
842     # so; whereas if we did the loop the other way around, it would be
843     # impossible to for an earlier distro to override a less specific
844     # key but not the more specific ones without restating the unknown
845     # values of the more specific keys.
846     my @realkeys;
847     my @rundef;
848     # We have to deal with RETURN-UNDEF specially, so that we don't
849     # terminate the search prematurely.
850     foreach (@keys) {
851         if (m/RETURN-UNDEF/) { push @rundef, $_; last; }
852         push @realkeys, $_
853     }
854     foreach my $d (access_distros()) {
855         push @cfgs, map { "dgit-distro.$d.$_" } @realkeys;
856     }
857     push @cfgs, map { "dgit.default.$_" } @realkeys;
858     push @cfgs, @rundef;
859     return @cfgs;
860 }
861
862 sub access_cfg (@) {
863     my (@keys) = @_;
864     my (@cfgs) = access_cfg_cfgs(@keys);
865     my $value = cfg(@cfgs);
866     return $value;
867 }
868
869 sub access_cfg_bool ($$) {
870     my ($def, @keys) = @_;
871     parse_cfg_bool($keys[0], $def, access_cfg(@keys, 'RETURN-UNDEF'));
872 }
873
874 sub string_to_ssh ($) {
875     my ($spec) = @_;
876     if ($spec =~ m/\s/) {
877         return qw(sh -ec), 'exec '.$spec.' "$@"', 'x';
878     } else {
879         return ($spec);
880     }
881 }
882
883 sub access_cfg_ssh () {
884     my $gitssh = access_cfg('ssh', 'RETURN-UNDEF');
885     if (!defined $gitssh) {
886         return @ssh;
887     } else {
888         return string_to_ssh $gitssh;
889     }
890 }
891
892 sub access_runeinfo ($) {
893     my ($info) = @_;
894     return ": dgit ".access_basedistro()." $info ;";
895 }
896
897 sub access_someuserhost ($) {
898     my ($some) = @_;
899     my $user = access_cfg("$some-user-force", 'RETURN-UNDEF');
900     defined($user) && length($user) or
901         $user = access_cfg("$some-user",'username');
902     my $host = access_cfg("$some-host");
903     return length($user) ? "$user\@$host" : $host;
904 }
905
906 sub access_gituserhost () {
907     return access_someuserhost('git');
908 }
909
910 sub access_giturl (;$) {
911     my ($optional) = @_;
912     my $url = access_cfg('git-url','RETURN-UNDEF');
913     my $suffix;
914     if (!length $url) {
915         my $proto = access_cfg('git-proto', 'RETURN-UNDEF');
916         return undef unless defined $proto;
917         $url =
918             $proto.
919             access_gituserhost().
920             access_cfg('git-path');
921     } else {
922         $suffix = access_cfg('git-url-suffix','RETURN-UNDEF');
923     }
924     $suffix //= '.git';
925     return "$url/$package$suffix";
926 }              
927
928 sub parsecontrolfh ($$;$) {
929     my ($fh, $desc, $allowsigned) = @_;
930     our $dpkgcontrolhash_noissigned;
931     my $c;
932     for (;;) {
933         my %opts = ('name' => $desc);
934         $opts{allow_pgp}= $allowsigned || !$dpkgcontrolhash_noissigned;
935         $c = Dpkg::Control::Hash->new(%opts);
936         $c->parse($fh,$desc) or die "parsing of $desc failed";
937         last if $allowsigned;
938         last if $dpkgcontrolhash_noissigned;
939         my $issigned= $c->get_option('is_pgp_signed');
940         if (!defined $issigned) {
941             $dpkgcontrolhash_noissigned= 1;
942             seek $fh, 0,0 or die "seek $desc: $!";
943         } elsif ($issigned) {
944             fail "control file $desc is (already) PGP-signed. ".
945                 " Note that dgit push needs to modify the .dsc and then".
946                 " do the signature itself";
947         } else {
948             last;
949         }
950     }
951     return $c;
952 }
953
954 sub parsecontrol {
955     my ($file, $desc, $allowsigned) = @_;
956     my $fh = new IO::Handle;
957     open $fh, '<', $file or die "$file: $!";
958     my $c = parsecontrolfh($fh,$desc,$allowsigned);
959     $fh->error and die $!;
960     close $fh;
961     return $c;
962 }
963
964 sub getfield ($$) {
965     my ($dctrl,$field) = @_;
966     my $v = $dctrl->{$field};
967     return $v if defined $v;
968     fail "missing field $field in ".$dctrl->get_option('name');
969 }
970
971 sub parsechangelog {
972     my $c = Dpkg::Control::Hash->new(name => 'parsed changelog');
973     my $p = new IO::Handle;
974     my @cmd = (qw(dpkg-parsechangelog), @_);
975     open $p, '-|', @cmd or die $!;
976     $c->parse($p);
977     $?=0; $!=0; close $p or failedcmd @cmd;
978     return $c;
979 }
980
981 sub commit_getclogp ($) {
982     # Returns the parsed changelog hashref for a particular commit
983     my ($objid) = @_;
984     our %commit_getclogp_memo;
985     my $memo = $commit_getclogp_memo{$objid};
986     return $memo if $memo;
987     
988     my $mclog = dgit_privdir()."clog-$objid";
989     runcmd shell_cmd "exec >$mclog", @git, qw(cat-file blob),
990         "$objid:debian/changelog";
991     $commit_getclogp_memo{$objid} = parsechangelog("-l$mclog");
992 }
993
994 sub parse_dscdata () {
995     my $dscfh = new IO::File \$dscdata, '<' or die $!;
996     printdebug Dumper($dscdata) if $debuglevel>1;
997     $dsc = parsecontrolfh($dscfh,$dscurl,1);
998     printdebug Dumper($dsc) if $debuglevel>1;
999 }
1000
1001 our %rmad;
1002
1003 sub archive_query ($;@) {
1004     my ($method) = shift @_;
1005     fail "this operation does not support multiple comma-separated suites"
1006         if $isuite =~ m/,/;
1007     my $query = access_cfg('archive-query','RETURN-UNDEF');
1008     $query =~ s/^(\w+):// or badcfg "invalid archive-query method \`$query'";
1009     my $proto = $1;
1010     my $data = $'; #';
1011     { no strict qw(refs); &{"${method}_${proto}"}($proto,$data,@_); }
1012 }
1013
1014 sub archive_query_prepend_mirror {
1015     my $m = access_cfg('mirror');
1016     return map { [ $_->[0], $m.$_->[1], @$_[2..$#$_] ] } @_;
1017 }
1018
1019 sub pool_dsc_subpath ($$) {
1020     my ($vsn,$component) = @_; # $package is implict arg
1021     my $prefix = substr($package, 0, $package =~ m/^l/ ? 4 : 1);
1022     return "/pool/$component/$prefix/$package/".dscfn($vsn);
1023 }
1024
1025 sub cfg_apply_map ($$$) {
1026     my ($varref, $what, $mapspec) = @_;
1027     return unless $mapspec;
1028
1029     printdebug "config $what EVAL{ $mapspec; }\n";
1030     $_ = $$varref;
1031     eval "package Dgit::Config; $mapspec;";
1032     die $@ if $@;
1033     $$varref = $_;
1034 }
1035
1036 #---------- `ftpmasterapi' archive query method (nascent) ----------
1037
1038 sub archive_api_query_cmd ($) {
1039     my ($subpath) = @_;
1040     my @cmd = (@curl, qw(-sS));
1041     my $url = access_cfg('archive-query-url');
1042     if ($url =~ m#^https://([-.0-9a-z]+)/#) {
1043         my $host = $1;
1044         my $keys = access_cfg('archive-query-tls-key','RETURN-UNDEF') //'';
1045         foreach my $key (split /\:/, $keys) {
1046             $key =~ s/\%HOST\%/$host/g;
1047             if (!stat $key) {
1048                 fail "for $url: stat $key: $!" unless $!==ENOENT;
1049                 next;
1050             }
1051             fail "config requested specific TLS key but do not know".
1052                 " how to get curl to use exactly that EE key ($key)";
1053 #           push @cmd, "--cacert", $key, "--capath", "/dev/enoent";
1054 #           # Sadly the above line does not work because of changes
1055 #           # to gnutls.   The real fix for #790093 may involve
1056 #           # new curl options.
1057             last;
1058         }
1059         # Fixing #790093 properly will involve providing a value
1060         # for this on clients.
1061         my $kargs = access_cfg('archive-query-tls-curl-ca-args','RETURN-UNDEF');
1062         push @cmd, split / /, $kargs if defined $kargs;
1063     }
1064     push @cmd, $url.$subpath;
1065     return @cmd;
1066 }
1067
1068 sub api_query ($$;$) {
1069     use JSON;
1070     my ($data, $subpath, $ok404) = @_;
1071     badcfg "ftpmasterapi archive query method takes no data part"
1072         if length $data;
1073     my @cmd = archive_api_query_cmd($subpath);
1074     my $url = $cmd[$#cmd];
1075     push @cmd, qw(-w %{http_code});
1076     my $json = cmdoutput @cmd;
1077     unless ($json =~ s/\d+\d+\d$//) {
1078         failedcmd_report_cmd undef, @cmd;
1079         fail "curl failed to print 3-digit HTTP code";
1080     }
1081     my $code = $&;
1082     return undef if $code eq '404' && $ok404;
1083     fail "fetch of $url gave HTTP code $code"
1084         unless $url =~ m#^file://# or $code =~ m/^2/;
1085     return decode_json($json);
1086 }
1087
1088 sub canonicalise_suite_ftpmasterapi {
1089     my ($proto,$data) = @_;
1090     my $suites = api_query($data, 'suites');
1091     my @matched;
1092     foreach my $entry (@$suites) {
1093         next unless grep { 
1094             my $v = $entry->{$_};
1095             defined $v && $v eq $isuite;
1096         } qw(codename name);
1097         push @matched, $entry;
1098     }
1099     fail "unknown suite $isuite" unless @matched;
1100     my $cn;
1101     eval {
1102         @matched==1 or die "multiple matches for suite $isuite\n";
1103         $cn = "$matched[0]{codename}";
1104         defined $cn or die "suite $isuite info has no codename\n";
1105         $cn =~ m/^$suite_re$/ or die "suite $isuite maps to bad codename\n";
1106     };
1107     die "bad ftpmaster api response: $@\n".Dumper(\@matched)
1108         if length $@;
1109     return $cn;
1110 }
1111
1112 sub archive_query_ftpmasterapi {
1113     my ($proto,$data) = @_;
1114     my $info = api_query($data, "dsc_in_suite/$isuite/$package");
1115     my @rows;
1116     my $digester = Digest::SHA->new(256);
1117     foreach my $entry (@$info) {
1118         eval {
1119             my $vsn = "$entry->{version}";
1120             my ($ok,$msg) = version_check $vsn;
1121             die "bad version: $msg\n" unless $ok;
1122             my $component = "$entry->{component}";
1123             $component =~ m/^$component_re$/ or die "bad component";
1124             my $filename = "$entry->{filename}";
1125             $filename && $filename !~ m#[^-+:._~0-9a-zA-Z/]|^[/.]|/[/.]#
1126                 or die "bad filename";
1127             my $sha256sum = "$entry->{sha256sum}";
1128             $sha256sum =~ m/^[0-9a-f]+$/ or die "bad sha256sum";
1129             push @rows, [ $vsn, "/pool/$component/$filename",
1130                           $digester, $sha256sum ];
1131         };
1132         die "bad ftpmaster api response: $@\n".Dumper($entry)
1133             if length $@;
1134     }
1135     @rows = sort { -version_compare($a->[0],$b->[0]) } @rows;
1136     return archive_query_prepend_mirror @rows;
1137 }
1138
1139 sub file_in_archive_ftpmasterapi {
1140     my ($proto,$data,$filename) = @_;
1141     my $pat = $filename;
1142     $pat =~ s/_/\\_/g;
1143     $pat = "%/$pat";
1144     $pat =~ s#[^-+_.0-9a-z/]# sprintf '%%%02x', ord $& #ge;
1145     my $info = api_query($data, "file_in_archive/$pat", 1);
1146 }
1147
1148 #---------- `aptget' archive query method ----------
1149
1150 our $aptget_base;
1151 our $aptget_releasefile;
1152 our $aptget_configpath;
1153
1154 sub aptget_aptget   () { return @aptget,   qw(-c), $aptget_configpath; }
1155 sub aptget_aptcache () { return @aptcache, qw(-c), $aptget_configpath; }
1156
1157 sub aptget_cache_clean {
1158     runcmd_ordryrun_local qw(sh -ec),
1159         'cd "$1"; find -atime +30 -type f -print0 | xargs -0r rm --',
1160         'x', $aptget_base;
1161 }
1162
1163 sub aptget_lock_acquire () {
1164     my $lockfile = "$aptget_base/lock";
1165     open APTGET_LOCK, '>', $lockfile or die "open $lockfile: $!";
1166     flock APTGET_LOCK, LOCK_EX or die "lock $lockfile: $!";
1167 }
1168
1169 sub aptget_prep ($) {
1170     my ($data) = @_;
1171     return if defined $aptget_base;
1172
1173     badcfg "aptget archive query method takes no data part"
1174         if length $data;
1175
1176     my $cache = $ENV{XDG_CACHE_DIR} // "$ENV{HOME}/.cache";
1177
1178     ensuredir $cache;
1179     ensuredir "$cache/dgit";
1180     my $cachekey =
1181         access_cfg('aptget-cachekey','RETURN-UNDEF')
1182         // access_nomdistro();
1183
1184     $aptget_base = "$cache/dgit/aptget";
1185     ensuredir $aptget_base;
1186
1187     my $quoted_base = $aptget_base;
1188     die "$quoted_base contains bad chars, cannot continue"
1189         if $quoted_base =~ m/["\\]/; # apt.conf(5) says no escaping :-/
1190
1191     ensuredir $aptget_base;
1192
1193     aptget_lock_acquire();
1194
1195     aptget_cache_clean();
1196
1197     $aptget_configpath = "$aptget_base/apt.conf#$cachekey";
1198     my $sourceslist = "source.list#$cachekey";
1199
1200     my $aptsuites = $isuite;
1201     cfg_apply_map(\$aptsuites, 'suite map',
1202                   access_cfg('aptget-suite-map', 'RETURN-UNDEF'));
1203
1204     open SRCS, ">", "$aptget_base/$sourceslist" or die $!;
1205     printf SRCS "deb-src %s %s %s\n",
1206         access_cfg('mirror'),
1207         $aptsuites,
1208         access_cfg('aptget-components')
1209         or die $!;
1210
1211     ensuredir "$aptget_base/cache";
1212     ensuredir "$aptget_base/lists";
1213
1214     open CONF, ">", $aptget_configpath or die $!;
1215     print CONF <<END;
1216 Debug::NoLocking "true";
1217 APT::Get::List-Cleanup "false";
1218 #clear APT::Update::Post-Invoke-Success;
1219 Dir::Etc::SourceList "$quoted_base/$sourceslist";
1220 Dir::State::Lists "$quoted_base/lists";
1221 Dir::Etc::preferences "$quoted_base/preferences";
1222 Dir::Cache::srcpkgcache "$quoted_base/cache/srcs#$cachekey";
1223 Dir::Cache::pkgcache "$quoted_base/cache/pkgs#$cachekey";
1224 END
1225
1226     foreach my $key (qw(
1227                         Dir::Cache
1228                         Dir::State
1229                         Dir::Cache::Archives
1230                         Dir::Etc::SourceParts
1231                         Dir::Etc::preferencesparts
1232                       )) {
1233         ensuredir "$aptget_base/$key";
1234         print CONF "$key \"$quoted_base/$key\";\n" or die $!;
1235     };
1236
1237     my $oldatime = (time // die $!) - 1;
1238     foreach my $oldlist (<$aptget_base/lists/*Release>) {
1239         next unless stat_exists $oldlist;
1240         my ($mtime) = (stat _)[9];
1241         utime $oldatime, $mtime, $oldlist or die "$oldlist $!";
1242     }
1243
1244     runcmd_ordryrun_local aptget_aptget(), qw(update);
1245
1246     my @releasefiles;
1247     foreach my $oldlist (<$aptget_base/lists/*Release>) {
1248         next unless stat_exists $oldlist;
1249         my ($atime) = (stat _)[8];
1250         next if $atime == $oldatime;
1251         push @releasefiles, $oldlist;
1252     }
1253     my @inreleasefiles = grep { m#/InRelease$# } @releasefiles;
1254     @releasefiles = @inreleasefiles if @inreleasefiles;
1255     die "apt updated wrong number of Release files (@releasefiles), erk"
1256         unless @releasefiles == 1;
1257
1258     ($aptget_releasefile) = @releasefiles;
1259 }
1260
1261 sub canonicalise_suite_aptget {
1262     my ($proto,$data) = @_;
1263     aptget_prep($data);
1264
1265     my $release = parsecontrol $aptget_releasefile, "Release file", 1;
1266
1267     foreach my $name (qw(Codename Suite)) {
1268         my $val = $release->{$name};
1269         if (defined $val) {
1270             printdebug "release file $name: $val\n";
1271             $val =~ m/^$suite_re$/o or fail
1272  "Release file ($aptget_releasefile) specifies intolerable $name";
1273             cfg_apply_map(\$val, 'suite rmap',
1274                           access_cfg('aptget-suite-rmap', 'RETURN-UNDEF'));
1275             return $val
1276         }
1277     }
1278     return $isuite;
1279 }
1280
1281 sub archive_query_aptget {
1282     my ($proto,$data) = @_;
1283     aptget_prep($data);
1284
1285     ensuredir "$aptget_base/source";
1286     foreach my $old (<$aptget_base/source/*.dsc>) {
1287         unlink $old or die "$old: $!";
1288     }
1289
1290     my $showsrc = cmdoutput aptget_aptcache(), qw(showsrc), $package;
1291     return () unless $showsrc =~ m/^package:\s*\Q$package\E\s*$/mi;
1292     # avoids apt-get source failing with ambiguous error code
1293
1294     runcmd_ordryrun_local
1295         shell_cmd 'cd "$1"/source; shift', $aptget_base,
1296         aptget_aptget(), qw(--download-only --only-source source), $package;
1297
1298     my @dscs = <$aptget_base/source/*.dsc>;
1299     fail "apt-get source did not produce a .dsc" unless @dscs;
1300     fail "apt-get source produced several .dscs (@dscs)" unless @dscs==1;
1301
1302     my $pre_dsc = parsecontrol $dscs[0], $dscs[0], 1;
1303
1304     use URI::Escape;
1305     my $uri = "file://". uri_escape $dscs[0];
1306     $uri =~ s{\%2f}{/}gi;
1307     return [ (getfield $pre_dsc, 'Version'), $uri ];
1308 }
1309
1310 sub file_in_archive_aptget () { return undef; }
1311
1312 #---------- `dummyapicat' archive query method ----------
1313
1314 sub archive_query_dummycatapi { archive_query_ftpmasterapi @_; }
1315 sub canonicalise_suite_dummycatapi { canonicalise_suite_ftpmasterapi @_; }
1316
1317 sub file_in_archive_dummycatapi ($$$) {
1318     my ($proto,$data,$filename) = @_;
1319     my $mirror = access_cfg('mirror');
1320     $mirror =~ s#^file://#/# or die "$mirror ?";
1321     my @out;
1322     my @cmd = (qw(sh -ec), '
1323             cd "$1"
1324             find -name "$2" -print0 |
1325             xargs -0r sha256sum
1326         ', qw(x), $mirror, $filename);
1327     debugcmd "-|", @cmd;
1328     open FIA, "-|", @cmd or die $!;
1329     while (<FIA>) {
1330         chomp or die;
1331         printdebug "| $_\n";
1332         m/^(\w+)  (\S+)$/ or die "$_ ?";
1333         push @out, { sha256sum => $1, filename => $2 };
1334     }
1335     close FIA or die failedcmd @cmd;
1336     return \@out;
1337 }
1338
1339 #---------- `madison' archive query method ----------
1340
1341 sub archive_query_madison {
1342     return archive_query_prepend_mirror
1343         map { [ @$_[0..1] ] } madison_get_parse(@_);
1344 }
1345
1346 sub madison_get_parse {
1347     my ($proto,$data) = @_;
1348     die unless $proto eq 'madison';
1349     if (!length $data) {
1350         $data= access_cfg('madison-distro','RETURN-UNDEF');
1351         $data //= access_basedistro();
1352     }
1353     $rmad{$proto,$data,$package} ||= cmdoutput
1354         qw(rmadison -asource),"-s$isuite","-u$data",$package;
1355     my $rmad = $rmad{$proto,$data,$package};
1356
1357     my @out;
1358     foreach my $l (split /\n/, $rmad) {
1359         $l =~ m{^ \s*( [^ \t|]+ )\s* \|
1360                   \s*( [^ \t|]+ )\s* \|
1361                   \s*( [^ \t|/]+ )(?:/([^ \t|/]+))? \s* \|
1362                   \s*( [^ \t|]+ )\s* }x or die "$rmad ?";
1363         $1 eq $package or die "$rmad $package ?";
1364         my $vsn = $2;
1365         my $newsuite = $3;
1366         my $component;
1367         if (defined $4) {
1368             $component = $4;
1369         } else {
1370             $component = access_cfg('archive-query-default-component');
1371         }
1372         $5 eq 'source' or die "$rmad ?";
1373         push @out, [$vsn,pool_dsc_subpath($vsn,$component),$newsuite];
1374     }
1375     return sort { -version_compare($a->[0],$b->[0]); } @out;
1376 }
1377
1378 sub canonicalise_suite_madison {
1379     # madison canonicalises for us
1380     my @r = madison_get_parse(@_);
1381     @r or fail
1382         "unable to canonicalise suite using package $package".
1383         " which does not appear to exist in suite $isuite;".
1384         " --existing-package may help";
1385     return $r[0][2];
1386 }
1387
1388 sub file_in_archive_madison { return undef; }
1389
1390 #---------- `sshpsql' archive query method ----------
1391
1392 sub sshpsql ($$$) {
1393     my ($data,$runeinfo,$sql) = @_;
1394     if (!length $data) {
1395         $data= access_someuserhost('sshpsql').':'.
1396             access_cfg('sshpsql-dbname');
1397     }
1398     $data =~ m/:/ or badcfg "invalid sshpsql method string \`$data'";
1399     my ($userhost,$dbname) = ($`,$'); #';
1400     my @rows;
1401     my @cmd = (access_cfg_ssh, $userhost,
1402                access_runeinfo("ssh-psql $runeinfo").
1403                " export LC_MESSAGES=C; export LC_CTYPE=C;".
1404                " ".shellquote qw(psql -A), $dbname, qw(-c), $sql);
1405     debugcmd "|",@cmd;
1406     open P, "-|", @cmd or die $!;
1407     while (<P>) {
1408         chomp or die;
1409         printdebug(">|$_|\n");
1410         push @rows, $_;
1411     }
1412     $!=0; $?=0; close P or failedcmd @cmd;
1413     @rows or die;
1414     my $nrows = pop @rows;
1415     $nrows =~ s/^\((\d+) rows?\)$/$1/ or die "$nrows ?";
1416     @rows == $nrows+1 or die "$nrows ".(scalar @rows)." ?";
1417     @rows = map { [ split /\|/, $_ ] } @rows;
1418     my $ncols = scalar @{ shift @rows };
1419     die if grep { scalar @$_ != $ncols } @rows;
1420     return @rows;
1421 }
1422
1423 sub sql_injection_check {
1424     foreach (@_) { die "$_ $& ?" if m{[^-+=:_.,/0-9a-zA-Z]}; }
1425 }
1426
1427 sub archive_query_sshpsql ($$) {
1428     my ($proto,$data) = @_;
1429     sql_injection_check $isuite, $package;
1430     my @rows = sshpsql($data, "archive-query $isuite $package", <<END);
1431         SELECT source.version, component.name, files.filename, files.sha256sum
1432           FROM source
1433           JOIN src_associations ON source.id = src_associations.source
1434           JOIN suite ON suite.id = src_associations.suite
1435           JOIN dsc_files ON dsc_files.source = source.id
1436           JOIN files_archive_map ON files_archive_map.file_id = dsc_files.file
1437           JOIN component ON component.id = files_archive_map.component_id
1438           JOIN files ON files.id = dsc_files.file
1439          WHERE ( suite.suite_name='$isuite' OR suite.codename='$isuite' )
1440            AND source.source='$package'
1441            AND files.filename LIKE '%.dsc';
1442 END
1443     @rows = sort { -version_compare($a->[0],$b->[0]) } @rows;
1444     my $digester = Digest::SHA->new(256);
1445     @rows = map {
1446         my ($vsn,$component,$filename,$sha256sum) = @$_;
1447         [ $vsn, "/pool/$component/$filename",$digester,$sha256sum ];
1448     } @rows;
1449     return archive_query_prepend_mirror @rows;
1450 }
1451
1452 sub canonicalise_suite_sshpsql ($$) {
1453     my ($proto,$data) = @_;
1454     sql_injection_check $isuite;
1455     my @rows = sshpsql($data, "canonicalise-suite $isuite", <<END);
1456         SELECT suite.codename
1457           FROM suite where suite_name='$isuite' or codename='$isuite';
1458 END
1459     @rows = map { $_->[0] } @rows;
1460     fail "unknown suite $isuite" unless @rows;
1461     die "ambiguous $isuite: @rows ?" if @rows>1;
1462     return $rows[0];
1463 }
1464
1465 sub file_in_archive_sshpsql ($$$) { return undef; }
1466
1467 #---------- `dummycat' archive query method ----------
1468
1469 sub canonicalise_suite_dummycat ($$) {
1470     my ($proto,$data) = @_;
1471     my $dpath = "$data/suite.$isuite";
1472     if (!open C, "<", $dpath) {
1473         $!==ENOENT or die "$dpath: $!";
1474         printdebug "dummycat canonicalise_suite $isuite $dpath ENOENT\n";
1475         return $isuite;
1476     }
1477     $!=0; $_ = <C>;
1478     chomp or die "$dpath: $!";
1479     close C;
1480     printdebug "dummycat canonicalise_suite $isuite $dpath = $_\n";
1481     return $_;
1482 }
1483
1484 sub archive_query_dummycat ($$) {
1485     my ($proto,$data) = @_;
1486     canonicalise_suite();
1487     my $dpath = "$data/package.$csuite.$package";
1488     if (!open C, "<", $dpath) {
1489         $!==ENOENT or die "$dpath: $!";
1490         printdebug "dummycat query $csuite $package $dpath ENOENT\n";
1491         return ();
1492     }
1493     my @rows;
1494     while (<C>) {
1495         next if m/^\#/;
1496         next unless m/\S/;
1497         die unless chomp;
1498         printdebug "dummycat query $csuite $package $dpath | $_\n";
1499         my @row = split /\s+/, $_;
1500         @row==2 or die "$dpath: $_ ?";
1501         push @rows, \@row;
1502     }
1503     C->error and die "$dpath: $!";
1504     close C;
1505     return archive_query_prepend_mirror
1506         sort { -version_compare($a->[0],$b->[0]); } @rows;
1507 }
1508
1509 sub file_in_archive_dummycat () { return undef; }
1510
1511 #---------- tag format handling ----------
1512
1513 sub access_cfg_tagformats () {
1514     split /\,/, access_cfg('dgit-tag-format');
1515 }
1516
1517 sub access_cfg_tagformats_can_splitbrain () {
1518     my %y = map { $_ => 1 } access_cfg_tagformats;
1519     foreach my $needtf (qw(new maint)) {
1520         next if $y{$needtf};
1521         return 0;
1522     }
1523     return 1;
1524 }
1525
1526 sub need_tagformat ($$) {
1527     my ($fmt, $why) = @_;
1528     fail "need to use tag format $fmt ($why) but also need".
1529         " to use tag format $tagformat_want->[0] ($tagformat_want->[1])".
1530         " - no way to proceed"
1531         if $tagformat_want && $tagformat_want->[0] ne $fmt;
1532     $tagformat_want = [$fmt, $why, $tagformat_want->[2] // 0];
1533 }
1534
1535 sub select_tagformat () {
1536     # sets $tagformatfn
1537     return if $tagformatfn && !$tagformat_want;
1538     die 'bug' if $tagformatfn && $tagformat_want;
1539     # ... $tagformat_want assigned after previous select_tagformat
1540
1541     my (@supported) = grep { $_ =~ m/^(?:old|new)$/ } access_cfg_tagformats();
1542     printdebug "select_tagformat supported @supported\n";
1543
1544     $tagformat_want //= [ $supported[0], "distro access configuration", 0 ];
1545     printdebug "select_tagformat specified @$tagformat_want\n";
1546
1547     my ($fmt,$why,$override) = @$tagformat_want;
1548
1549     fail "target distro supports tag formats @supported".
1550         " but have to use $fmt ($why)"
1551         unless $override
1552             or grep { $_ eq $fmt } @supported;
1553
1554     $tagformat_want = undef;
1555     $tagformat = $fmt;
1556     $tagformatfn = ${*::}{"debiantag_$fmt"};
1557
1558     fail "trying to use unknown tag format \`$fmt' ($why) !"
1559         unless $tagformatfn;
1560 }
1561
1562 #---------- archive query entrypoints and rest of program ----------
1563
1564 sub canonicalise_suite () {
1565     return if defined $csuite;
1566     fail "cannot operate on $isuite suite" if $isuite eq 'UNRELEASED';
1567     $csuite = archive_query('canonicalise_suite');
1568     if ($isuite ne $csuite) {
1569         progress "canonical suite name for $isuite is $csuite";
1570     } else {
1571         progress "canonical suite name is $csuite";
1572     }
1573 }
1574
1575 sub get_archive_dsc () {
1576     canonicalise_suite();
1577     my @vsns = archive_query('archive_query');
1578     foreach my $vinfo (@vsns) {
1579         my ($vsn,$vsn_dscurl,$digester,$digest) = @$vinfo;
1580         $dscurl = $vsn_dscurl;
1581         $dscdata = url_get($dscurl);
1582         if (!$dscdata) {
1583             $skew_warning_vsn = $vsn if !defined $skew_warning_vsn;
1584             next;
1585         }
1586         if ($digester) {
1587             $digester->reset();
1588             $digester->add($dscdata);
1589             my $got = $digester->hexdigest();
1590             $got eq $digest or
1591                 fail "$dscurl has hash $got but".
1592                     " archive told us to expect $digest";
1593         }
1594         parse_dscdata();
1595         my $fmt = getfield $dsc, 'Format';
1596         $format_ok{$fmt} or forceable_fail [qw(unsupported-source-format)],
1597             "unsupported source format $fmt, sorry";
1598             
1599         $dsc_checked = !!$digester;
1600         printdebug "get_archive_dsc: Version ".(getfield $dsc, 'Version')."\n";
1601         return;
1602     }
1603     $dsc = undef;
1604     printdebug "get_archive_dsc: nothing in archive, returning undef\n";
1605 }
1606
1607 sub check_for_git ();
1608 sub check_for_git () {
1609     # returns 0 or 1
1610     my $how = access_cfg('git-check');
1611     if ($how eq 'ssh-cmd') {
1612         my @cmd =
1613             (access_cfg_ssh, access_gituserhost(),
1614              access_runeinfo("git-check $package").
1615              " set -e; cd ".access_cfg('git-path').";".
1616              " if test -d $package.git; then echo 1; else echo 0; fi");
1617         my $r= cmdoutput @cmd;
1618         if (defined $r and $r =~ m/^divert (\w+)$/) {
1619             my $divert=$1;
1620             my ($usedistro,) = access_distros();
1621             # NB that if we are pushing, $usedistro will be $distro/push
1622             $instead_distro= cfg("dgit-distro.$usedistro.diverts.$divert");
1623             $instead_distro =~ s{^/}{ access_basedistro()."/" }e;
1624             progress "diverting to $divert (using config for $instead_distro)";
1625             return check_for_git();
1626         }
1627         failedcmd @cmd unless defined $r and $r =~ m/^[01]$/;
1628         return $r+0;
1629     } elsif ($how eq 'url') {
1630         my $prefix = access_cfg('git-check-url','git-url');
1631         my $suffix = access_cfg('git-check-suffix','git-suffix',
1632                                 'RETURN-UNDEF') // '.git';
1633         my $url = "$prefix/$package$suffix";
1634         my @cmd = (@curl, qw(-sS -I), $url);
1635         my $result = cmdoutput @cmd;
1636         $result =~ s/^\S+ 200 .*\n\r?\n//;
1637         # curl -sS -I with https_proxy prints
1638         # HTTP/1.0 200 Connection established
1639         $result =~ m/^\S+ (404|200) /s or
1640             fail "unexpected results from git check query - ".
1641                 Dumper($prefix, $result);
1642         my $code = $1;
1643         if ($code eq '404') {
1644             return 0;
1645         } elsif ($code eq '200') {
1646             return 1;
1647         } else {
1648             die;
1649         }
1650     } elsif ($how eq 'true') {
1651         return 1;
1652     } elsif ($how eq 'false') {
1653         return 0;
1654     } else {
1655         badcfg "unknown git-check \`$how'";
1656     }
1657 }
1658
1659 sub create_remote_git_repo () {
1660     my $how = access_cfg('git-create');
1661     if ($how eq 'ssh-cmd') {
1662         runcmd_ordryrun
1663             (access_cfg_ssh, access_gituserhost(),
1664              access_runeinfo("git-create $package").
1665              "set -e; cd ".access_cfg('git-path').";".
1666              " cp -a _template $package.git");
1667     } elsif ($how eq 'true') {
1668         # nothing to do
1669     } else {
1670         badcfg "unknown git-create \`$how'";
1671     }
1672 }
1673
1674 our ($dsc_hash,$lastpush_mergeinput);
1675 our ($dsc_distro, $dsc_hint_tag, $dsc_hint_url);
1676
1677
1678 sub prep_ud () {
1679     dgit_privdir(); # ensures that $dgit_privdir_made is based on $maindir
1680     fresh_playground 'dgit/unpack';
1681 }
1682
1683 sub mktree_in_ud_here () {
1684     playtree_setup $gitcfgs{local};
1685 }
1686
1687 sub git_write_tree () {
1688     my $tree = cmdoutput @git, qw(write-tree);
1689     $tree =~ m/^\w+$/ or die "$tree ?";
1690     return $tree;
1691 }
1692
1693 sub git_add_write_tree () {
1694     runcmd @git, qw(add -Af .);
1695     return git_write_tree();
1696 }
1697
1698 sub remove_stray_gits ($) {
1699     my ($what) = @_;
1700     my @gitscmd = qw(find -name .git -prune -print0);
1701     debugcmd "|",@gitscmd;
1702     open GITS, "-|", @gitscmd or die $!;
1703     {
1704         local $/="\0";
1705         while (<GITS>) {
1706             chomp or die;
1707             print STDERR "$us: warning: removing from $what: ",
1708                 (messagequote $_), "\n";
1709             rmtree $_;
1710         }
1711     }
1712     $!=0; $?=0; close GITS or failedcmd @gitscmd;
1713 }
1714
1715 sub mktree_in_ud_from_only_subdir ($;$) {
1716     my ($what,$raw) = @_;
1717     # changes into the subdir
1718
1719     my (@dirs) = <*/.>;
1720     die "expected one subdir but found @dirs ?" unless @dirs==1;
1721     $dirs[0] =~ m#^([^/]+)/\.$# or die;
1722     my $dir = $1;
1723     changedir $dir;
1724
1725     remove_stray_gits($what);
1726     mktree_in_ud_here();
1727     if (!$raw) {
1728         my ($format, $fopts) = get_source_format();
1729         if (madformat($format)) {
1730             rmtree '.pc';
1731         }
1732     }
1733
1734     my $tree=git_add_write_tree();
1735     return ($tree,$dir);
1736 }
1737
1738 our @files_csum_info_fields = 
1739     (['Checksums-Sha256','Digest::SHA', 'new(256)', 'sha256sum'],
1740      ['Checksums-Sha1',  'Digest::SHA', 'new(1)',   'sha1sum'],
1741      ['Files',           'Digest::MD5', 'new()',    'md5sum']);
1742
1743 sub dsc_files_info () {
1744     foreach my $csumi (@files_csum_info_fields) {
1745         my ($fname, $module, $method) = @$csumi;
1746         my $field = $dsc->{$fname};
1747         next unless defined $field;
1748         eval "use $module; 1;" or die $@;
1749         my @out;
1750         foreach (split /\n/, $field) {
1751             next unless m/\S/;
1752             m/^(\w+) (\d+) (\S+)$/ or
1753                 fail "could not parse .dsc $fname line \`$_'";
1754             my $digester = eval "$module"."->$method;" or die $@;
1755             push @out, {
1756                 Hash => $1,
1757                 Bytes => $2,
1758                 Filename => $3,
1759                 Digester => $digester,
1760             };
1761         }
1762         return @out;
1763     }
1764     fail "missing any supported Checksums-* or Files field in ".
1765         $dsc->get_option('name');
1766 }
1767
1768 sub dsc_files () {
1769     map { $_->{Filename} } dsc_files_info();
1770 }
1771
1772 sub files_compare_inputs (@) {
1773     my $inputs = \@_;
1774     my %record;
1775     my %fchecked;
1776
1777     my $showinputs = sub {
1778         return join "; ", map { $_->get_option('name') } @$inputs;
1779     };
1780
1781     foreach my $in (@$inputs) {
1782         my $expected_files;
1783         my $in_name = $in->get_option('name');
1784
1785         printdebug "files_compare_inputs $in_name\n";
1786
1787         foreach my $csumi (@files_csum_info_fields) {
1788             my ($fname) = @$csumi;
1789             printdebug "files_compare_inputs $in_name $fname\n";
1790
1791             my $field = $in->{$fname};
1792             next unless defined $field;
1793
1794             my @files;
1795             foreach (split /\n/, $field) {
1796                 next unless m/\S/;
1797
1798                 my ($info, $f) = m/^(\w+ \d+) (?:\S+ \S+ )?(\S+)$/ or
1799                     fail "could not parse $in_name $fname line \`$_'";
1800
1801                 printdebug "files_compare_inputs $in_name $fname $f\n";
1802
1803                 push @files, $f;
1804
1805                 my $re = \ $record{$f}{$fname};
1806                 if (defined $$re) {
1807                     $fchecked{$f}{$in_name} = 1;
1808                     $$re eq $info or
1809                         fail "hash or size of $f varies in $fname fields".
1810                         " (between: ".$showinputs->().")";
1811                 } else {
1812                     $$re = $info;
1813                 }
1814             }
1815             @files = sort @files;
1816             $expected_files //= \@files;
1817             "@$expected_files" eq "@files" or
1818                 fail "file list in $in_name varies between hash fields!";
1819         }
1820         $expected_files or
1821             fail "$in_name has no files list field(s)";
1822     }
1823     printdebug "files_compare_inputs ".Dumper(\%fchecked, \%record)
1824         if $debuglevel>=2;
1825
1826     grep { keys %$_ == @$inputs-1 } values %fchecked
1827         or fail "no file appears in all file lists".
1828         " (looked in: ".$showinputs->().")";
1829 }
1830
1831 sub is_orig_file_in_dsc ($$) {
1832     my ($f, $dsc_files_info) = @_;
1833     return 0 if @$dsc_files_info <= 1;
1834     # One file means no origs, and the filename doesn't have a "what
1835     # part of dsc" component.  (Consider versions ending `.orig'.)
1836     return 0 unless $f =~ m/\.$orig_f_tail_re$/o;
1837     return 1;
1838 }
1839
1840 sub is_orig_file_of_vsn ($$) {
1841     my ($f, $upstreamvsn) = @_;
1842     my $base = srcfn $upstreamvsn, '';
1843     return 0 unless $f =~ m/^\Q$base\E\.$orig_f_tail_re$/;
1844     return 1;
1845 }
1846
1847 sub changes_update_origs_from_dsc ($$$$) {
1848     my ($dsc, $changes, $upstreamvsn, $changesfile) = @_;
1849     my %changes_f;
1850     printdebug "checking origs needed ($upstreamvsn)...\n";
1851     $_ = getfield $changes, 'Files';
1852     m/^\w+ \d+ (\S+ \S+) \S+$/m or
1853         fail "cannot find section/priority from .changes Files field";
1854     my $placementinfo = $1;
1855     my %changed;
1856     printdebug "checking origs needed placement '$placementinfo'...\n";
1857     foreach my $l (split /\n/, getfield $dsc, 'Files') {
1858         $l =~ m/\S+$/ or next;
1859         my $file = $&;
1860         printdebug "origs $file | $l\n";
1861         next unless is_orig_file_of_vsn $file, $upstreamvsn;
1862         printdebug "origs $file is_orig\n";
1863         my $have = archive_query('file_in_archive', $file);
1864         if (!defined $have) {
1865             print STDERR <<END;
1866 archive does not support .orig check; hope you used --ch:--sa/-sd if needed
1867 END
1868             return;
1869         }
1870         my $found_same = 0;
1871         my @found_differ;
1872         printdebug "origs $file \$#\$have=$#$have\n";
1873         foreach my $h (@$have) {
1874             my $same = 0;
1875             my @differ;
1876             foreach my $csumi (@files_csum_info_fields) {
1877                 my ($fname, $module, $method, $archivefield) = @$csumi;
1878                 next unless defined $h->{$archivefield};
1879                 $_ = $dsc->{$fname};
1880                 next unless defined;
1881                 m/^(\w+) .* \Q$file\E$/m or
1882                     fail ".dsc $fname missing entry for $file";
1883                 if ($h->{$archivefield} eq $1) {
1884                     $same++;
1885                 } else {
1886                     push @differ,
1887  "$archivefield: $h->{$archivefield} (archive) != $1 (local .dsc)";
1888                 }
1889             }
1890             die "$file ".Dumper($h)." ?!" if $same && @differ;
1891             $found_same++
1892                 if $same;
1893             push @found_differ, "archive $h->{filename}: ".join "; ", @differ
1894                 if @differ;
1895         }
1896         printdebug "origs $file f.same=$found_same".
1897             " #f._differ=$#found_differ\n";
1898         if (@found_differ && !$found_same) {
1899             fail join "\n",
1900                 "archive contains $file with different checksum",
1901                 @found_differ;
1902         }
1903         # Now we edit the changes file to add or remove it
1904         foreach my $csumi (@files_csum_info_fields) {
1905             my ($fname, $module, $method, $archivefield) = @$csumi;
1906             next unless defined $changes->{$fname};
1907             if ($found_same) {
1908                 # in archive, delete from .changes if it's there
1909                 $changed{$file} = "removed" if
1910                     $changes->{$fname} =~ s/^.* \Q$file\E$(?:)\n//m;
1911             } elsif ($changes->{$fname} =~ m/^.* \Q$file\E$(?:)\n/m) {
1912                 # not in archive, but it's here in the .changes
1913             } else {
1914                 my $dsc_data = getfield $dsc, $fname;
1915                 $dsc_data =~ m/^(.* \Q$file\E$)\n/m or die "$dsc_data $file ?";
1916                 my $extra = $1;
1917                 $extra =~ s/ \d+ /$&$placementinfo /
1918                     or die "$fname $extra >$dsc_data< ?"
1919                     if $fname eq 'Files';
1920                 $changes->{$fname} .= "\n". $extra;
1921                 $changed{$file} = "added";
1922             }
1923         }
1924     }
1925     if (%changed) {
1926         foreach my $file (keys %changed) {
1927             progress sprintf
1928                 "edited .changes for archive .orig contents: %s %s",
1929                 $changed{$file}, $file;
1930         }
1931         my $chtmp = "$changesfile.tmp";
1932         $changes->save($chtmp);
1933         if (act_local()) {
1934             rename $chtmp,$changesfile or die "$changesfile $!";
1935         } else {
1936             progress "[new .changes left in $changesfile]";
1937         }
1938     } else {
1939         progress "$changesfile already has appropriate .orig(s) (if any)";
1940     }
1941 }
1942
1943 sub make_commit ($) {
1944     my ($file) = @_;
1945     return cmdoutput @git, qw(hash-object -w -t commit), $file;
1946 }
1947
1948 sub make_commit_text ($) {
1949     my ($text) = @_;
1950     my ($out, $in);
1951     my @cmd = (@git, qw(hash-object -w -t commit --stdin));
1952     debugcmd "|",@cmd;
1953     print Dumper($text) if $debuglevel > 1;
1954     my $child = open2($out, $in, @cmd) or die $!;
1955     my $h;
1956     eval {
1957         print $in $text or die $!;
1958         close $in or die $!;
1959         $h = <$out>;
1960         $h =~ m/^\w+$/ or die;
1961         $h = $&;
1962         printdebug "=> $h\n";
1963     };
1964     close $out;
1965     waitpid $child, 0 == $child or die "$child $!";
1966     $? and failedcmd @cmd;
1967     return $h;
1968 }
1969
1970 sub clogp_authline ($) {
1971     my ($clogp) = @_;
1972     my $author = getfield $clogp, 'Maintainer';
1973     if ($author =~ m/^[^"\@]+\,/) {
1974         # single entry Maintainer field with unquoted comma
1975         $author = ($& =~ y/,//rd).$'; # strip the comma
1976     }
1977     # git wants a single author; any remaining commas in $author
1978     # are by now preceded by @ (or ").  It seems safer to punt on
1979     # "..." for now rather than attempting to dequote or something.
1980     $author =~ s#,.*##ms unless $author =~ m/"/;
1981     my $date = cmdoutput qw(date), '+%s %z', qw(-d), getfield($clogp,'Date');
1982     my $authline = "$author $date";
1983     $authline =~ m/$git_authline_re/o or
1984         fail "unexpected commit author line format \`$authline'".
1985         " (was generated from changelog Maintainer field)";
1986     return ($1,$2,$3) if wantarray;
1987     return $authline;
1988 }
1989
1990 sub vendor_patches_distro ($$) {
1991     my ($checkdistro, $what) = @_;
1992     return unless defined $checkdistro;
1993
1994     my $series = "debian/patches/\L$checkdistro\E.series";
1995     printdebug "checking for vendor-specific $series ($what)\n";
1996
1997     if (!open SERIES, "<", $series) {
1998         die "$series $!" unless $!==ENOENT;
1999         return;
2000     }
2001     while (<SERIES>) {
2002         next unless m/\S/;
2003         next if m/^\s+\#/;
2004
2005         print STDERR <<END;
2006
2007 Unfortunately, this source package uses a feature of dpkg-source where
2008 the same source package unpacks to different source code on different
2009 distros.  dgit cannot safely operate on such packages on affected
2010 distros, because the meaning of source packages is not stable.
2011
2012 Please ask the distro/maintainer to remove the distro-specific series
2013 files and use a different technique (if necessary, uploading actually
2014 different packages, if different distros are supposed to have
2015 different code).
2016
2017 END
2018         fail "Found active distro-specific series file for".
2019             " $checkdistro ($what): $series, cannot continue";
2020     }
2021     die "$series $!" if SERIES->error;
2022     close SERIES;
2023 }
2024
2025 sub check_for_vendor_patches () {
2026     # This dpkg-source feature doesn't seem to be documented anywhere!
2027     # But it can be found in the changelog (reformatted):
2028
2029     #   commit  4fa01b70df1dc4458daee306cfa1f987b69da58c
2030     #   Author: Raphael Hertzog <hertzog@debian.org>
2031     #   Date: Sun  Oct  3  09:36:48  2010 +0200
2032
2033     #   dpkg-source: correctly create .pc/.quilt_series with alternate
2034     #   series files
2035     #   
2036     #   If you have debian/patches/ubuntu.series and you were
2037     #   unpacking the source package on ubuntu, quilt was still
2038     #   directed to debian/patches/series instead of
2039     #   debian/patches/ubuntu.series.
2040     #   
2041     #   debian/changelog                        |    3 +++
2042     #   scripts/Dpkg/Source/Package/V3/quilt.pm |    4 +++-
2043     #   2 files changed, 6 insertions(+), 1 deletion(-)
2044
2045     use Dpkg::Vendor;
2046     vendor_patches_distro($ENV{DEB_VENDOR}, "DEB_VENDOR");
2047     vendor_patches_distro(Dpkg::Vendor::get_current_vendor(),
2048                          "Dpkg::Vendor \`current vendor'");
2049     vendor_patches_distro(access_basedistro(),
2050                           "(base) distro being accessed");
2051     vendor_patches_distro(access_nomdistro(),
2052                           "(nominal) distro being accessed");
2053 }
2054
2055 sub generate_commits_from_dsc () {
2056     # See big comment in fetch_from_archive, below.
2057     # See also README.dsc-import.
2058     prep_ud();
2059     changedir $playground;
2060
2061     my @dfi = dsc_files_info();
2062     foreach my $fi (@dfi) {
2063         my $f = $fi->{Filename};
2064         die "$f ?" if $f =~ m#/|^\.|\.dsc$|\.tmp$#;
2065         my $upper_f = "$maindir/../$f";
2066
2067         printdebug "considering reusing $f: ";
2068
2069         if (link_ltarget "$upper_f,fetch", $f) {
2070             printdebug "linked (using ...,fetch).\n";
2071         } elsif ((printdebug "($!) "),
2072                  $! != ENOENT) {
2073             fail "accessing ../$f,fetch: $!";
2074         } elsif (link_ltarget $upper_f, $f) {
2075             printdebug "linked.\n";
2076         } elsif ((printdebug "($!) "),
2077                  $! != ENOENT) {
2078             fail "accessing ../$f: $!";
2079         } else {
2080             printdebug "absent.\n";
2081         }
2082
2083         my $refetched;
2084         complete_file_from_dsc('.', $fi, \$refetched)
2085             or next;
2086
2087         printdebug "considering saving $f: ";
2088
2089         if (link $f, $upper_f) {
2090             printdebug "linked.\n";
2091         } elsif ((printdebug "($!) "),
2092                  $! != EEXIST) {
2093             fail "saving ../$f: $!";
2094         } elsif (!$refetched) {
2095             printdebug "no need.\n";
2096         } elsif (link $f, "$upper_f,fetch") {
2097             printdebug "linked (using ...,fetch).\n";
2098         } elsif ((printdebug "($!) "),
2099                  $! != EEXIST) {
2100             fail "saving ../$f,fetch: $!";
2101         } else {
2102             printdebug "cannot.\n";
2103         }
2104     }
2105
2106     # We unpack and record the orig tarballs first, so that we only
2107     # need disk space for one private copy of the unpacked source.
2108     # But we can't make them into commits until we have the metadata
2109     # from the debian/changelog, so we record the tree objects now and
2110     # make them into commits later.
2111     my @tartrees;
2112     my $upstreamv = upstreamversion $dsc->{version};
2113     my $orig_f_base = srcfn $upstreamv, '';
2114
2115     foreach my $fi (@dfi) {
2116         # We actually import, and record as a commit, every tarball
2117         # (unless there is only one file, in which case there seems
2118         # little point.
2119
2120         my $f = $fi->{Filename};
2121         printdebug "import considering $f ";
2122         (printdebug "only one dfi\n"), next if @dfi == 1;
2123         (printdebug "not tar\n"), next unless $f =~ m/\.tar(\.\w+)?$/;
2124         (printdebug "signature\n"), next if $f =~ m/$orig_f_sig_re$/o;
2125         my $compr_ext = $1;
2126
2127         my ($orig_f_part) =
2128             $f =~ m/^\Q$orig_f_base\E\.([^._]+)?\.tar(?:\.\w+)?$/;
2129
2130         printdebug "Y ", (join ' ', map { $_//"(none)" }
2131                           $compr_ext, $orig_f_part
2132                          ), "\n";
2133
2134         my $input = new IO::File $f, '<' or die "$f $!";
2135         my $compr_pid;
2136         my @compr_cmd;
2137
2138         if (defined $compr_ext) {
2139             my $cname =
2140                 Dpkg::Compression::compression_guess_from_filename $f;
2141             fail "Dpkg::Compression cannot handle file $f in source package"
2142                 if defined $compr_ext && !defined $cname;
2143             my $compr_proc =
2144                 new Dpkg::Compression::Process compression => $cname;
2145             @compr_cmd = $compr_proc->get_uncompress_cmdline();
2146             my $compr_fh = new IO::Handle;
2147             my $compr_pid = open $compr_fh, "-|" // die $!;
2148             if (!$compr_pid) {
2149                 open STDIN, "<&", $input or die $!;
2150                 exec @compr_cmd;
2151                 die "dgit (child): exec $compr_cmd[0]: $!\n";
2152             }
2153             $input = $compr_fh;
2154         }
2155
2156         rmtree "_unpack-tar";
2157         mkdir "_unpack-tar" or die $!;
2158         my @tarcmd = qw(tar -x -f -
2159                         --no-same-owner --no-same-permissions
2160                         --no-acls --no-xattrs --no-selinux);
2161         my $tar_pid = fork // die $!;
2162         if (!$tar_pid) {
2163             chdir "_unpack-tar" or die $!;
2164             open STDIN, "<&", $input or die $!;
2165             exec @tarcmd;
2166             die "dgit (child): exec $tarcmd[0]: $!";
2167         }
2168         $!=0; (waitpid $tar_pid, 0) == $tar_pid or die $!;
2169         !$? or failedcmd @tarcmd;
2170
2171         close $input or
2172             (@compr_cmd ? ($?==SIGPIPE || failedcmd @compr_cmd)
2173              : die $!);
2174         # finally, we have the results in "tarball", but maybe
2175         # with the wrong permissions
2176
2177         runcmd qw(chmod -R +rwX _unpack-tar);
2178         changedir "_unpack-tar";
2179         remove_stray_gits($f);
2180         mktree_in_ud_here();
2181         
2182         my ($tree) = git_add_write_tree();
2183         my $tentries = cmdoutput @git, qw(ls-tree -z), $tree;
2184         if ($tentries =~ m/^\d+ tree (\w+)\t[^\000]+\000$/s) {
2185             $tree = $1;
2186             printdebug "one subtree $1\n";
2187         } else {
2188             printdebug "multiple subtrees\n";
2189         }
2190         changedir "..";
2191         rmtree "_unpack-tar";
2192
2193         my $ent = [ $f, $tree ];
2194         push @tartrees, {
2195             Orig => !!$orig_f_part,
2196             Sort => (!$orig_f_part         ? 2 :
2197                      $orig_f_part =~ m/-/g ? 1 :
2198                                              0),
2199             F => $f,
2200             Tree => $tree,
2201         };
2202     }
2203
2204     @tartrees = sort {
2205         # put any without "_" first (spec is not clear whether files
2206         # are always in the usual order).  Tarballs without "_" are
2207         # the main orig or the debian tarball.
2208         $a->{Sort} <=> $b->{Sort} or
2209         $a->{F}    cmp $b->{F}
2210     } @tartrees;
2211
2212     my $any_orig = grep { $_->{Orig} } @tartrees;
2213
2214     my $dscfn = "$package.dsc";
2215
2216     my $treeimporthow = 'package';
2217
2218     open D, ">", $dscfn or die "$dscfn: $!";
2219     print D $dscdata or die "$dscfn: $!";
2220     close D or die "$dscfn: $!";
2221     my @cmd = qw(dpkg-source);
2222     push @cmd, '--no-check' if $dsc_checked;
2223     if (madformat $dsc->{format}) {
2224         push @cmd, '--skip-patches';
2225         $treeimporthow = 'unpatched';
2226     }
2227     push @cmd, qw(-x --), $dscfn;
2228     runcmd @cmd;
2229
2230     my ($tree,$dir) = mktree_in_ud_from_only_subdir("source package");
2231     if (madformat $dsc->{format}) { 
2232         check_for_vendor_patches();
2233     }
2234
2235     my $dappliedtree;
2236     if (madformat $dsc->{format}) {
2237         my @pcmd = qw(dpkg-source --before-build .);
2238         runcmd shell_cmd 'exec >/dev/null', @pcmd;
2239         rmtree '.pc';
2240         $dappliedtree = git_add_write_tree();
2241     }
2242
2243     my @clogcmd = qw(dpkg-parsechangelog --format rfc822 --all);
2244     debugcmd "|",@clogcmd;
2245     open CLOGS, "-|", @clogcmd or die $!;
2246
2247     my $clogp;
2248     my $r1clogp;
2249
2250     printdebug "import clog search...\n";
2251
2252     for (;;) {
2253         my $stanzatext = do { local $/=""; <CLOGS>; };
2254         printdebug "import clogp ".Dumper($stanzatext) if $debuglevel>1;
2255         last if !defined $stanzatext;
2256
2257         my $desc = "package changelog, entry no.$.";
2258         open my $stanzafh, "<", \$stanzatext or die;
2259         my $thisstanza = parsecontrolfh $stanzafh, $desc, 1;
2260         $clogp //= $thisstanza;
2261
2262         printdebug "import clog $thisstanza->{version} $desc...\n";
2263
2264         last if !$any_orig; # we don't need $r1clogp
2265
2266         # We look for the first (most recent) changelog entry whose
2267         # version number is lower than the upstream version of this
2268         # package.  Then the last (least recent) previous changelog
2269         # entry is treated as the one which introduced this upstream
2270         # version and used for the synthetic commits for the upstream
2271         # tarballs.
2272
2273         # One might think that a more sophisticated algorithm would be
2274         # necessary.  But: we do not want to scan the whole changelog
2275         # file.  Stopping when we see an earlier version, which
2276         # necessarily then is an earlier upstream version, is the only
2277         # realistic way to do that.  Then, either the earliest
2278         # changelog entry we have seen so far is indeed the earliest
2279         # upload of this upstream version; or there are only changelog
2280         # entries relating to later upstream versions (which is not
2281         # possible unless the changelog and .dsc disagree about the
2282         # version).  Then it remains to choose between the physically
2283         # last entry in the file, and the one with the lowest version
2284         # number.  If these are not the same, we guess that the
2285         # versions were created in a non-monotic order rather than
2286         # that the changelog entries have been misordered.
2287
2288         printdebug "import clog $thisstanza->{version} vs $upstreamv...\n";
2289
2290         last if version_compare($thisstanza->{version}, $upstreamv) < 0;
2291         $r1clogp = $thisstanza;
2292
2293         printdebug "import clog $r1clogp->{version} becomes r1\n";
2294     }
2295     die $! if CLOGS->error;
2296     close CLOGS or $?==SIGPIPE or failedcmd @clogcmd;
2297
2298     $clogp or fail "package changelog has no entries!";
2299
2300     my $authline = clogp_authline $clogp;
2301     my $changes = getfield $clogp, 'Changes';
2302     $changes =~ s/^\n//; # Changes: \n
2303     my $cversion = getfield $clogp, 'Version';
2304
2305     if (@tartrees) {
2306         $r1clogp //= $clogp; # maybe there's only one entry;
2307         my $r1authline = clogp_authline $r1clogp;
2308         # Strictly, r1authline might now be wrong if it's going to be
2309         # unused because !$any_orig.  Whatever.
2310
2311         printdebug "import tartrees authline   $authline\n";
2312         printdebug "import tartrees r1authline $r1authline\n";
2313
2314         foreach my $tt (@tartrees) {
2315             printdebug "import tartree $tt->{F} $tt->{Tree}\n";
2316
2317             $tt->{Commit} = make_commit_text($tt->{Orig} ? <<END_O : <<END_T);
2318 tree $tt->{Tree}
2319 author $r1authline
2320 committer $r1authline
2321
2322 Import $tt->{F}
2323
2324 [dgit import orig $tt->{F}]
2325 END_O
2326 tree $tt->{Tree}
2327 author $authline
2328 committer $authline
2329
2330 Import $tt->{F}
2331
2332 [dgit import tarball $package $cversion $tt->{F}]
2333 END_T
2334         }
2335     }
2336
2337     printdebug "import main commit\n";
2338
2339     open C, ">../commit.tmp" or die $!;
2340     print C <<END or die $!;
2341 tree $tree
2342 END
2343     print C <<END or die $! foreach @tartrees;
2344 parent $_->{Commit}
2345 END
2346     print C <<END or die $!;
2347 author $authline
2348 committer $authline
2349
2350 $changes
2351
2352 [dgit import $treeimporthow $package $cversion]
2353 END
2354
2355     close C or die $!;
2356     my $rawimport_hash = make_commit qw(../commit.tmp);
2357
2358     if (madformat $dsc->{format}) {
2359         printdebug "import apply patches...\n";
2360
2361         # regularise the state of the working tree so that
2362         # the checkout of $rawimport_hash works nicely.
2363         my $dappliedcommit = make_commit_text(<<END);
2364 tree $dappliedtree
2365 author $authline
2366 committer $authline
2367
2368 [dgit dummy commit]
2369 END
2370         runcmd @git, qw(checkout -q -b dapplied), $dappliedcommit;
2371
2372         runcmd @git, qw(checkout -q -b unpa), $rawimport_hash;
2373
2374         # We need the answers to be reproducible
2375         my @authline = clogp_authline($clogp);
2376         local $ENV{GIT_COMMITTER_NAME} =  $authline[0];
2377         local $ENV{GIT_COMMITTER_EMAIL} = $authline[1];
2378         local $ENV{GIT_COMMITTER_DATE} =  $authline[2];
2379         local $ENV{GIT_AUTHOR_NAME} =  $authline[0];
2380         local $ENV{GIT_AUTHOR_EMAIL} = $authline[1];
2381         local $ENV{GIT_AUTHOR_DATE} =  $authline[2];
2382
2383         my $path = $ENV{PATH} or die;
2384         
2385         # we use ../../gbp-pq-output, which (given that we are in
2386         # $playground/PLAYTREE, and $playground is .git/dgit/unpack,
2387         # is .git/dgit.
2388
2389         foreach my $use_absurd (qw(0 1)) {
2390             runcmd @git, qw(checkout -q unpa);
2391             runcmd @git, qw(update-ref -d refs/heads/patch-queue/unpa);
2392             local $ENV{PATH} = $path;
2393             if ($use_absurd) {
2394                 chomp $@;
2395                 progress "warning: $@";
2396                 $path = "$absurdity:$path";
2397                 progress "$us: trying slow absurd-git-apply...";
2398                 rename "../../gbp-pq-output","../../gbp-pq-output.0"
2399                     or $!==ENOENT
2400                     or die $!;
2401             }
2402             eval {
2403                 die "forbid absurd git-apply\n" if $use_absurd
2404                     && forceing [qw(import-gitapply-no-absurd)];
2405                 die "only absurd git-apply!\n" if !$use_absurd
2406                     && forceing [qw(import-gitapply-absurd)];
2407
2408                 local $ENV{DGIT_ABSURD_DEBUG} = $debuglevel if $use_absurd;
2409                 local $ENV{PATH} = $path                    if $use_absurd;
2410
2411                 my @showcmd = (gbp_pq, qw(import));
2412                 my @realcmd = shell_cmd
2413                     'exec >/dev/null 2>>../../gbp-pq-output', @showcmd;
2414                 debugcmd "+",@realcmd;
2415                 if (system @realcmd) {
2416                     die +(shellquote @showcmd).
2417                         " failed: ".
2418                         failedcmd_waitstatus()."\n";
2419                 }
2420
2421                 my $gapplied = git_rev_parse('HEAD');
2422                 my $gappliedtree = cmdoutput @git, qw(rev-parse HEAD:);
2423                 $gappliedtree eq $dappliedtree or
2424                     fail <<END;
2425 gbp-pq import and dpkg-source disagree!
2426  gbp-pq import gave commit $gapplied
2427  gbp-pq import gave tree $gappliedtree
2428  dpkg-source --before-build gave tree $dappliedtree
2429 END
2430                 $rawimport_hash = $gapplied;
2431             };
2432             last unless $@;
2433         }
2434         if ($@) {
2435             { local $@; eval { runcmd qw(cat ../../gbp-pq-output); }; }
2436             die $@;
2437         }
2438     }
2439
2440     progress "synthesised git commit from .dsc $cversion";
2441
2442     my $rawimport_mergeinput = {
2443         Commit => $rawimport_hash,
2444         Info => "Import of source package",
2445     };
2446     my @output = ($rawimport_mergeinput);
2447
2448     if ($lastpush_mergeinput) {
2449         my $oldclogp = mergeinfo_getclogp($lastpush_mergeinput);
2450         my $oversion = getfield $oldclogp, 'Version';
2451         my $vcmp =
2452             version_compare($oversion, $cversion);
2453         if ($vcmp < 0) {
2454             @output = ($rawimport_mergeinput, $lastpush_mergeinput,
2455                 { Message => <<END, ReverseParents => 1 });
2456 Record $package ($cversion) in archive suite $csuite
2457 END
2458         } elsif ($vcmp > 0) {
2459             print STDERR <<END or die $!;
2460
2461 Version actually in archive:   $cversion (older)
2462 Last version pushed with dgit: $oversion (newer or same)
2463 $later_warning_msg
2464 END
2465             @output = $lastpush_mergeinput;
2466         } else {
2467             # Same version.  Use what's in the server git branch,
2468             # discarding our own import.  (This could happen if the
2469             # server automatically imports all packages into git.)
2470             @output = $lastpush_mergeinput;
2471         }
2472     }
2473     changedir $maindir;
2474     rmtree $playground;
2475     return @output;
2476 }
2477
2478 sub complete_file_from_dsc ($$;$) {
2479     our ($dstdir, $fi, $refetched) = @_;
2480     # Ensures that we have, in $dstdir, the file $fi, with the correct
2481     # contents.  (Downloading it from alongside $dscurl if necessary.)
2482     # If $refetched is defined, can overwrite "$dstdir/$fi->{Filename}"
2483     # and will set $$refetched=1 if it did so (or tried to).
2484
2485     my $f = $fi->{Filename};
2486     my $tf = "$dstdir/$f";
2487     my $downloaded = 0;
2488
2489     my $got;
2490     my $checkhash = sub {
2491         open F, "<", "$tf" or die "$tf: $!";
2492         $fi->{Digester}->reset();
2493         $fi->{Digester}->addfile(*F);
2494         F->error and die $!;
2495         $got = $fi->{Digester}->hexdigest();
2496         return $got eq $fi->{Hash};
2497     };
2498
2499     if (stat_exists $tf) {
2500         if ($checkhash->()) {
2501             progress "using existing $f";
2502             return 1;
2503         }
2504         if (!$refetched) {
2505             fail "file $f has hash $got but .dsc".
2506                 " demands hash $fi->{Hash} ".
2507                 "(perhaps you should delete this file?)";
2508         }
2509         progress "need to fetch correct version of $f";
2510         unlink $tf or die "$tf $!";
2511         $$refetched = 1;
2512     } else {
2513         printdebug "$tf does not exist, need to fetch\n";
2514     }
2515
2516     my $furl = $dscurl;
2517     $furl =~ s{/[^/]+$}{};
2518     $furl .= "/$f";
2519     die "$f ?" unless $f =~ m/^\Q${package}\E_/;
2520     die "$f ?" if $f =~ m#/#;
2521     runcmd_ordryrun_local @curl,qw(-f -o),$tf,'--',"$furl";
2522     return 0 if !act_local();
2523
2524     $checkhash->() or
2525         fail "file $f has hash $got but .dsc".
2526             " demands hash $fi->{Hash} ".
2527             "(got wrong file from archive!)";
2528
2529     return 1;
2530 }
2531
2532 sub ensure_we_have_orig () {
2533     my @dfi = dsc_files_info();
2534     foreach my $fi (@dfi) {
2535         my $f = $fi->{Filename};
2536         next unless is_orig_file_in_dsc($f, \@dfi);
2537         complete_file_from_dsc('..', $fi)
2538             or next;
2539     }
2540 }
2541
2542 #---------- git fetch ----------
2543
2544 sub lrfetchrefs () { return "refs/dgit-fetch/".access_basedistro(); }
2545 sub lrfetchref () { return lrfetchrefs.'/'.server_branch($csuite); }
2546
2547 # We fetch some parts of lrfetchrefs/*.  Ideally we delete these
2548 # locally fetched refs because they have unhelpful names and clutter
2549 # up gitk etc.  So we track whether we have "used up" head ref (ie,
2550 # whether we have made another local ref which refers to this object).
2551 #
2552 # (If we deleted them unconditionally, then we might end up
2553 # re-fetching the same git objects each time dgit fetch was run.)
2554 #
2555 # So, each use of lrfetchrefs needs to be accompanied by arrangements
2556 # in git_fetch_us to fetch the refs in question, and possibly a call
2557 # to lrfetchref_used.
2558
2559 our (%lrfetchrefs_f, %lrfetchrefs_d);
2560 # $lrfetchrefs_X{lrfetchrefs."/heads/whatever"} = $objid
2561
2562 sub lrfetchref_used ($) {
2563     my ($fullrefname) = @_;
2564     my $objid = $lrfetchrefs_f{$fullrefname};
2565     $lrfetchrefs_d{$fullrefname} = $objid if defined $objid;
2566 }
2567
2568 sub git_lrfetch_sane {
2569     my ($url, $supplementary, @specs) = @_;
2570     # Make a 'refs/'.lrfetchrefs.'/*' be just like on server,
2571     # at least as regards @specs.  Also leave the results in
2572     # %lrfetchrefs_f, and arrange for lrfetchref_used to be
2573     # able to clean these up.
2574     #
2575     # With $supplementary==1, @specs must not contain wildcards
2576     # and we add to our previous fetches (non-atomically).
2577
2578     # This is rather miserable:
2579     # When git fetch --prune is passed a fetchspec ending with a *,
2580     # it does a plausible thing.  If there is no * then:
2581     # - it matches subpaths too, even if the supplied refspec
2582     #   starts refs, and behaves completely madly if the source
2583     #   has refs/refs/something.  (See, for example, Debian #NNNN.)
2584     # - if there is no matching remote ref, it bombs out the whole
2585     #   fetch.
2586     # We want to fetch a fixed ref, and we don't know in advance
2587     # if it exists, so this is not suitable.
2588     #
2589     # Our workaround is to use git ls-remote.  git ls-remote has its
2590     # own qairks.  Notably, it has the absurd multi-tail-matching
2591     # behaviour: git ls-remote R refs/foo can report refs/foo AND
2592     # refs/refs/foo etc.
2593     #
2594     # Also, we want an idempotent snapshot, but we have to make two
2595     # calls to the remote: one to git ls-remote and to git fetch.  The
2596     # solution is use git ls-remote to obtain a target state, and
2597     # git fetch to try to generate it.  If we don't manage to generate
2598     # the target state, we try again.
2599
2600     printdebug "git_lrfetch_sane suppl=$supplementary specs @specs\n";
2601
2602     my $specre = join '|', map {
2603         my $x = $_;
2604         $x =~ s/\W/\\$&/g;
2605         my $wildcard = $x =~ s/\\\*$/.*/;
2606         die if $wildcard && $supplementary;
2607         "(?:refs/$x)";
2608     } @specs;
2609     printdebug "git_lrfetch_sane specre=$specre\n";
2610     my $wanted_rref = sub {
2611         local ($_) = @_;
2612         return m/^(?:$specre)$/;
2613     };
2614
2615     my $fetch_iteration = 0;
2616     FETCH_ITERATION:
2617     for (;;) {
2618         printdebug "git_lrfetch_sane iteration $fetch_iteration\n";
2619         if (++$fetch_iteration > 10) {
2620             fail "too many iterations trying to get sane fetch!";
2621         }
2622
2623         my @look = map { "refs/$_" } @specs;
2624         my @lcmd = (@git, qw(ls-remote -q --refs), $url, @look);
2625         debugcmd "|",@lcmd;
2626
2627         my %wantr;
2628         open GITLS, "-|", @lcmd or die $!;
2629         while (<GITLS>) {
2630             printdebug "=> ", $_;
2631             m/^(\w+)\s+(\S+)\n/ or die "ls-remote $_ ?";
2632             my ($objid,$rrefname) = ($1,$2);
2633             if (!$wanted_rref->($rrefname)) {
2634                 print STDERR <<END;
2635 warning: git ls-remote @look reported $rrefname; this is silly, ignoring it.
2636 END
2637                 next;
2638             }
2639             $wantr{$rrefname} = $objid;
2640         }
2641         $!=0; $?=0;
2642         close GITLS or failedcmd @lcmd;
2643
2644         # OK, now %want is exactly what we want for refs in @specs
2645         my @fspecs = map {
2646             !m/\*$/ && !exists $wantr{"refs/$_"} ? () :
2647             "+refs/$_:".lrfetchrefs."/$_";
2648         } @specs;
2649
2650         printdebug "git_lrfetch_sane fspecs @fspecs\n";
2651
2652         my @fcmd = (@git, qw(fetch -p -n -q), $url, @fspecs);
2653         runcmd_ordryrun_local @fcmd if @fspecs;
2654
2655         if (!$supplementary) {
2656             %lrfetchrefs_f = ();
2657         }
2658         my %objgot;
2659
2660         git_for_each_ref(lrfetchrefs, sub {
2661             my ($objid,$objtype,$lrefname,$reftail) = @_;
2662             $lrfetchrefs_f{$lrefname} = $objid;
2663             $objgot{$objid} = 1;
2664         });
2665
2666         if ($supplementary) {
2667             last;
2668         }
2669
2670         foreach my $lrefname (sort keys %lrfetchrefs_f) {
2671             my $rrefname = 'refs'.substr($lrefname, length lrfetchrefs);
2672             if (!exists $wantr{$rrefname}) {
2673                 if ($wanted_rref->($rrefname)) {
2674                     printdebug <<END;
2675 git-fetch @fspecs created $lrefname which git ls-remote @look didn't list.
2676 END
2677                 } else {
2678                     print STDERR <<END
2679 warning: git fetch @fspecs created $lrefname; this is silly, deleting it.
2680 END
2681                 }
2682                 runcmd_ordryrun_local @git, qw(update-ref -d), $lrefname;
2683                 delete $lrfetchrefs_f{$lrefname};
2684                 next;
2685             }
2686         }
2687         foreach my $rrefname (sort keys %wantr) {
2688             my $lrefname = lrfetchrefs.substr($rrefname, 4);
2689             my $got = $lrfetchrefs_f{$lrefname} // '<none>';
2690             my $want = $wantr{$rrefname};
2691             next if $got eq $want;
2692             if (!defined $objgot{$want}) {
2693                 print STDERR <<END;
2694 warning: git ls-remote suggests we want $lrefname
2695 warning:  and it should refer to $want
2696 warning:  but git fetch didn't fetch that object to any relevant ref.
2697 warning:  This may be due to a race with someone updating the server.
2698 warning:  Will try again...
2699 END
2700                 next FETCH_ITERATION;
2701             }
2702             printdebug <<END;
2703 git-fetch @fspecs made $lrefname=$got but want git ls-remote @look says $want
2704 END
2705             runcmd_ordryrun_local @git, qw(update-ref -m),
2706                 "dgit fetch git fetch fixup", $lrefname, $want;
2707             $lrfetchrefs_f{$lrefname} = $want;
2708         }
2709         last;
2710     }
2711
2712     if (defined $csuite) {
2713         printdebug "git_lrfetch_sane: tidying any old suite lrfetchrefs\n";
2714         git_for_each_ref("refs/dgit-fetch/$csuite", sub {
2715             my ($objid,$objtype,$lrefname,$reftail) = @_;
2716             next if $lrfetchrefs_f{$lrefname}; # $csuite eq $distro ?
2717             runcmd_ordryrun_local @git, qw(update-ref -d), $lrefname;
2718         });
2719     }
2720
2721     printdebug "git_lrfetch_sane: git fetch --no-insane emulation complete\n",
2722         Dumper(\%lrfetchrefs_f);
2723 }
2724
2725 sub git_fetch_us () {
2726     # Want to fetch only what we are going to use, unless
2727     # deliberately-not-ff, in which case we must fetch everything.
2728
2729     my @specs = deliberately_not_fast_forward ? qw(tags/*) :
2730         map { "tags/$_" }
2731         (quiltmode_splitbrain
2732          ? (map { $_->('*',access_nomdistro) }
2733             \&debiantag_new, \&debiantag_maintview)
2734          : debiantags('*',access_nomdistro));
2735     push @specs, server_branch($csuite);
2736     push @specs, $rewritemap;
2737     push @specs, qw(heads/*) if deliberately_not_fast_forward;
2738
2739     my $url = access_giturl();
2740     git_lrfetch_sane $url, 0, @specs;
2741
2742     my %here;
2743     my @tagpats = debiantags('*',access_nomdistro);
2744
2745     git_for_each_ref([map { "refs/tags/$_" } @tagpats], sub {
2746         my ($objid,$objtype,$fullrefname,$reftail) = @_;
2747         printdebug "currently $fullrefname=$objid\n";
2748         $here{$fullrefname} = $objid;
2749     });
2750     git_for_each_ref([map { lrfetchrefs."/tags/".$_ } @tagpats], sub {
2751         my ($objid,$objtype,$fullrefname,$reftail) = @_;
2752         my $lref = "refs".substr($fullrefname, length(lrfetchrefs));
2753         printdebug "offered $lref=$objid\n";
2754         if (!defined $here{$lref}) {
2755             my @upd = (@git, qw(update-ref), $lref, $objid, '');
2756             runcmd_ordryrun_local @upd;
2757             lrfetchref_used $fullrefname;
2758         } elsif ($here{$lref} eq $objid) {
2759             lrfetchref_used $fullrefname;
2760         } else {
2761             print STDERR
2762                 "Not updating $lref from $here{$lref} to $objid.\n";
2763         }
2764     });
2765 }
2766
2767 #---------- dsc and archive handling ----------
2768
2769 sub mergeinfo_getclogp ($) {
2770     # Ensures thit $mi->{Clogp} exists and returns it
2771     my ($mi) = @_;
2772     $mi->{Clogp} = commit_getclogp($mi->{Commit});
2773 }
2774
2775 sub mergeinfo_version ($) {
2776     return getfield( (mergeinfo_getclogp $_[0]), 'Version' );
2777 }
2778
2779 sub fetch_from_archive_record_1 ($) {
2780     my ($hash) = @_;
2781     runcmd @git, qw(update-ref -m), "dgit fetch $csuite",
2782             'DGIT_ARCHIVE', $hash;
2783     cmdoutput @git, qw(log -n2), $hash;
2784     # ... gives git a chance to complain if our commit is malformed
2785 }
2786
2787 sub fetch_from_archive_record_2 ($) {
2788     my ($hash) = @_;
2789     my @upd_cmd = (@git, qw(update-ref -m), 'dgit fetch', lrref(), $hash);
2790     if (act_local()) {
2791         cmdoutput @upd_cmd;
2792     } else {
2793         dryrun_report @upd_cmd;
2794     }
2795 }
2796
2797 sub parse_dsc_field_def_dsc_distro () {
2798     $dsc_distro //= cfg qw(dgit.default.old-dsc-distro
2799                            dgit.default.distro);
2800 }
2801
2802 sub parse_dsc_field ($$) {
2803     my ($dsc, $what) = @_;
2804     my $f;
2805     foreach my $field (@ourdscfield) {
2806         $f = $dsc->{$field};
2807         last if defined $f;
2808     }
2809
2810     if (!defined $f) {
2811         progress "$what: NO git hash";
2812         parse_dsc_field_def_dsc_distro();
2813     } elsif (($dsc_hash, $dsc_distro, $dsc_hint_tag, $dsc_hint_url)
2814              = $f =~ m/^(\w+)\s+($distro_re)\s+($versiontag_re)\s+(\S+)(?:\s|$)/) {
2815         progress "$what: specified git info ($dsc_distro)";
2816         $dsc_hint_tag = [ $dsc_hint_tag ];
2817     } elsif ($f =~ m/^\w+\s*$/) {
2818         $dsc_hash = $&;
2819         parse_dsc_field_def_dsc_distro();
2820         $dsc_hint_tag = [ debiantags +(getfield $dsc, 'Version'),
2821                           $dsc_distro ];
2822         progress "$what: specified git hash";
2823     } else {
2824         fail "$what: invalid Dgit info";
2825     }
2826 }
2827
2828 sub resolve_dsc_field_commit ($$) {
2829     my ($already_distro, $already_mapref) = @_;
2830
2831     return unless defined $dsc_hash;
2832
2833     my $mapref =
2834         defined $already_mapref &&
2835         ($already_distro eq $dsc_distro || !$chase_dsc_distro)
2836         ? $already_mapref : undef;
2837
2838     my $do_fetch;
2839     $do_fetch = sub {
2840         my ($what, @fetch) = @_;
2841
2842         local $idistro = $dsc_distro;
2843         my $lrf = lrfetchrefs;
2844
2845         if (!$chase_dsc_distro) {
2846             progress
2847                 "not chasing .dsc distro $dsc_distro: not fetching $what";
2848             return 0;
2849         }
2850
2851         progress
2852             ".dsc names distro $dsc_distro: fetching $what";
2853
2854         my $url = access_giturl();
2855         if (!defined $url) {
2856             defined $dsc_hint_url or fail <<END;
2857 .dsc Dgit metadata is in context of distro $dsc_distro
2858 for which we have no configured url and .dsc provides no hint
2859 END
2860             my $proto =
2861                 $dsc_hint_url =~ m#^([-+0-9a-zA-Z]+):# ? $1 :
2862                 $dsc_hint_url =~ m#^/# ? 'file' : 'bad-syntax';
2863             parse_cfg_bool "dsc-url-proto-ok", 'false',
2864                 cfg("dgit.dsc-url-proto-ok.$proto",
2865                     "dgit.default.dsc-url-proto-ok")
2866                 or fail <<END;
2867 .dsc Dgit metadata is in context of distro $dsc_distro
2868 for which we have no configured url;
2869 .dsc provides hinted url with protocol $proto which is unsafe.
2870 (can be overridden by config - consult documentation)
2871 END
2872             $url = $dsc_hint_url;
2873         }
2874
2875         git_lrfetch_sane $url, 1, @fetch;
2876
2877         return $lrf;
2878     };
2879
2880     my $rewrite_enable = do {
2881         local $idistro = $dsc_distro;
2882         access_cfg('rewrite-map-enable', 'RETURN-UNDEF');
2883     };
2884
2885     if (parse_cfg_bool 'rewrite-map-enable', 'true', $rewrite_enable) {
2886         if (!defined $mapref) {
2887             my $lrf = $do_fetch->("rewrite map", $rewritemap) or return;
2888             $mapref = $lrf.'/'.$rewritemap;
2889         }
2890         my $rewritemapdata = git_cat_file $mapref.':map';
2891         if (defined $rewritemapdata
2892             && $rewritemapdata =~ m/^$dsc_hash(?:[ \t](\w+))/m) {
2893             progress
2894                 "server's git history rewrite map contains a relevant entry!";
2895
2896             $dsc_hash = $1;
2897             if (defined $dsc_hash) {
2898                 progress "using rewritten git hash in place of .dsc value";
2899             } else {
2900                 progress "server data says .dsc hash is to be disregarded";
2901             }
2902         }
2903     }
2904
2905     if (!defined git_cat_file $dsc_hash) {
2906         my @tags = map { "tags/".$_ } @$dsc_hint_tag;
2907         my $lrf = $do_fetch->("additional commits", @tags) &&
2908             defined git_cat_file $dsc_hash
2909             or fail <<END;
2910 .dsc Dgit metadata requires commit $dsc_hash
2911 but we could not obtain that object anywhere.
2912 END
2913         foreach my $t (@tags) {
2914             my $fullrefname = $lrf.'/'.$t;
2915 #           print STDERR "CHK $t $fullrefname ".Dumper(\%lrfetchrefs_f);
2916             next unless $lrfetchrefs_f{$fullrefname};
2917             next unless is_fast_fwd "$fullrefname~0", $dsc_hash;
2918             lrfetchref_used $fullrefname;
2919         }
2920     }
2921 }
2922
2923 sub fetch_from_archive () {
2924     ensure_setup_existing_tree();
2925
2926     # Ensures that lrref() is what is actually in the archive, one way
2927     # or another, according to us - ie this client's
2928     # appropritaely-updated archive view.  Also returns the commit id.
2929     # If there is nothing in the archive, leaves lrref alone and
2930     # returns undef.  git_fetch_us must have already been called.
2931     get_archive_dsc();
2932
2933     if ($dsc) {
2934         parse_dsc_field($dsc, 'last upload to archive');
2935         resolve_dsc_field_commit access_basedistro,
2936             lrfetchrefs."/".$rewritemap
2937     } else {
2938         progress "no version available from the archive";
2939     }
2940
2941     # If the archive's .dsc has a Dgit field, there are three
2942     # relevant git commitids we need to choose between and/or merge
2943     # together:
2944     #   1. $dsc_hash: the Dgit field from the archive
2945     #   2. $lastpush_hash: the suite branch on the dgit git server
2946     #   3. $lastfetch_hash: our local tracking brach for the suite
2947     #
2948     # These may all be distinct and need not be in any fast forward
2949     # relationship:
2950     #
2951     # If the dsc was pushed to this suite, then the server suite
2952     # branch will have been updated; but it might have been pushed to
2953     # a different suite and copied by the archive.  Conversely a more
2954     # recent version may have been pushed with dgit but not appeared
2955     # in the archive (yet).
2956     #
2957     # $lastfetch_hash may be awkward because archive imports
2958     # (particularly, imports of Dgit-less .dscs) are performed only as
2959     # needed on individual clients, so different clients may perform a
2960     # different subset of them - and these imports are only made
2961     # public during push.  So $lastfetch_hash may represent a set of
2962     # imports different to a subsequent upload by a different dgit
2963     # client.
2964     #
2965     # Our approach is as follows:
2966     #
2967     # As between $dsc_hash and $lastpush_hash: if $lastpush_hash is a
2968     # descendant of $dsc_hash, then it was pushed by a dgit user who
2969     # had based their work on $dsc_hash, so we should prefer it.
2970     # Otherwise, $dsc_hash was installed into this suite in the
2971     # archive other than by a dgit push, and (necessarily) after the
2972     # last dgit push into that suite (since a dgit push would have
2973     # been descended from the dgit server git branch); thus, in that
2974     # case, we prefer the archive's version (and produce a
2975     # pseudo-merge to overwrite the dgit server git branch).
2976     #
2977     # (If there is no Dgit field in the archive's .dsc then
2978     # generate_commit_from_dsc uses the version numbers to decide
2979     # whether the suite branch or the archive is newer.  If the suite
2980     # branch is newer it ignores the archive's .dsc; otherwise it
2981     # generates an import of the .dsc, and produces a pseudo-merge to
2982     # overwrite the suite branch with the archive contents.)
2983     #
2984     # The outcome of that part of the algorithm is the `public view',
2985     # and is same for all dgit clients: it does not depend on any
2986     # unpublished history in the local tracking branch.
2987     #
2988     # As between the public view and the local tracking branch: The
2989     # local tracking branch is only updated by dgit fetch, and
2990     # whenever dgit fetch runs it includes the public view in the
2991     # local tracking branch.  Therefore if the public view is not
2992     # descended from the local tracking branch, the local tracking
2993     # branch must contain history which was imported from the archive
2994     # but never pushed; and, its tip is now out of date.  So, we make
2995     # a pseudo-merge to overwrite the old imports and stitch the old
2996     # history in.
2997     #
2998     # Finally: we do not necessarily reify the public view (as
2999     # described above).  This is so that we do not end up stacking two
3000     # pseudo-merges.  So what we actually do is figure out the inputs
3001     # to any public view pseudo-merge and put them in @mergeinputs.
3002
3003     my @mergeinputs;
3004     # $mergeinputs[]{Commit}
3005     # $mergeinputs[]{Info}
3006     # $mergeinputs[0] is the one whose tree we use
3007     # @mergeinputs is in the order we use in the actual commit)
3008     #
3009     # Also:
3010     # $mergeinputs[]{Message} is a commit message to use
3011     # $mergeinputs[]{ReverseParents} if def specifies that parent
3012     #                                list should be in opposite order
3013     # Such an entry has no Commit or Info.  It applies only when found
3014     # in the last entry.  (This ugliness is to support making
3015     # identical imports to previous dgit versions.)
3016
3017     my $lastpush_hash = git_get_ref(lrfetchref());
3018     printdebug "previous reference hash=$lastpush_hash\n";
3019     $lastpush_mergeinput = $lastpush_hash && {
3020         Commit => $lastpush_hash,
3021         Info => "dgit suite branch on dgit git server",
3022     };
3023
3024     my $lastfetch_hash = git_get_ref(lrref());
3025     printdebug "fetch_from_archive: lastfetch=$lastfetch_hash\n";
3026     my $lastfetch_mergeinput = $lastfetch_hash && {
3027         Commit => $lastfetch_hash,
3028         Info => "dgit client's archive history view",
3029     };
3030
3031     my $dsc_mergeinput = $dsc_hash && {
3032         Commit => $dsc_hash,
3033         Info => "Dgit field in .dsc from archive",
3034     };
3035
3036     my $cwd = getcwd();
3037     my $del_lrfetchrefs = sub {
3038         changedir $cwd;
3039         my $gur;
3040         printdebug "del_lrfetchrefs...\n";
3041         foreach my $fullrefname (sort keys %lrfetchrefs_d) {
3042             my $objid = $lrfetchrefs_d{$fullrefname};
3043             printdebug "del_lrfetchrefs: $objid $fullrefname\n";
3044             if (!$gur) {
3045                 $gur ||= new IO::Handle;
3046                 open $gur, "|-", qw(git update-ref --stdin) or die $!;
3047             }
3048             printf $gur "delete %s %s\n", $fullrefname, $objid;
3049         }
3050         if ($gur) {
3051             close $gur or failedcmd "git update-ref delete lrfetchrefs";
3052         }
3053     };
3054
3055     if (defined $dsc_hash) {
3056         ensure_we_have_orig();
3057         if (!$lastpush_hash || $dsc_hash eq $lastpush_hash) {
3058             @mergeinputs = $dsc_mergeinput
3059         } elsif (is_fast_fwd($dsc_hash,$lastpush_hash)) {
3060             print STDERR <<END or die $!;
3061
3062 Git commit in archive is behind the last version allegedly pushed/uploaded.
3063 Commit referred to by archive: $dsc_hash
3064 Last version pushed with dgit: $lastpush_hash
3065 $later_warning_msg
3066 END
3067             @mergeinputs = ($lastpush_mergeinput);
3068         } else {
3069             # Archive has .dsc which is not a descendant of the last dgit
3070             # push.  This can happen if the archive moves .dscs about.
3071             # Just follow its lead.
3072             if (is_fast_fwd($lastpush_hash,$dsc_hash)) {
3073                 progress "archive .dsc names newer git commit";
3074                 @mergeinputs = ($dsc_mergeinput);
3075             } else {
3076                 progress "archive .dsc names other git commit, fixing up";
3077                 @mergeinputs = ($dsc_mergeinput, $lastpush_mergeinput);
3078             }
3079         }
3080     } elsif ($dsc) {
3081         @mergeinputs = generate_commits_from_dsc();
3082         # We have just done an import.  Now, our import algorithm might
3083         # have been improved.  But even so we do not want to generate
3084         # a new different import of the same package.  So if the
3085         # version numbers are the same, just use our existing version.
3086         # If the version numbers are different, the archive has changed
3087         # (perhaps, rewound).
3088         if ($lastfetch_mergeinput &&
3089             !version_compare( (mergeinfo_version $lastfetch_mergeinput),
3090                               (mergeinfo_version $mergeinputs[0]) )) {
3091             @mergeinputs = ($lastfetch_mergeinput);
3092         }
3093     } elsif ($lastpush_hash) {
3094         # only in git, not in the archive yet
3095         @mergeinputs = ($lastpush_mergeinput);
3096         print STDERR <<END or die $!;
3097
3098 Package not found in the archive, but has allegedly been pushed using dgit.
3099 $later_warning_msg
3100 END
3101     } else {
3102         printdebug "nothing found!\n";
3103         if (defined $skew_warning_vsn) {
3104             print STDERR <<END or die $!;
3105
3106 Warning: relevant archive skew detected.
3107 Archive allegedly contains $skew_warning_vsn
3108 But we were not able to obtain any version from the archive or git.
3109
3110 END
3111         }
3112         unshift @end, $del_lrfetchrefs;
3113         return undef;
3114     }
3115
3116     if ($lastfetch_hash &&
3117         !grep {
3118             my $h = $_->{Commit};
3119             $h and is_fast_fwd($lastfetch_hash, $h);
3120             # If true, one of the existing parents of this commit
3121             # is a descendant of the $lastfetch_hash, so we'll
3122             # be ff from that automatically.
3123         } @mergeinputs
3124         ) {
3125         # Otherwise:
3126         push @mergeinputs, $lastfetch_mergeinput;
3127     }
3128
3129     printdebug "fetch mergeinfos:\n";
3130     foreach my $mi (@mergeinputs) {
3131         if ($mi->{Info}) {
3132             printdebug " commit $mi->{Commit} $mi->{Info}\n";
3133         } else {
3134             printdebug sprintf " ReverseParents=%d Message=%s",
3135                 $mi->{ReverseParents}, $mi->{Message};
3136         }
3137     }
3138
3139     my $compat_info= pop @mergeinputs
3140         if $mergeinputs[$#mergeinputs]{Message};
3141
3142     @mergeinputs = grep { defined $_->{Commit} } @mergeinputs;
3143
3144     my $hash;
3145     if (@mergeinputs > 1) {
3146         # here we go, then:
3147         my $tree_commit = $mergeinputs[0]{Commit};
3148
3149         my $tree = cmdoutput @git, qw(cat-file commit), $tree_commit;
3150         $tree =~ m/\n\n/;  $tree = $`;
3151         $tree =~ m/^tree (\w+)$/m or die "$dsc_hash tree ?";
3152         $tree = $1;
3153
3154         # We use the changelog author of the package in question the
3155         # author of this pseudo-merge.  This is (roughly) correct if
3156         # this commit is simply representing aa non-dgit upload.
3157         # (Roughly because it does not record sponsorship - but we
3158         # don't have sponsorship info because that's in the .changes,
3159         # which isn't in the archivw.)
3160         #
3161         # But, it might be that we are representing archive history
3162         # updates (including in-archive copies).  These are not really
3163         # the responsibility of the person who created the .dsc, but
3164         # there is no-one whose name we should better use.  (The
3165         # author of the .dsc-named commit is clearly worse.)
3166
3167         my $useclogp = mergeinfo_getclogp $mergeinputs[0];
3168         my $author = clogp_authline $useclogp;
3169         my $cversion = getfield $useclogp, 'Version';
3170
3171         my $mcf = dgit_privdir()."/mergecommit";
3172         open MC, ">", $mcf or die "$mcf $!";
3173         print MC <<END or die $!;
3174 tree $tree
3175 END
3176
3177         my @parents = grep { $_->{Commit} } @mergeinputs;
3178         @parents = reverse @parents if $compat_info->{ReverseParents};
3179         print MC <<END or die $! foreach @parents;
3180 parent $_->{Commit}
3181 END
3182
3183         print MC <<END or die $!;
3184 author $author
3185 committer $author
3186
3187 END
3188
3189         if (defined $compat_info->{Message}) {
3190             print MC $compat_info->{Message} or die $!;
3191         } else {
3192             print MC <<END or die $!;
3193 Record $package ($cversion) in archive suite $csuite
3194
3195 Record that
3196 END
3197             my $message_add_info = sub {
3198                 my ($mi) = (@_);
3199                 my $mversion = mergeinfo_version $mi;
3200                 printf MC "  %-20s %s\n", $mversion, $mi->{Info}
3201                     or die $!;
3202             };
3203
3204             $message_add_info->($mergeinputs[0]);
3205             print MC <<END or die $!;
3206 should be treated as descended from
3207 END
3208             $message_add_info->($_) foreach @mergeinputs[1..$#mergeinputs];
3209         }
3210
3211         close MC or die $!;
3212         $hash = make_commit $mcf;
3213     } else {
3214         $hash = $mergeinputs[0]{Commit};
3215     }
3216     printdebug "fetch hash=$hash\n";
3217
3218     my $chkff = sub {
3219         my ($lasth, $what) = @_;
3220         return unless $lasth;
3221         die "$lasth $hash $what ?" unless is_fast_fwd($lasth, $hash);
3222     };
3223
3224     $chkff->($lastpush_hash, 'dgit repo server tip (last push)')
3225         if $lastpush_hash;
3226     $chkff->($lastfetch_hash, 'local tracking tip (last fetch)');
3227
3228     fetch_from_archive_record_1($hash);
3229
3230     if (defined $skew_warning_vsn) {
3231         printdebug "SKEW CHECK WANT $skew_warning_vsn\n";
3232         my $gotclogp = commit_getclogp($hash);
3233         my $got_vsn = getfield $gotclogp, 'Version';
3234         printdebug "SKEW CHECK GOT $got_vsn\n";
3235         if (version_compare($got_vsn, $skew_warning_vsn) < 0) {
3236             print STDERR <<END or die $!;
3237
3238 Warning: archive skew detected.  Using the available version:
3239 Archive allegedly contains    $skew_warning_vsn
3240 We were able to obtain only   $got_vsn
3241
3242 END
3243         }
3244     }
3245
3246     if ($lastfetch_hash ne $hash) {
3247         fetch_from_archive_record_2($hash);
3248     }
3249
3250     lrfetchref_used lrfetchref();
3251
3252     check_gitattrs($hash, "fetched source tree");
3253
3254     unshift @end, $del_lrfetchrefs;
3255     return $hash;
3256 }
3257
3258 sub set_local_git_config ($$) {
3259     my ($k, $v) = @_;
3260     runcmd @git, qw(config), $k, $v;
3261 }
3262
3263 sub setup_mergechangelogs (;$) {
3264     my ($always) = @_;
3265     return unless $always || access_cfg_bool(1, 'setup-mergechangelogs');
3266
3267     my $driver = 'dpkg-mergechangelogs';
3268     my $cb = "merge.$driver";
3269     confess unless defined $maindir;
3270     my $attrs = "$maindir_gitcommon/info/attributes";
3271     ensuredir "$maindir_gitcommon/info";
3272
3273     open NATTRS, ">", "$attrs.new" or die "$attrs.new $!";
3274     if (!open ATTRS, "<", $attrs) {
3275         $!==ENOENT or die "$attrs: $!";
3276     } else {
3277         while (<ATTRS>) {
3278             chomp;
3279             next if m{^debian/changelog\s};
3280             print NATTRS $_, "\n" or die $!;
3281         }
3282         ATTRS->error and die $!;
3283         close ATTRS;
3284     }
3285     print NATTRS "debian/changelog merge=$driver\n" or die $!;
3286     close NATTRS;
3287
3288     set_local_git_config "$cb.name", 'debian/changelog merge driver';
3289     set_local_git_config "$cb.driver", 'dpkg-mergechangelogs -m %O %A %B %A';
3290
3291     rename "$attrs.new", "$attrs" or die "$attrs: $!";
3292 }
3293
3294 sub setup_useremail (;$) {
3295     my ($always) = @_;
3296     return unless $always || access_cfg_bool(1, 'setup-useremail');
3297
3298     my $setup = sub {
3299         my ($k, $envvar) = @_;
3300         my $v = access_cfg("user-$k", 'RETURN-UNDEF') // $ENV{$envvar};
3301         return unless defined $v;
3302         set_local_git_config "user.$k", $v;
3303     };
3304
3305     $setup->('email', 'DEBEMAIL');
3306     $setup->('name', 'DEBFULLNAME');
3307 }
3308
3309 sub ensure_setup_existing_tree () {
3310     my $k = "remote.$remotename.skipdefaultupdate";
3311     my $c = git_get_config $k;
3312     return if defined $c;
3313     set_local_git_config $k, 'true';
3314 }
3315
3316 sub open_main_gitattrs () {
3317     my $gai = new IO::File "$maindir_gitcommon/info/attributes"
3318         or $!==ENOENT
3319         or die "open $maindir_gitcommon/info/attributes: $!";
3320     return $gai;
3321 }
3322
3323 sub is_gitattrs_setup () {
3324     my $gai = open_main_gitattrs();
3325     return 0 unless $gai;
3326     while (<$gai>) {
3327         return 1 if m{^\[attr\]dgit-defuse-attrs\s};
3328     }
3329     $gai->error and die $!;
3330     return 0;
3331 }    
3332
3333 sub setup_gitattrs (;$) {
3334     my ($always) = @_;
3335     return unless $always || access_cfg_bool(1, 'setup-gitattributes');
3336
3337     if (is_gitattrs_setup()) {
3338         progress <<END;
3339 [attr]dgit-defuse-attrs already found in .git/info/attributes
3340  not doing further gitattributes setup
3341 END
3342         return;
3343     }
3344     my $af = "$maindir_gitcommon/info/attributes";
3345     ensuredir "$maindir_gitcommon/info";
3346     open GAO, "> $af.new" or die $!;
3347     print GAO <<END or die $!;
3348 *       dgit-defuse-attrs
3349 [attr]dgit-defuse-attrs $negate_harmful_gitattrs
3350 # ^ see GITATTRIBUTES in dgit(7) and dgit setup-new-tree in dgit(1)
3351 END
3352     my $gai = open_main_gitattrs();
3353     if ($gai) {
3354         while (<$gai>) {
3355             chomp;
3356             print GAO $_, "\n" or die $!;
3357         }
3358         $gai->error and die $!;
3359     }
3360     close GAO or die $!;
3361     rename "$af.new", "$af" or die "install $af: $!";
3362 }
3363
3364 sub setup_new_tree () {
3365     setup_mergechangelogs();
3366     setup_useremail();
3367     setup_gitattrs();
3368 }
3369
3370 sub check_gitattrs ($$) {
3371     my ($treeish, $what) = @_;
3372
3373     return if is_gitattrs_setup;
3374
3375     local $/="\0";
3376     my @cmd = (@git, qw(ls-tree -lrz --), "${treeish}:");
3377     debugcmd "|",@cmd;
3378     my $gafl = new IO::File;
3379     open $gafl, "-|", @cmd or die $!;
3380     while (<$gafl>) {
3381         chomp or die;
3382         s/^\d+\s+\w+\s+\w+\s+(\d+)\t// or die;
3383         next if $1 == 0;
3384         next unless m{(?:^|/)\.gitattributes$};
3385
3386         # oh dear, found one
3387         print STDERR <<END;
3388 dgit: warning: $what contains .gitattributes
3389 dgit: .gitattributes have not been defused.  Recommended: dgit setup-new-tree.
3390 END
3391         close $gafl;
3392         return;
3393     }
3394     # tree contains no .gitattributes files
3395     $?=0; $!=0; close $gafl or failedcmd @cmd;
3396 }
3397
3398
3399 sub multisuite_suite_child ($$$) {
3400     my ($tsuite, $merginputs, $fn) = @_;
3401     # in child, sets things up, calls $fn->(), and returns undef
3402     # in parent, returns canonical suite name for $tsuite
3403     my $canonsuitefh = IO::File::new_tmpfile;
3404     my $pid = fork // die $!;
3405     if (!$pid) {
3406         forkcheck_setup();
3407         $isuite = $tsuite;
3408         $us .= " [$isuite]";
3409         $debugprefix .= " ";
3410         progress "fetching $tsuite...";
3411         canonicalise_suite();
3412         print $canonsuitefh $csuite, "\n" or die $!;
3413         close $canonsuitefh or die $!;
3414         $fn->();
3415         return undef;
3416     }
3417     waitpid $pid,0 == $pid or die $!;
3418     fail "failed to obtain $tsuite: ".waitstatusmsg() if $? && $?!=256*4;
3419     seek $canonsuitefh,0,0 or die $!;
3420     local $csuite = <$canonsuitefh>;
3421     die $! unless defined $csuite && chomp $csuite;
3422     if ($? == 256*4) {
3423         printdebug "multisuite $tsuite missing\n";
3424         return $csuite;
3425     }
3426     printdebug "multisuite $tsuite ok (canon=$csuite)\n";
3427     push @$merginputs, {
3428         Ref => lrref,
3429         Info => $csuite,
3430     };
3431     return $csuite;
3432 }
3433
3434 sub fork_for_multisuite ($) {
3435     my ($before_fetch_merge) = @_;
3436     # if nothing unusual, just returns ''
3437     #
3438     # if multisuite:
3439     # returns 0 to caller in child, to do first of the specified suites
3440     # in child, $csuite is not yet set
3441     #
3442     # returns 1 to caller in parent, to finish up anything needed after
3443     # in parent, $csuite is set to canonicalised portmanteau
3444
3445     my $org_isuite = $isuite;
3446     my @suites = split /\,/, $isuite;
3447     return '' unless @suites > 1;
3448     printdebug "fork_for_multisuite: @suites\n";
3449
3450     my @mergeinputs;
3451
3452     my $cbasesuite = multisuite_suite_child($suites[0], \@mergeinputs,
3453                                             sub { });
3454     return 0 unless defined $cbasesuite;
3455
3456     fail "package $package missing in (base suite) $cbasesuite"
3457         unless @mergeinputs;
3458
3459     my @csuites = ($cbasesuite);
3460
3461     $before_fetch_merge->();
3462
3463     foreach my $tsuite (@suites[1..$#suites]) {
3464         $tsuite =~ s/^-/$cbasesuite-/;
3465         my $csubsuite = multisuite_suite_child($tsuite, \@mergeinputs,
3466                                                sub {
3467             @end = ();
3468             fetch();
3469             exit 0;
3470         });
3471         # xxx collecte the ref here
3472
3473         $csubsuite =~ s/^\Q$cbasesuite\E-/-/;
3474         push @csuites, $csubsuite;
3475     }
3476
3477     foreach my $mi (@mergeinputs) {
3478         my $ref = git_get_ref $mi->{Ref};
3479         die "$mi->{Ref} ?" unless length $ref;
3480         $mi->{Commit} = $ref;
3481     }
3482
3483     $csuite = join ",", @csuites;
3484
3485     my $previous = git_get_ref lrref;
3486     if ($previous) {
3487         unshift @mergeinputs, {
3488             Commit => $previous,
3489             Info => "local combined tracking branch",
3490             Warning =>
3491  "archive seems to have rewound: local tracking branch is ahead!",
3492         };
3493     }
3494
3495     foreach my $ix (0..$#mergeinputs) {
3496         $mergeinputs[$ix]{Index} = $ix;
3497     }
3498
3499     @mergeinputs = sort {
3500         -version_compare(mergeinfo_version $a,
3501                          mergeinfo_version $b) # highest version first
3502             or
3503         $a->{Index} <=> $b->{Index}; # earliest in spec first
3504     } @mergeinputs;
3505
3506     my @needed;
3507
3508   NEEDED:
3509     foreach my $mi (@mergeinputs) {
3510         printdebug "multisuite merge check $mi->{Info}\n";
3511         foreach my $previous (@needed) {
3512             next unless is_fast_fwd $mi->{Commit}, $previous->{Commit};
3513             printdebug "multisuite merge un-needed $previous->{Info}\n";
3514             next NEEDED;
3515         }
3516         push @needed, $mi;
3517         printdebug "multisuite merge this-needed\n";
3518         $mi->{Character} = '+';
3519     }
3520
3521     $needed[0]{Character} = '*';
3522
3523     my $output = $needed[0]{Commit};
3524
3525     if (@needed > 1) {
3526         printdebug "multisuite merge nontrivial\n";
3527         my $tree = cmdoutput qw(git rev-parse), $needed[0]{Commit}.':';
3528
3529         my $commit = "tree $tree\n";
3530         my $msg = "Combine archive branches $csuite [dgit]\n\n".
3531             "Input branches:\n";
3532
3533         foreach my $mi (sort { $a->{Index} <=> $b->{Index} } @mergeinputs) {
3534             printdebug "multisuite merge include $mi->{Info}\n";
3535             $mi->{Character} //= ' ';
3536             $commit .= "parent $mi->{Commit}\n";
3537             $msg .= sprintf " %s  %-25s %s\n",
3538                 $mi->{Character},
3539                 (mergeinfo_version $mi),
3540                 $mi->{Info};
3541         }
3542         my $authline = clogp_authline mergeinfo_getclogp $needed[0];
3543         $msg .= "\nKey\n".
3544             " * marks the highest version branch, which choose to use\n".
3545             " + marks each branch which was not already an ancestor\n\n".
3546             "[dgit multi-suite $csuite]\n";
3547         $commit .=
3548             "author $authline\n".
3549             "committer $authline\n\n";
3550         $output = make_commit_text $commit.$msg;
3551         printdebug "multisuite merge generated $output\n";
3552     }
3553
3554     fetch_from_archive_record_1($output);
3555     fetch_from_archive_record_2($output);
3556
3557     progress "calculated combined tracking suite $csuite";
3558
3559     return 1;
3560 }
3561
3562 sub clone_set_head () {
3563     open H, "> .git/HEAD" or die $!;
3564     print H "ref: ".lref()."\n" or die $!;
3565     close H or die $!;
3566 }
3567 sub clone_finish ($) {
3568     my ($dstdir) = @_;
3569     runcmd @git, qw(reset --hard), lrref();
3570     runcmd qw(bash -ec), <<'END';
3571         set -o pipefail
3572         git ls-tree -r --name-only -z HEAD | \
3573         xargs -0r touch -h -r . --
3574 END
3575     printdone "ready for work in $dstdir";
3576 }
3577
3578 sub clone ($) {
3579     # in multisuite, returns twice!
3580     # once in parent after first suite fetched,
3581     # and then again in child after everything is finished
3582     my ($dstdir) = @_;
3583     badusage "dry run makes no sense with clone" unless act_local();
3584
3585     my $multi_fetched = fork_for_multisuite(sub {
3586         printdebug "multi clone before fetch merge\n";
3587         changedir $dstdir;
3588         record_maindir();
3589     });
3590     if ($multi_fetched) {
3591         printdebug "multi clone after fetch merge\n";
3592         clone_set_head();
3593         clone_finish($dstdir);
3594         return;
3595     }
3596     printdebug "clone main body\n";
3597
3598     canonicalise_suite();
3599     my $hasgit = check_for_git();
3600     mkdir $dstdir or fail "create \`$dstdir': $!";
3601     changedir $dstdir;
3602     runcmd @git, qw(init -q);
3603     record_maindir();
3604     setup_new_tree();
3605     clone_set_head();
3606     my $giturl = access_giturl(1);
3607     if (defined $giturl) {
3608         runcmd @git, qw(remote add), 'origin', $giturl;
3609     }
3610     if ($hasgit) {
3611         progress "fetching existing git history";
3612         git_fetch_us();
3613         runcmd_ordryrun_local @git, qw(fetch origin);
3614     } else {
3615         progress "starting new git history";
3616     }
3617     fetch_from_archive() or no_such_package;
3618     my $vcsgiturl = $dsc->{'Vcs-Git'};
3619     if (length $vcsgiturl) {
3620         $vcsgiturl =~ s/\s+-b\s+\S+//g;
3621         runcmd @git, qw(remote add vcs-git), $vcsgiturl;
3622     }
3623     clone_finish($dstdir);
3624 }
3625
3626 sub fetch () {
3627     canonicalise_suite();
3628     if (check_for_git()) {
3629         git_fetch_us();
3630     }
3631     fetch_from_archive() or no_such_package();
3632     printdone "fetched into ".lrref();
3633 }
3634
3635 sub pull () {
3636     my $multi_fetched = fork_for_multisuite(sub { });
3637     fetch() unless $multi_fetched; # parent
3638     return if $multi_fetched eq '0'; # child
3639     runcmd_ordryrun_local @git, qw(merge -m),"Merge from $csuite [dgit]",
3640         lrref();
3641     printdone "fetched to ".lrref()." and merged into HEAD";
3642 }
3643
3644 sub check_not_dirty () {
3645     foreach my $f (qw(local-options local-patch-header)) {
3646         if (stat_exists "debian/source/$f") {
3647             fail "git tree contains debian/source/$f";
3648         }
3649     }
3650
3651     return if $ignoredirty;
3652
3653     my @cmd = (@git, qw(diff --quiet HEAD));
3654     debugcmd "+",@cmd;
3655     $!=0; $?=-1; system @cmd;
3656     return if !$?;
3657     if ($?==256) {
3658         fail "working tree is dirty (does not match HEAD)";
3659     } else {
3660         failedcmd @cmd;
3661     }
3662 }
3663
3664 sub commit_admin ($) {
3665     my ($m) = @_;
3666     progress "$m";
3667     runcmd_ordryrun_local @git, qw(commit -m), $m;
3668 }
3669
3670 sub commit_quilty_patch () {
3671     my $output = cmdoutput @git, qw(status --porcelain);
3672     my %adds;
3673     foreach my $l (split /\n/, $output) {
3674         next unless $l =~ m/\S/;
3675         if ($l =~ m{^(?:\?\?| M) (.pc|debian/patches)}) {
3676             $adds{$1}++;
3677         }
3678     }
3679     delete $adds{'.pc'}; # if there wasn't one before, don't add it
3680     if (!%adds) {
3681         progress "nothing quilty to commit, ok.";
3682         return;
3683     }
3684     my @adds = map { s/[][*?\\]/\\$&/g; $_; } sort keys %adds;
3685     runcmd_ordryrun_local @git, qw(add -f), @adds;
3686     commit_admin <<END
3687 Commit Debian 3.0 (quilt) metadata
3688
3689 [dgit ($our_version) quilt-fixup]
3690 END
3691 }
3692
3693 sub get_source_format () {
3694     my %options;
3695     if (open F, "debian/source/options") {
3696         while (<F>) {
3697             next if m/^\s*\#/;
3698             next unless m/\S/;
3699             s/\s+$//; # ignore missing final newline
3700             if (m/\s*\#\s*/) {
3701                 my ($k, $v) = ($`, $'); #');
3702                 $v =~ s/^"(.*)"$/$1/;
3703                 $options{$k} = $v;
3704             } else {
3705                 $options{$_} = 1;
3706             }
3707         }
3708         F->error and die $!;
3709         close F;
3710     } else {
3711         die $! unless $!==&ENOENT;
3712     }
3713
3714     if (!open F, "debian/source/format") {
3715         die $! unless $!==&ENOENT;
3716         return '';
3717     }
3718     $_ = <F>;
3719     F->error and die $!;
3720     chomp;
3721     return ($_, \%options);
3722 }
3723
3724 sub madformat_wantfixup ($) {
3725     my ($format) = @_;
3726     return 0 unless $format eq '3.0 (quilt)';
3727     our $quilt_mode_warned;
3728     if ($quilt_mode eq 'nocheck') {
3729         progress "Not doing any fixup of \`$format' due to".
3730             " ----no-quilt-fixup or --quilt=nocheck"
3731             unless $quilt_mode_warned++;
3732         return 0;
3733     }
3734     progress "Format \`$format', need to check/update patch stack"
3735         unless $quilt_mode_warned++;
3736     return 1;
3737 }
3738
3739 sub maybe_split_brain_save ($$$) {
3740     my ($headref, $dgitview, $msg) = @_;
3741     # => message fragment "$saved" describing disposition of $dgitview
3742     return "commit id $dgitview" unless defined $split_brain_save;
3743     my @cmd = (shell_cmd 'cd "$1"; shift', $maindir,
3744                @git, qw(update-ref -m),
3745                "dgit --dgit-view-save $msg HEAD=$headref",
3746                $split_brain_save, $dgitview);
3747     runcmd @cmd;
3748     return "and left in $split_brain_save";
3749 }
3750
3751 # An "infopair" is a tuple [ $thing, $what ]
3752 # (often $thing is a commit hash; $what is a description)
3753
3754 sub infopair_cond_equal ($$) {
3755     my ($x,$y) = @_;
3756     $x->[0] eq $y->[0] or fail <<END;
3757 $x->[1] ($x->[0]) not equal to $y->[1] ($y->[0])
3758 END
3759 };
3760
3761 sub infopair_lrf_tag_lookup ($$) {
3762     my ($tagnames, $what) = @_;
3763     # $tagname may be an array ref
3764     my @tagnames = ref $tagnames ? @$tagnames : ($tagnames);
3765     printdebug "infopair_lrfetchref_tag_lookup $what @tagnames\n";
3766     foreach my $tagname (@tagnames) {
3767         my $lrefname = lrfetchrefs."/tags/$tagname";
3768         my $tagobj = $lrfetchrefs_f{$lrefname};
3769         next unless defined $tagobj;
3770         printdebug "infopair_lrfetchref_tag_lookup $tagobj $tagname $what\n";
3771         return [ git_rev_parse($tagobj), $what ];
3772     }
3773     fail @tagnames==1 ? <<END : <<END;
3774 Wanted tag $what (@tagnames) on dgit server, but not found
3775 END
3776 Wanted tag $what (one of: @tagnames) on dgit server, but not found
3777 END
3778 }
3779
3780 sub infopair_cond_ff ($$) {
3781     my ($anc,$desc) = @_;
3782     is_fast_fwd($anc->[0], $desc->[0]) or fail <<END;
3783 $anc->[1] ($anc->[0]) .. $desc->[1] ($desc->[0]) is not fast forward
3784 END
3785 };
3786
3787 sub pseudomerge_version_check ($$) {
3788     my ($clogp, $archive_hash) = @_;
3789
3790     my $arch_clogp = commit_getclogp $archive_hash;
3791     my $i_arch_v = [ (getfield $arch_clogp, 'Version'),
3792                      'version currently in archive' ];
3793     if (defined $overwrite_version) {
3794         if (length $overwrite_version) {
3795             infopair_cond_equal([ $overwrite_version,
3796                                   '--overwrite= version' ],
3797                                 $i_arch_v);
3798         } else {
3799             my $v = $i_arch_v->[0];
3800             progress "Checking package changelog for archive version $v ...";
3801             my $cd;
3802             eval {
3803                 my @xa = ("-f$v", "-t$v");
3804                 my $vclogp = parsechangelog @xa;
3805                 my $gf = sub {
3806                     my ($fn) = @_;
3807                     [ (getfield $vclogp, $fn),
3808                       "$fn field from dpkg-parsechangelog @xa" ];
3809                 };
3810                 my $cv = $gf->('Version');
3811                 infopair_cond_equal($i_arch_v, $cv);
3812                 $cd = $gf->('Distribution');
3813             };
3814             if ($@) {
3815                 $@ =~ s/^dgit: //gm;
3816                 fail "$@".
3817                     "Perhaps debian/changelog does not mention $v ?";
3818             }
3819             fail <<END if $cd->[0] =~ m/UNRELEASED/;
3820 $cd->[1] is $cd->[0]
3821 Your tree seems to based on earlier (not uploaded) $v.
3822 END
3823         }
3824     }
3825     
3826     printdebug "pseudomerge_version_check i_arch_v @$i_arch_v\n";
3827     return $i_arch_v;
3828 }
3829
3830 sub pseudomerge_make_commit ($$$$ $$) {
3831     my ($clogp, $dgitview, $archive_hash, $i_arch_v,
3832         $msg_cmd, $msg_msg) = @_;
3833     progress "Declaring that HEAD inciudes all changes in $i_arch_v->[0]...";
3834
3835     my $tree = cmdoutput qw(git rev-parse), "${dgitview}:";
3836     my $authline = clogp_authline $clogp;
3837
3838     chomp $msg_msg;
3839     $msg_cmd .=
3840         !defined $overwrite_version ? ""
3841         : !length  $overwrite_version ? " --overwrite"
3842         : " --overwrite=".$overwrite_version;
3843
3844     my $pmf = dgit_privdir()."/pseudomerge";
3845     open MC, ">", $pmf or die "$pmf $!";
3846     print MC <<END or die $!;
3847 tree $tree
3848 parent $dgitview
3849 parent $archive_hash
3850 author $authline
3851 committer $authline
3852
3853 $msg_msg
3854
3855 [$msg_cmd]
3856 END
3857     close MC or die $!;
3858
3859     return make_commit($pmf);
3860 }
3861
3862 sub splitbrain_pseudomerge ($$$$) {
3863     my ($clogp, $maintview, $dgitview, $archive_hash) = @_;
3864     # => $merged_dgitview
3865     printdebug "splitbrain_pseudomerge...\n";
3866     #
3867     #     We:      debian/PREVIOUS    HEAD($maintview)
3868     # expect:          o ----------------- o
3869     #                    \                   \
3870     #                     o                   o
3871     #                 a/d/PREVIOUS        $dgitview
3872     #                $archive_hash              \
3873     #  If so,                \                   \
3874     #  we do:                 `------------------ o
3875     #   this:                                   $dgitview'
3876     #
3877
3878     return $dgitview unless defined $archive_hash;
3879     return $dgitview if deliberately_not_fast_forward();
3880
3881     printdebug "splitbrain_pseudomerge...\n";
3882
3883     my $i_arch_v = pseudomerge_version_check($clogp, $archive_hash);
3884
3885     if (!defined $overwrite_version) {
3886         progress "Checking that HEAD inciudes all changes in archive...";
3887     }
3888
3889     return $dgitview if is_fast_fwd $archive_hash, $dgitview;
3890
3891     if (defined $overwrite_version) {
3892     } elsif (!eval {
3893         my $t_dep14 = debiantag_maintview $i_arch_v->[0], access_nomdistro;
3894         my $i_dep14 = infopair_lrf_tag_lookup($t_dep14, "maintainer view tag");
3895         my $t_dgit = debiantag_new $i_arch_v->[0], access_nomdistro;
3896         my $i_dgit = infopair_lrf_tag_lookup($t_dgit, "dgit view tag");
3897         my $i_archive = [ $archive_hash, "current archive contents" ];
3898
3899         printdebug "splitbrain_pseudomerge i_archive @$i_archive\n";
3900
3901         infopair_cond_equal($i_dgit, $i_archive);
3902         infopair_cond_ff($i_dep14, $i_dgit);
3903         infopair_cond_ff($i_dep14, [ $maintview, 'HEAD' ]);
3904         1;
3905     }) {
3906         print STDERR <<END;
3907 $us: check failed (maybe --overwrite is needed, consult documentation)
3908 END
3909         die "$@";
3910     }
3911
3912     my $r = pseudomerge_make_commit
3913         $clogp, $dgitview, $archive_hash, $i_arch_v,
3914         "dgit --quilt=$quilt_mode",
3915         (defined $overwrite_version ? <<END_OVERWR : <<END_MAKEFF);
3916 Declare fast forward from $i_arch_v->[0]
3917 END_OVERWR
3918 Make fast forward from $i_arch_v->[0]
3919 END_MAKEFF
3920
3921     maybe_split_brain_save $maintview, $r, "pseudomerge";
3922
3923     progress "Made pseudo-merge of $i_arch_v->[0] into dgit view.";
3924     return $r;
3925 }       
3926
3927 sub plain_overwrite_pseudomerge ($$$) {
3928     my ($clogp, $head, $archive_hash) = @_;
3929
3930     printdebug "plain_overwrite_pseudomerge...";
3931
3932     my $i_arch_v = pseudomerge_version_check($clogp, $archive_hash);
3933
3934     return $head if is_fast_fwd $archive_hash, $head;
3935
3936     my $m = "Declare fast forward from $i_arch_v->[0]";
3937
3938     my $r = pseudomerge_make_commit
3939         $clogp, $head, $archive_hash, $i_arch_v,
3940         "dgit", $m;
3941
3942     runcmd @git, qw(update-ref -m), $m, 'HEAD', $r, $head;
3943
3944     progress "Make pseudo-merge of $i_arch_v->[0] into your HEAD.";
3945     return $r;
3946 }
3947
3948 sub push_parse_changelog ($) {
3949     my ($clogpfn) = @_;
3950
3951     my $clogp = Dpkg::Control::Hash->new();
3952     $clogp->load($clogpfn) or die;
3953
3954     my $clogpackage = getfield $clogp, 'Source';
3955     $package //= $clogpackage;
3956     fail "-p specified $package but changelog specified $clogpackage"
3957         unless $package eq $clogpackage;
3958     my $cversion = getfield $clogp, 'Version';
3959
3960     if (!$we_are_initiator) {
3961         # rpush initiator can't do this because it doesn't have $isuite yet
3962         my $tag = debiantag($cversion, access_nomdistro);
3963         runcmd @git, qw(check-ref-format), $tag;
3964     }
3965
3966     my $dscfn = dscfn($cversion);
3967
3968     return ($clogp, $cversion, $dscfn);
3969 }
3970
3971 sub push_parse_dsc ($$$) {
3972     my ($dscfn,$dscfnwhat, $cversion) = @_;
3973     $dsc = parsecontrol($dscfn,$dscfnwhat);
3974     my $dversion = getfield $dsc, 'Version';
3975     my $dscpackage = getfield $dsc, 'Source';
3976     ($dscpackage eq $package && $dversion eq $cversion) or
3977         fail "$dscfn is for $dscpackage $dversion".
3978             " but debian/changelog is for $package $cversion";
3979 }
3980
3981 sub push_tagwants ($$$$) {
3982     my ($cversion, $dgithead, $maintviewhead, $tfbase) = @_;
3983     my @tagwants;
3984     push @tagwants, {
3985         TagFn => \&debiantag,
3986         Objid => $dgithead,
3987         TfSuffix => '',
3988         View => 'dgit',
3989     };
3990     if (defined $maintviewhead) {
3991         push @tagwants, {
3992             TagFn => \&debiantag_maintview,
3993             Objid => $maintviewhead,
3994             TfSuffix => '-maintview',
3995             View => 'maint',
3996         };
3997     } elsif ($dodep14tag eq 'no' ? 0
3998              : $dodep14tag eq 'want' ? access_cfg_tagformats_can_splitbrain
3999              : $dodep14tag eq 'always'
4000              ? (access_cfg_tagformats_can_splitbrain or fail <<END)
4001 --dep14tag-always (or equivalent in config) means server must support
4002  both "new" and "maint" tag formats, but config says it doesn't.
4003 END
4004             : die "$dodep14tag ?") {
4005         push @tagwants, {
4006             TagFn => \&debiantag_maintview,
4007             Objid => $dgithead,
4008             TfSuffix => '-dgit',
4009             View => 'dgit',
4010         };
4011     };
4012     foreach my $tw (@tagwants) {
4013         $tw->{Tag} = $tw->{TagFn}($cversion, access_nomdistro);
4014         $tw->{Tfn} = sub { $tfbase.$tw->{TfSuffix}.$_[0]; };
4015     }
4016     printdebug 'push_tagwants: ', Dumper(\@_, \@tagwants);
4017     return @tagwants;
4018 }
4019
4020 sub push_mktags ($$ $$ $) {
4021     my ($clogp,$dscfn,
4022         $changesfile,$changesfilewhat,
4023         $tagwants) = @_;
4024
4025     die unless $tagwants->[0]{View} eq 'dgit';
4026
4027     my $declaredistro = access_nomdistro();
4028     my $reader_giturl = do { local $access_forpush=0; access_giturl(); };
4029     $dsc->{$ourdscfield[0]} = join " ",
4030         $tagwants->[0]{Objid}, $declaredistro, $tagwants->[0]{Tag},
4031         $reader_giturl;
4032     $dsc->save("$dscfn.tmp") or die $!;
4033
4034     my $changes = parsecontrol($changesfile,$changesfilewhat);
4035     foreach my $field (qw(Source Distribution Version)) {
4036         $changes->{$field} eq $clogp->{$field} or
4037             fail "changes field $field \`$changes->{$field}'".
4038                 " does not match changelog \`$clogp->{$field}'";
4039     }
4040
4041     my $cversion = getfield $clogp, 'Version';
4042     my $clogsuite = getfield $clogp, 'Distribution';
4043
4044     # We make the git tag by hand because (a) that makes it easier
4045     # to control the "tagger" (b) we can do remote signing
4046     my $authline = clogp_authline $clogp;
4047     my $delibs = join(" ", "",@deliberatelies);
4048
4049     my $mktag = sub {
4050         my ($tw) = @_;
4051         my $tfn = $tw->{Tfn};
4052         my $head = $tw->{Objid};
4053         my $tag = $tw->{Tag};
4054
4055         open TO, '>', $tfn->('.tmp') or die $!;
4056         print TO <<END or die $!;
4057 object $head
4058 type commit
4059 tag $tag
4060 tagger $authline
4061
4062 END
4063         if ($tw->{View} eq 'dgit') {
4064             print TO <<END or die $!;
4065 $package release $cversion for $clogsuite ($csuite) [dgit]
4066 [dgit distro=$declaredistro$delibs]
4067 END
4068             foreach my $ref (sort keys %previously) {
4069                 print TO <<END or die $!;
4070 [dgit previously:$ref=$previously{$ref}]
4071 END
4072             }
4073         } elsif ($tw->{View} eq 'maint') {
4074             print TO <<END or die $!;
4075 $package release $cversion for $clogsuite ($csuite)
4076 (maintainer view tag generated by dgit --quilt=$quilt_mode)
4077 END
4078         } else {
4079             die Dumper($tw)."?";
4080         }
4081
4082         close TO or die $!;
4083
4084         my $tagobjfn = $tfn->('.tmp');
4085         if ($sign) {
4086             if (!defined $keyid) {
4087                 $keyid = access_cfg('keyid','RETURN-UNDEF');
4088             }
4089             if (!defined $keyid) {
4090                 $keyid = getfield $clogp, 'Maintainer';
4091             }
4092             unlink $tfn->('.tmp.asc') or $!==&ENOENT or die $!;
4093             my @sign_cmd = (@gpg, qw(--detach-sign --armor));
4094             push @sign_cmd, qw(-u),$keyid if defined $keyid;
4095             push @sign_cmd, $tfn->('.tmp');
4096             runcmd_ordryrun @sign_cmd;
4097             if (act_scary()) {
4098                 $tagobjfn = $tfn->('.signed.tmp');
4099                 runcmd shell_cmd "exec >$tagobjfn", qw(cat --),
4100                     $tfn->('.tmp'), $tfn->('.tmp.asc');
4101             }
4102         }
4103         return $tagobjfn;
4104     };
4105
4106     my @r = map { $mktag->($_); } @$tagwants;
4107     return @r;
4108 }
4109
4110 sub sign_changes ($) {
4111     my ($changesfile) = @_;
4112     if ($sign) {
4113         my @debsign_cmd = @debsign;
4114         push @debsign_cmd, "-k$keyid" if defined $keyid;
4115         push @debsign_cmd, "-p$gpg[0]" if $gpg[0] ne 'gpg';
4116         push @debsign_cmd, $changesfile;
4117         runcmd_ordryrun @debsign_cmd;
4118     }
4119 }
4120
4121 sub dopush () {
4122     printdebug "actually entering push\n";
4123
4124     supplementary_message(<<'END');
4125 Push failed, while checking state of the archive.
4126 You can retry the push, after fixing the problem, if you like.
4127 END
4128     if (check_for_git()) {
4129         git_fetch_us();
4130     }
4131     my $archive_hash = fetch_from_archive();
4132     if (!$archive_hash) {
4133         $new_package or
4134             fail "package appears to be new in this suite;".
4135                 " if this is intentional, use --new";
4136     }
4137
4138     supplementary_message(<<'END');
4139 Push failed, while preparing your push.
4140 You can retry the push, after fixing the problem, if you like.
4141 END
4142
4143     need_tagformat 'new', "quilt mode $quilt_mode"
4144         if quiltmode_splitbrain;
4145
4146     prep_ud();
4147
4148     access_giturl(); # check that success is vaguely likely
4149     rpush_handle_protovsn_bothends() if $we_are_initiator;
4150     select_tagformat();
4151
4152     my $clogpfn = dgit_privdir()."/changelog.822.tmp";
4153     runcmd shell_cmd "exec >$clogpfn", qw(dpkg-parsechangelog);
4154
4155     responder_send_file('parsed-changelog', $clogpfn);
4156
4157     my ($clogp, $cversion, $dscfn) =
4158         push_parse_changelog("$clogpfn");
4159
4160     my $dscpath = "$buildproductsdir/$dscfn";
4161     stat_exists $dscpath or
4162         fail "looked for .dsc $dscpath, but $!;".
4163             " maybe you forgot to build";
4164
4165     responder_send_file('dsc', $dscpath);
4166
4167     push_parse_dsc($dscpath, $dscfn, $cversion);
4168
4169     my $format = getfield $dsc, 'Format';
4170     printdebug "format $format\n";
4171
4172     my $actualhead = git_rev_parse('HEAD');
4173     my $dgithead = $actualhead;
4174     my $maintviewhead = undef;
4175
4176     my $upstreamversion = upstreamversion $clogp->{Version};
4177
4178     if (madformat_wantfixup($format)) {
4179         # user might have not used dgit build, so maybe do this now:
4180         if (quiltmode_splitbrain()) {
4181             changedir $playground;
4182             quilt_make_fake_dsc($upstreamversion);
4183             my $cachekey;
4184             ($dgithead, $cachekey) =
4185                 quilt_check_splitbrain_cache($actualhead, $upstreamversion);
4186             $dgithead or fail
4187  "--quilt=$quilt_mode but no cached dgit view:
4188  perhaps tree changed since dgit build[-source] ?";
4189             $split_brain = 1;
4190             $dgithead = splitbrain_pseudomerge($clogp,
4191                                                $actualhead, $dgithead,
4192                                                $archive_hash);
4193             $maintviewhead = $actualhead;
4194             changedir $maindir;
4195             prep_ud(); # so _only_subdir() works, below
4196         } else {
4197             commit_quilty_patch();
4198         }
4199     }
4200
4201     if (defined $overwrite_version && !defined $maintviewhead) {
4202         $dgithead = plain_overwrite_pseudomerge($clogp,
4203                                                 $dgithead,
4204                                                 $archive_hash);
4205     }
4206
4207     check_not_dirty();
4208
4209     my $forceflag = '';
4210     if ($archive_hash) {
4211         if (is_fast_fwd($archive_hash, $dgithead)) {
4212             # ok
4213         } elsif (deliberately_not_fast_forward) {
4214             $forceflag = '+';
4215         } else {
4216             fail "dgit push: HEAD is not a descendant".
4217                 " of the archive's version.\n".
4218                 "To overwrite the archive's contents,".
4219                 " pass --overwrite[=VERSION].\n".
4220                 "To rewind history, if permitted by the archive,".
4221                 " use --deliberately-not-fast-forward.";
4222         }
4223     }
4224
4225     changedir $playground;
4226     progress "checking that $dscfn corresponds to HEAD";
4227     runcmd qw(dpkg-source -x --),
4228         $dscpath =~ m#^/# ? $dscpath : "$maindir/$dscpath";
4229     my ($tree,$dir) = mktree_in_ud_from_only_subdir("source package");
4230     check_for_vendor_patches() if madformat($dsc->{format});
4231     changedir $maindir;
4232     my @diffcmd = (@git, qw(diff --quiet), $tree, $dgithead);
4233     debugcmd "+",@diffcmd;
4234     $!=0; $?=-1;
4235     my $r = system @diffcmd;
4236     if ($r) {
4237         if ($r==256) {
4238             my $diffs = cmdoutput @git, qw(diff --stat), $tree, $dgithead;
4239             fail <<END
4240 HEAD specifies a different tree to $dscfn:
4241 $diffs
4242 Perhaps you forgot to build.  Or perhaps there is a problem with your
4243  source tree (see dgit(7) for some hints).  To see a full diff, run
4244    git diff $tree HEAD
4245 END
4246         } else {
4247             failedcmd @diffcmd;
4248         }
4249     }
4250     if (!$changesfile) {
4251         my $pat = changespat $cversion;
4252         my @cs = glob "$buildproductsdir/$pat";
4253         fail "failed to find unique changes file".
4254             " (looked for $pat in $buildproductsdir);".
4255             " perhaps you need to use dgit -C"
4256             unless @cs==1;
4257         ($changesfile) = @cs;
4258     } else {
4259         $changesfile = "$buildproductsdir/$changesfile";
4260     }
4261
4262     # Check that changes and .dsc agree enough
4263     $changesfile =~ m{[^/]*$};
4264     my $changes = parsecontrol($changesfile,$&);
4265     files_compare_inputs($dsc, $changes)
4266         unless forceing [qw(dsc-changes-mismatch)];
4267
4268     # Perhaps adjust .dsc to contain right set of origs
4269     changes_update_origs_from_dsc($dsc, $changes, $upstreamversion,
4270                                   $changesfile)
4271         unless forceing [qw(changes-origs-exactly)];
4272
4273     # Checks complete, we're going to try and go ahead:
4274
4275     responder_send_file('changes',$changesfile);
4276     responder_send_command("param head $dgithead");
4277     responder_send_command("param csuite $csuite");
4278     responder_send_command("param isuite $isuite");
4279     responder_send_command("param tagformat $tagformat");
4280     if (defined $maintviewhead) {
4281         die unless ($protovsn//4) >= 4;
4282         responder_send_command("param maint-view $maintviewhead");
4283     }
4284
4285     # Perhaps send buildinfo(s) for signing
4286     my $changes_files = getfield $changes, 'Files';
4287     my @buildinfos = ($changes_files =~ m/ .* (\S+\.buildinfo)$/mg);
4288     foreach my $bi (@buildinfos) {
4289         responder_send_command("param buildinfo-filename $bi");
4290         responder_send_file('buildinfo', "$buildproductsdir/$bi");
4291     }
4292
4293     if (deliberately_not_fast_forward) {
4294         git_for_each_ref(lrfetchrefs, sub {
4295             my ($objid,$objtype,$lrfetchrefname,$reftail) = @_;
4296             my $rrefname= substr($lrfetchrefname, length(lrfetchrefs) + 1);
4297             responder_send_command("previously $rrefname=$objid");
4298             $previously{$rrefname} = $objid;
4299         });
4300     }
4301
4302     my @tagwants = push_tagwants($cversion, $dgithead, $maintviewhead,
4303                                  dgit_privdir()."/tag");
4304     my @tagobjfns;
4305
4306     supplementary_message(<<'END');
4307 Push failed, while signing the tag.
4308 You can retry the push, after fixing the problem, if you like.
4309 END
4310     # If we manage to sign but fail to record it anywhere, it's fine.
4311     if ($we_are_responder) {
4312         @tagobjfns = map { $_->{Tfn}('.signed-tmp') } @tagwants;
4313         responder_receive_files('signed-tag', @tagobjfns);
4314     } else {
4315         @tagobjfns = push_mktags($clogp,$dscpath,
4316                               $changesfile,$changesfile,
4317                               \@tagwants);
4318     }
4319     supplementary_message(<<'END');
4320 Push failed, *after* signing the tag.
4321 If you want to try again, you should use a new version number.
4322 END
4323
4324     pairwise { $a->{TagObjFn} = $b } @tagwants, @tagobjfns;
4325
4326     foreach my $tw (@tagwants) {
4327         my $tag = $tw->{Tag};
4328         my $tagobjfn = $tw->{TagObjFn};
4329         my $tag_obj_hash =
4330             cmdoutput @git, qw(hash-object -w -t tag), $tagobjfn;
4331         runcmd_ordryrun @git, qw(verify-tag), $tag_obj_hash;
4332         runcmd_ordryrun_local
4333             @git, qw(update-ref), "refs/tags/$tag", $tag_obj_hash;
4334     }
4335
4336     supplementary_message(<<'END');
4337 Push failed, while updating the remote git repository - see messages above.
4338 If you want to try again, you should use a new version number.
4339 END
4340     if (!check_for_git()) {
4341         create_remote_git_repo();
4342     }
4343
4344     my @pushrefs = $forceflag.$dgithead.":".rrref();
4345     foreach my $tw (@tagwants) {
4346         push @pushrefs, $forceflag."refs/tags/$tw->{Tag}";
4347     }
4348
4349     runcmd_ordryrun @git,
4350         qw(-c push.followTags=false push), access_giturl(), @pushrefs;
4351     runcmd_ordryrun @git, qw(update-ref -m), 'dgit push', lrref(), $dgithead;
4352
4353     supplementary_message(<<'END');
4354 Push failed, while obtaining signatures on the .changes and .dsc.
4355 If it was just that the signature failed, you may try again by using
4356 debsign by hand to sign the changes
4357    $changesfile
4358 and then dput to complete the upload.
4359 If you need to change the package, you must use a new version number.
4360 END
4361     if ($we_are_responder) {
4362         my $dryrunsuffix = act_local() ? "" : ".tmp";
4363         my @rfiles = ($dscpath, $changesfile);
4364         push @rfiles, map { "$buildproductsdir/$_" } @buildinfos;
4365         responder_receive_files('signed-dsc-changes',
4366                                 map { "$_$dryrunsuffix" } @rfiles);
4367     } else {
4368         if (act_local()) {
4369             rename "$dscpath.tmp",$dscpath or die "$dscfn $!";
4370         } else {
4371             progress "[new .dsc left in $dscpath.tmp]";
4372         }
4373         sign_changes $changesfile;
4374     }
4375
4376     supplementary_message(<<END);
4377 Push failed, while uploading package(s) to the archive server.
4378 You can retry the upload of exactly these same files with dput of:
4379   $changesfile
4380 If that .changes file is broken, you will need to use a new version
4381 number for your next attempt at the upload.
4382 END
4383     my $host = access_cfg('upload-host','RETURN-UNDEF');
4384     my @hostarg = defined($host) ? ($host,) : ();
4385     runcmd_ordryrun @dput, @hostarg, $changesfile;
4386     printdone "pushed and uploaded $cversion";
4387
4388     supplementary_message('');
4389     responder_send_command("complete");
4390 }
4391
4392 sub pre_clone () {
4393     not_necessarily_a_tree();
4394 }
4395 sub cmd_clone {
4396     parseopts();
4397     my $dstdir;
4398     badusage "-p is not allowed with clone; specify as argument instead"
4399         if defined $package;
4400     if (@ARGV==1) {
4401         ($package) = @ARGV;
4402     } elsif (@ARGV==2 && $ARGV[1] =~ m#^\w#) {
4403         ($package,$isuite) = @ARGV;
4404     } elsif (@ARGV==2 && $ARGV[1] =~ m#^[./]#) {
4405        &