chiark / gitweb /
directory handling: dgit: Introduce dgit_privdir and use it
[dgit.git] / dgit
1 #!/usr/bin/perl -w
2 # dgit
3 # Integration between git and Debian-style archives
4 #
5 # Copyright (C)2013-2016 Ian Jackson
6 #
7 # This program is free software: you can redistribute it and/or modify
8 # it under the terms of the GNU General Public License as published by
9 # the Free Software Foundation, either version 3 of the License, or
10 # (at your option) any later version.
11 #
12 # This program is distributed in the hope that it will be useful,
13 # but WITHOUT ANY WARRANTY; without even the implied warranty of
14 # MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
15 # GNU General Public License for more details.
16 #
17 # You should have received a copy of the GNU General Public License
18 # along with this program.  If not, see <http://www.gnu.org/licenses/>.
19
20 use strict;
21
22 use Debian::Dgit qw(:DEFAULT :playground);
23 setup_sigwarn();
24
25 use IO::Handle;
26 use Data::Dumper;
27 use LWP::UserAgent;
28 use Dpkg::Control::Hash;
29 use File::Path;
30 use File::Temp qw(tempdir);
31 use File::Basename;
32 use Dpkg::Version;
33 use POSIX;
34 use IPC::Open2;
35 use Digest::SHA;
36 use Digest::MD5;
37 use List::MoreUtils qw(pairwise);
38 use Text::Glob qw(match_glob);
39 use Fcntl qw(:DEFAULT :flock);
40 use Carp;
41
42 use Debian::Dgit;
43
44 our $our_version = 'UNRELEASED'; ###substituted###
45 our $absurdity = undef; ###substituted###
46
47 our @rpushprotovsn_support = qw(4 3 2); # 4 is new tag format
48 our $protovsn;
49
50 our $cmd;
51 our $subcommand;
52 our $isuite;
53 our $idistro;
54 our $package;
55 our @ropts;
56
57 our $sign = 1;
58 our $dryrun_level = 0;
59 our $changesfile;
60 our $buildproductsdir = '..';
61 our $new_package = 0;
62 our $ignoredirty = 0;
63 our $rmonerror = 1;
64 our @deliberatelies;
65 our %previously;
66 our $existing_package = 'dpkg';
67 our $cleanmode;
68 our $changes_since_version;
69 our $rmchanges;
70 our $overwrite_version; # undef: not specified; '': check changelog
71 our $quilt_mode;
72 our $quilt_modes_re = 'linear|smash|auto|nofix|nocheck|gbp|dpm|unapplied';
73 our $dodep14tag;
74 our $split_brain_save;
75 our $we_are_responder;
76 our $we_are_initiator;
77 our $initiator_tempdir;
78 our $patches_applied_dirtily = 00;
79 our $tagformat_want;
80 our $tagformat;
81 our $tagformatfn;
82 our $chase_dsc_distro=1;
83
84 our %forceopts = map { $_=>0 }
85     qw(unrepresentable unsupported-source-format
86        dsc-changes-mismatch changes-origs-exactly
87        import-gitapply-absurd
88        import-gitapply-no-absurd
89        import-dsc-with-dgit-field);
90
91 our %format_ok = map { $_=>1 } ("1.0","3.0 (native)","3.0 (quilt)");
92
93 our $suite_re = '[-+.0-9a-z]+';
94 our $cleanmode_re = 'dpkg-source(?:-d)?|git|git-ff|check|none';
95 our $orig_f_comp_re = 'orig(?:-[-0-9a-z]+)?';
96 our $orig_f_sig_re = '\\.(?:asc|gpg|pgp)';
97 our $orig_f_tail_re = "$orig_f_comp_re\\.tar(?:\\.\\w+)?(?:$orig_f_sig_re)?";
98
99 our $git_authline_re = '^([^<>]+) \<(\S+)\> (\d+ [-+]\d+)$';
100 our $splitbraincache = 'dgit-intern/quilt-cache';
101 our $rewritemap = 'dgit-rewrite/map';
102
103 our (@git) = qw(git);
104 our (@dget) = qw(dget);
105 our (@curl) = (qw(curl --proto-redir), '-all,http,https', qw(-L));
106 our (@dput) = qw(dput);
107 our (@debsign) = qw(debsign);
108 our (@gpg) = qw(gpg);
109 our (@sbuild) = qw(sbuild);
110 our (@ssh) = 'ssh';
111 our (@dgit) = qw(dgit);
112 our (@aptget) = qw(apt-get);
113 our (@aptcache) = qw(apt-cache);
114 our (@dpkgbuildpackage) = qw(dpkg-buildpackage -i\.git/ -I.git);
115 our (@dpkgsource) = qw(dpkg-source -i\.git/ -I.git);
116 our (@dpkggenchanges) = qw(dpkg-genchanges);
117 our (@mergechanges) = qw(mergechanges -f);
118 our (@gbp_build) = ('');
119 our (@gbp_pq) = ('gbp pq');
120 our (@changesopts) = ('');
121
122 our %opts_opt_map = ('dget' => \@dget, # accept for compatibility
123                      'curl' => \@curl,
124                      'dput' => \@dput,
125                      'debsign' => \@debsign,
126                      'gpg' => \@gpg,
127                      'sbuild' => \@sbuild,
128                      'ssh' => \@ssh,
129                      'dgit' => \@dgit,
130                      'git' => \@git,
131                      'apt-get' => \@aptget,
132                      'apt-cache' => \@aptcache,
133                      'dpkg-source' => \@dpkgsource,
134                      'dpkg-buildpackage' => \@dpkgbuildpackage,
135                      'dpkg-genchanges' => \@dpkggenchanges,
136                      'gbp-build' => \@gbp_build,
137                      'gbp-pq' => \@gbp_pq,
138                      'ch' => \@changesopts,
139                      'mergechanges' => \@mergechanges);
140
141 our %opts_opt_cmdonly = ('gpg' => 1, 'git' => 1);
142 our %opts_cfg_insertpos = map {
143     $_,
144     scalar @{ $opts_opt_map{$_} }
145 } keys %opts_opt_map;
146
147 sub parseopts_late_defaults();
148 sub setup_gitattrs(;$);
149 sub check_gitattrs($$);
150
151 our $keyid;
152
153 autoflush STDOUT 1;
154
155 our $supplementary_message = '';
156 our $need_split_build_invocation = 0;
157 our $split_brain = 0;
158
159 END {
160     local ($@, $?);
161     return unless forkcheck_mainprocess();
162     print STDERR "! $_\n" foreach $supplementary_message =~ m/^.+$/mg;
163 }
164
165 our $remotename = 'dgit';
166 our @ourdscfield = qw(Dgit Vcs-Dgit-Master);
167 our $csuite;
168 our $instead_distro;
169
170 if (!defined $absurdity) {
171     $absurdity = $0;
172     $absurdity =~ s{/[^/]+$}{/absurd} or die;
173 }
174
175 sub debiantag ($$) {
176     my ($v,$distro) = @_;
177     return $tagformatfn->($v, $distro);
178 }
179
180 sub debiantag_maintview ($$) { 
181     my ($v,$distro) = @_;
182     return "$distro/".dep14_version_mangle $v;
183 }
184
185 sub madformat ($) { $_[0] eq '3.0 (quilt)' }
186
187 sub lbranch () { return "$branchprefix/$csuite"; }
188 my $lbranch_re = '^refs/heads/'.$branchprefix.'/([^/.]+)$';
189 sub lref () { return "refs/heads/".lbranch(); }
190 sub lrref () { return "refs/remotes/$remotename/".server_branch($csuite); }
191 sub rrref () { return server_ref($csuite); }
192
193 sub stripepoch ($) {
194     my ($vsn) = @_;
195     $vsn =~ s/^\d+\://;
196     return $vsn;
197 }
198
199 sub srcfn ($$) {
200     my ($vsn,$sfx) = @_;
201     return "${package}_".(stripepoch $vsn).$sfx
202 }
203
204 sub dscfn ($) {
205     my ($vsn) = @_;
206     return srcfn($vsn,".dsc");
207 }
208
209 sub changespat ($;$) {
210     my ($vsn, $arch) = @_;
211     return "${package}_".(stripepoch $vsn)."_".($arch//'*').".changes";
212 }
213
214 sub upstreamversion ($) {
215     my ($vsn) = @_;
216     $vsn =~ s/-[^-]+$//;
217     return $vsn;
218 }
219
220 our $us = 'dgit';
221 initdebug('');
222
223 our @end;
224 END { 
225     local ($?);
226     return unless forkcheck_mainprocess();
227     foreach my $f (@end) {
228         eval { $f->(); };
229         print STDERR "$us: cleanup: $@" if length $@;
230     }
231 };
232
233 sub badcfg { print STDERR "$us: invalid configuration: @_\n"; exit 12; }
234
235 sub forceable_fail ($$) {
236     my ($forceoptsl, $msg) = @_;
237     fail $msg unless grep { $forceopts{$_} } @$forceoptsl;
238     print STDERR "warning: overriding problem due to --force:\n". $msg;
239 }
240
241 sub forceing ($) {
242     my ($forceoptsl) = @_;
243     my @got = grep { $forceopts{$_} } @$forceoptsl;
244     return 0 unless @got;
245     print STDERR
246  "warning: skipping checks or functionality due to --force-$got[0]\n";
247 }
248
249 sub no_such_package () {
250     print STDERR "$us: package $package does not exist in suite $isuite\n";
251     exit 4;
252 }
253
254 sub deliberately ($) {
255     my ($enquiry) = @_;
256     return !!grep { $_ eq "--deliberately-$enquiry" } @deliberatelies;
257 }
258
259 sub deliberately_not_fast_forward () {
260     foreach (qw(not-fast-forward fresh-repo)) {
261         return 1 if deliberately($_) || deliberately("TEST-dgit-only-$_");
262     }
263 }
264
265 sub quiltmode_splitbrain () {
266     $quilt_mode =~ m/gbp|dpm|unapplied/;
267 }
268
269 sub opts_opt_multi_cmd {
270     my @cmd;
271     push @cmd, split /\s+/, shift @_;
272     push @cmd, @_;
273     @cmd;
274 }
275
276 sub gbp_pq {
277     return opts_opt_multi_cmd @gbp_pq;
278 }
279
280 sub dgit_privdir () {
281     our $dgit_privdir_made //= ensure_a_playground 'dgit';
282 }
283
284 #---------- remote protocol support, common ----------
285
286 # remote push initiator/responder protocol:
287 #  $ dgit remote-push-build-host <n-rargs> <rargs>... <push-args>...
288 #  where <rargs> is <push-host-dir> <supported-proto-vsn>,... ...
289 #  < dgit-remote-push-ready <actual-proto-vsn>
290 #
291 # occasionally:
292 #
293 #  > progress NBYTES
294 #  [NBYTES message]
295 #
296 #  > supplementary-message NBYTES          # $protovsn >= 3
297 #  [NBYTES message]
298 #
299 # main sequence:
300 #
301 #  > file parsed-changelog
302 #  [indicates that output of dpkg-parsechangelog follows]
303 #  > data-block NBYTES
304 #  > [NBYTES bytes of data (no newline)]
305 #  [maybe some more blocks]
306 #  > data-end
307 #
308 #  > file dsc
309 #  [etc]
310 #
311 #  > file changes
312 #  [etc]
313 #
314 #  > param head DGIT-VIEW-HEAD
315 #  > param csuite SUITE
316 #  > param tagformat old|new
317 #  > param maint-view MAINT-VIEW-HEAD
318 #
319 #  > param buildinfo-filename P_V_X.buildinfo   # zero or more times
320 #  > file buildinfo                             # for buildinfos to sign
321 #
322 #  > previously REFNAME=OBJNAME       # if --deliberately-not-fast-forward
323 #                                     # goes into tag, for replay prevention
324 #
325 #  > want signed-tag
326 #  [indicates that signed tag is wanted]
327 #  < data-block NBYTES
328 #  < [NBYTES bytes of data (no newline)]
329 #  [maybe some more blocks]
330 #  < data-end
331 #  < files-end
332 #
333 #  > want signed-dsc-changes
334 #  < data-block NBYTES    [transfer of signed dsc]
335 #  [etc]
336 #  < data-block NBYTES    [transfer of signed changes]
337 #  [etc]
338 #  < data-block NBYTES    [transfer of each signed buildinfo
339 #  [etc]                   same number and order as "file buildinfo"]
340 #  ...
341 #  < files-end
342 #
343 #  > complete
344
345 our $i_child_pid;
346
347 sub i_child_report () {
348     # Sees if our child has died, and reap it if so.  Returns a string
349     # describing how it died if it failed, or undef otherwise.
350     return undef unless $i_child_pid;
351     my $got = waitpid $i_child_pid, WNOHANG;
352     return undef if $got <= 0;
353     die unless $got == $i_child_pid;
354     $i_child_pid = undef;
355     return undef unless $?;
356     return "build host child ".waitstatusmsg();
357 }
358
359 sub badproto ($$) {
360     my ($fh, $m) = @_;
361     fail "connection lost: $!" if $fh->error;
362     fail "protocol violation; $m not expected";
363 }
364
365 sub badproto_badread ($$) {
366     my ($fh, $wh) = @_;
367     fail "connection lost: $!" if $!;
368     my $report = i_child_report();
369     fail $report if defined $report;
370     badproto $fh, "eof (reading $wh)";
371 }
372
373 sub protocol_expect (&$) {
374     my ($match, $fh) = @_;
375     local $_;
376     $_ = <$fh>;
377     defined && chomp or badproto_badread $fh, "protocol message";
378     if (wantarray) {
379         my @r = &$match;
380         return @r if @r;
381     } else {
382         my $r = &$match;
383         return $r if $r;
384     }
385     badproto $fh, "\`$_'";
386 }
387
388 sub protocol_send_file ($$) {
389     my ($fh, $ourfn) = @_;
390     open PF, "<", $ourfn or die "$ourfn: $!";
391     for (;;) {
392         my $d;
393         my $got = read PF, $d, 65536;
394         die "$ourfn: $!" unless defined $got;
395         last if !$got;
396         print $fh "data-block ".length($d)."\n" or die $!;
397         print $fh $d or die $!;
398     }
399     PF->error and die "$ourfn $!";
400     print $fh "data-end\n" or die $!;
401     close PF;
402 }
403
404 sub protocol_read_bytes ($$) {
405     my ($fh, $nbytes) = @_;
406     $nbytes =~ m/^[1-9]\d{0,5}$|^0$/ or badproto \*RO, "bad byte count";
407     my $d;
408     my $got = read $fh, $d, $nbytes;
409     $got==$nbytes or badproto_badread $fh, "data block";
410     return $d;
411 }
412
413 sub protocol_receive_file ($$) {
414     my ($fh, $ourfn) = @_;
415     printdebug "() $ourfn\n";
416     open PF, ">", $ourfn or die "$ourfn: $!";
417     for (;;) {
418         my ($y,$l) = protocol_expect {
419             m/^data-block (.*)$/ ? (1,$1) :
420             m/^data-end$/ ? (0,) :
421             ();
422         } $fh;
423         last unless $y;
424         my $d = protocol_read_bytes $fh, $l;
425         print PF $d or die $!;
426     }
427     close PF or die $!;
428 }
429
430 #---------- remote protocol support, responder ----------
431
432 sub responder_send_command ($) {
433     my ($command) = @_;
434     return unless $we_are_responder;
435     # called even without $we_are_responder
436     printdebug ">> $command\n";
437     print PO $command, "\n" or die $!;
438 }    
439
440 sub responder_send_file ($$) {
441     my ($keyword, $ourfn) = @_;
442     return unless $we_are_responder;
443     printdebug "]] $keyword $ourfn\n";
444     responder_send_command "file $keyword";
445     protocol_send_file \*PO, $ourfn;
446 }
447
448 sub responder_receive_files ($@) {
449     my ($keyword, @ourfns) = @_;
450     die unless $we_are_responder;
451     printdebug "[[ $keyword @ourfns\n";
452     responder_send_command "want $keyword";
453     foreach my $fn (@ourfns) {
454         protocol_receive_file \*PI, $fn;
455     }
456     printdebug "[[\$\n";
457     protocol_expect { m/^files-end$/ } \*PI;
458 }
459
460 #---------- remote protocol support, initiator ----------
461
462 sub initiator_expect (&) {
463     my ($match) = @_;
464     protocol_expect { &$match } \*RO;
465 }
466
467 #---------- end remote code ----------
468
469 sub progress {
470     if ($we_are_responder) {
471         my $m = join '', @_;
472         responder_send_command "progress ".length($m) or die $!;
473         print PO $m or die $!;
474     } else {
475         print @_, "\n";
476     }
477 }
478
479 our $ua;
480
481 sub url_get {
482     if (!$ua) {
483         $ua = LWP::UserAgent->new();
484         $ua->env_proxy;
485     }
486     my $what = $_[$#_];
487     progress "downloading $what...";
488     my $r = $ua->get(@_) or die $!;
489     return undef if $r->code == 404;
490     $r->is_success or fail "failed to fetch $what: ".$r->status_line;
491     return $r->decoded_content(charset => 'none');
492 }
493
494 our ($dscdata,$dscurl,$dsc,$dsc_checked,$skew_warning_vsn);
495
496 sub act_local () { return $dryrun_level <= 1; }
497 sub act_scary () { return !$dryrun_level; }
498
499 sub printdone {
500     if (!$dryrun_level) {
501         progress "$us ok: @_";
502     } else {
503         progress "would be ok: @_ (but dry run only)";
504     }
505 }
506
507 sub dryrun_report {
508     printcmd(\*STDERR,$debugprefix."#",@_);
509 }
510
511 sub runcmd_ordryrun {
512     if (act_scary()) {
513         runcmd @_;
514     } else {
515         dryrun_report @_;
516     }
517 }
518
519 sub runcmd_ordryrun_local {
520     if (act_local()) {
521         runcmd @_;
522     } else {
523         dryrun_report @_;
524     }
525 }
526
527 sub shell_cmd {
528     my ($first_shell, @cmd) = @_;
529     return qw(sh -ec), $first_shell.'; exec "$@"', 'x', @cmd;
530 }
531
532 our $helpmsg = <<END;
533 main usages:
534   dgit [dgit-opts] clone [dgit-opts] package [suite] [./dir|/dir]
535   dgit [dgit-opts] fetch|pull [dgit-opts] [suite]
536   dgit [dgit-opts] build [dpkg-buildpackage-opts]
537   dgit [dgit-opts] sbuild [sbuild-opts]
538   dgit [dgit-opts] push [dgit-opts] [suite]
539   dgit [dgit-opts] rpush build-host:build-dir ...
540 important dgit options:
541   -k<keyid>           sign tag and package with <keyid> instead of default
542   --dry-run -n        do not change anything, but go through the motions
543   --damp-run -L       like --dry-run but make local changes, without signing
544   --new -N            allow introducing a new package
545   --debug -D          increase debug level
546   -c<name>=<value>    set git config option (used directly by dgit too)
547 END
548
549 our $later_warning_msg = <<END;
550 Perhaps the upload is stuck in incoming.  Using the version from git.
551 END
552
553 sub badusage {
554     print STDERR "$us: @_\n", $helpmsg or die $!;
555     exit 8;
556 }
557
558 sub nextarg {
559     @ARGV or badusage "too few arguments";
560     return scalar shift @ARGV;
561 }
562
563 sub pre_help () {
564     not_necessarily_a_tree();
565 }
566 sub cmd_help () {
567     print $helpmsg or die $!;
568     exit 0;
569 }
570
571 our $td = $ENV{DGIT_TEST_DUMMY_DIR} || "DGIT_TEST_DUMMY_DIR-unset";
572
573 our %defcfg = ('dgit.default.distro' => 'debian',
574                'dgit.default.default-suite' => 'unstable',
575                'dgit.default.old-dsc-distro' => 'debian',
576                'dgit-suite.*-security.distro' => 'debian-security',
577                'dgit.default.username' => '',
578                'dgit.default.archive-query-default-component' => 'main',
579                'dgit.default.ssh' => 'ssh',
580                'dgit.default.archive-query' => 'madison:',
581                'dgit.default.sshpsql-dbname' => 'service=projectb',
582                'dgit.default.aptget-components' => 'main',
583                'dgit.default.dgit-tag-format' => 'new,old,maint',
584                'dgit.dsc-url-proto-ok.http'    => 'true',
585                'dgit.dsc-url-proto-ok.https'   => 'true',
586                'dgit.dsc-url-proto-ok.git'     => 'true',
587                'dgit.default.dsc-url-proto-ok' => 'false',
588                # old means "repo server accepts pushes with old dgit tags"
589                # new means "repo server accepts pushes with new dgit tags"
590                # maint means "repo server accepts split brain pushes"
591                # hist means "repo server may have old pushes without new tag"
592                #   ("hist" is implied by "old")
593                'dgit-distro.debian.archive-query' => 'ftpmasterapi:',
594                'dgit-distro.debian.git-check' => 'url',
595                'dgit-distro.debian.git-check-suffix' => '/info/refs',
596                'dgit-distro.debian.new-private-pushers' => 't',
597                'dgit-distro.debian/push.git-url' => '',
598                'dgit-distro.debian/push.git-host' => 'push.dgit.debian.org',
599                'dgit-distro.debian/push.git-user-force' => 'dgit',
600                'dgit-distro.debian/push.git-proto' => 'git+ssh://',
601                'dgit-distro.debian/push.git-path' => '/dgit/debian/repos',
602                'dgit-distro.debian/push.git-create' => 'true',
603                'dgit-distro.debian/push.git-check' => 'ssh-cmd',
604  'dgit-distro.debian.archive-query-url', 'https://api.ftp-master.debian.org/',
605 # 'dgit-distro.debian.archive-query-tls-key',
606 #    '/etc/ssl/certs/%HOST%.pem:/etc/dgit/%HOST%.pem',
607 # ^ this does not work because curl is broken nowadays
608 # Fixing #790093 properly will involve providing providing the key
609 # in some pacagke and maybe updating these paths.
610 #
611 # 'dgit-distro.debian.archive-query-tls-curl-args',
612 #   '--ca-path=/etc/ssl/ca-debian',
613 # ^ this is a workaround but works (only) on DSA-administered machines
614                'dgit-distro.debian.git-url' => 'https://git.dgit.debian.org',
615                'dgit-distro.debian.git-url-suffix' => '',
616                'dgit-distro.debian.upload-host' => 'ftp-master', # for dput
617                'dgit-distro.debian.mirror' => 'http://ftp.debian.org/debian/',
618  'dgit-distro.debian-security.archive-query' => 'aptget:',
619  'dgit-distro.debian-security.mirror' => 'http://security.debian.org/debian-security/',
620  'dgit-distro.debian-security.aptget-suite-map' => 's#-security$#/updates#',
621  'dgit-distro.debian-security.aptget-suite-rmap' => 's#$#-security#',
622  'dgit-distro.debian-security.nominal-distro' => 'debian',
623  'dgit-distro.debian.backports-quirk' => '(squeeze)-backports*',
624  'dgit-distro.debian-backports.mirror' => 'http://backports.debian.org/debian-backports/',
625                'dgit-distro.ubuntu.git-check' => 'false',
626  'dgit-distro.ubuntu.mirror' => 'http://archive.ubuntu.com/ubuntu',
627                'dgit-distro.test-dummy.ssh' => "$td/ssh",
628                'dgit-distro.test-dummy.username' => "alice",
629                'dgit-distro.test-dummy.git-check' => "ssh-cmd",
630                'dgit-distro.test-dummy.git-create' => "ssh-cmd",
631                'dgit-distro.test-dummy.git-url' => "$td/git",
632                'dgit-distro.test-dummy.git-host' => "git",
633                'dgit-distro.test-dummy.git-path' => "$td/git",
634                'dgit-distro.test-dummy.archive-query' => "dummycatapi:",
635                'dgit-distro.test-dummy.archive-query-url' => "file://$td/aq/",
636                'dgit-distro.test-dummy.mirror' => "file://$td/mirror/",
637                'dgit-distro.test-dummy.upload-host' => 'test-dummy',
638                );
639
640 our %gitcfgs;
641 our @gitcfgsources = qw(cmdline local global system);
642 our $invoked_in_git_tree = 1;
643
644 sub git_slurp_config () {
645     # This algoritm is a bit subtle, but this is needed so that for
646     # options which we want to be single-valued, we allow the
647     # different config sources to override properly.  See #835858.
648     foreach my $src (@gitcfgsources) {
649         next if $src eq 'cmdline';
650         # we do this ourselves since git doesn't handle it
651
652         $gitcfgs{$src} = git_slurp_config_src $src;
653     }
654 }
655
656 sub git_get_config ($) {
657     my ($c) = @_;
658     foreach my $src (@gitcfgsources) {
659         my $l = $gitcfgs{$src}{$c};
660         confess "internal error ($l $c)" if $l && !ref $l;
661         printdebug"C $c ".(defined $l ?
662                            join " ", map { messagequote "'$_'" } @$l :
663                            "undef")."\n"
664             if $debuglevel >= 4;
665         $l or next;
666         @$l==1 or badcfg "multiple values for $c".
667             " (in $src git config)" if @$l > 1;
668         return $l->[0];
669     }
670     return undef;
671 }
672
673 sub cfg {
674     foreach my $c (@_) {
675         return undef if $c =~ /RETURN-UNDEF/;
676         printdebug "C? $c\n" if $debuglevel >= 5;
677         my $v = git_get_config($c);
678         return $v if defined $v;
679         my $dv = $defcfg{$c};
680         if (defined $dv) {
681             printdebug "CD $c $dv\n" if $debuglevel >= 4;
682             return $dv;
683         }
684     }
685     badcfg "need value for one of: @_\n".
686         "$us: distro or suite appears not to be (properly) supported";
687 }
688
689 sub not_necessarily_a_tree () {
690     # needs to be called from pre_*
691     @gitcfgsources = grep { $_ ne 'local' } @gitcfgsources;
692     $invoked_in_git_tree = 0;
693 }
694
695 sub access_basedistro__noalias () {
696     if (defined $idistro) {
697         return $idistro;
698     } else {    
699         my $def = cfg("dgit-suite.$isuite.distro", 'RETURN-UNDEF');
700         return $def if defined $def;
701         foreach my $src (@gitcfgsources, 'internal') {
702             my $kl = $src eq 'internal' ? \%defcfg : $gitcfgs{$src};
703             next unless $kl;
704             foreach my $k (keys %$kl) {
705                 next unless $k =~ m#^dgit-suite\.(.*)\.distro$#;
706                 my $dpat = $1;
707                 next unless match_glob $dpat, $isuite;
708                 return $kl->{$k};
709             }
710         }
711         return cfg("dgit.default.distro");
712     }
713 }
714
715 sub access_basedistro () {
716     my $noalias = access_basedistro__noalias();
717     my $canon = cfg("dgit-distro.$noalias.alias-canon",'RETURN-UNDEF');
718     return $canon // $noalias;
719 }
720
721 sub access_nomdistro () {
722     my $base = access_basedistro();
723     my $r = cfg("dgit-distro.$base.nominal-distro",'RETURN-UNDEF') // $base;
724     $r =~ m/^$distro_re$/ or badcfg
725  "bad syntax for (nominal) distro \`$r' (does not match /^$distro_re$/)";
726     return $r;
727 }
728
729 sub access_quirk () {
730     # returns (quirk name, distro to use instead or undef, quirk-specific info)
731     my $basedistro = access_basedistro();
732     my $backports_quirk = cfg("dgit-distro.$basedistro.backports-quirk",
733                               'RETURN-UNDEF');
734     if (defined $backports_quirk) {
735         my $re = $backports_quirk;
736         $re =~ s/[^-0-9a-z_\%*()]/\\$&/ig;
737         $re =~ s/\*/.*/g;
738         $re =~ s/\%/([-0-9a-z_]+)/
739             or $re =~ m/[()]/ or badcfg "backports-quirk needs \% or ( )";
740         if ($isuite =~ m/^$re$/) {
741             return ('backports',"$basedistro-backports",$1);
742         }
743     }
744     return ('none',undef);
745 }
746
747 our $access_forpush;
748
749 sub parse_cfg_bool ($$$) {
750     my ($what,$def,$v) = @_;
751     $v //= $def;
752     return
753         $v =~ m/^[ty1]/ ? 1 :
754         $v =~ m/^[fn0]/ ? 0 :
755         badcfg "$what needs t (true, y, 1) or f (false, n, 0) not \`$v'";
756 }       
757
758 sub access_forpush_config () {
759     my $d = access_basedistro();
760
761     return 1 if
762         $new_package &&
763         parse_cfg_bool('new-private-pushers', 0,
764                        cfg("dgit-distro.$d.new-private-pushers",
765                            'RETURN-UNDEF'));
766
767     my $v = cfg("dgit-distro.$d.readonly", 'RETURN-UNDEF');
768     $v //= 'a';
769     return
770         $v =~ m/^[ty1]/ ? 0 : # force readonly,    forpush = 0
771         $v =~ m/^[fn0]/ ? 1 : # force nonreadonly, forpush = 1
772         $v =~ m/^[a]/  ? '' : # auto,              forpush = ''
773         badcfg "readonly needs t (true, y, 1) or f (false, n, 0) or a (auto)";
774 }
775
776 sub access_forpush () {
777     $access_forpush //= access_forpush_config();
778     return $access_forpush;
779 }
780
781 sub pushing () {
782     die "$access_forpush ?" if ($access_forpush // 1) ne 1;
783     badcfg "pushing but distro is configured readonly"
784         if access_forpush_config() eq '0';
785     $access_forpush = 1;
786     $supplementary_message = <<'END' unless $we_are_responder;
787 Push failed, before we got started.
788 You can retry the push, after fixing the problem, if you like.
789 END
790     parseopts_late_defaults();
791 }
792
793 sub notpushing () {
794     parseopts_late_defaults();
795 }
796
797 sub supplementary_message ($) {
798     my ($msg) = @_;
799     if (!$we_are_responder) {
800         $supplementary_message = $msg;
801         return;
802     } elsif ($protovsn >= 3) {
803         responder_send_command "supplementary-message ".length($msg)
804             or die $!;
805         print PO $msg or die $!;
806     }
807 }
808
809 sub access_distros () {
810     # Returns list of distros to try, in order
811     #
812     # We want to try:
813     #    0. `instead of' distro name(s) we have been pointed to
814     #    1. the access_quirk distro, if any
815     #    2a. the user's specified distro, or failing that  } basedistro
816     #    2b. the distro calculated from the suite          }
817     my @l = access_basedistro();
818
819     my (undef,$quirkdistro) = access_quirk();
820     unshift @l, $quirkdistro;
821     unshift @l, $instead_distro;
822     @l = grep { defined } @l;
823
824     push @l, access_nomdistro();
825
826     if (access_forpush()) {
827         @l = map { ("$_/push", $_) } @l;
828     }
829     @l;
830 }
831
832 sub access_cfg_cfgs (@) {
833     my (@keys) = @_;
834     my @cfgs;
835     # The nesting of these loops determines the search order.  We put
836     # the key loop on the outside so that we search all the distros
837     # for each key, before going on to the next key.  That means that
838     # if access_cfg is called with a more specific, and then a less
839     # specific, key, an earlier distro can override the less specific
840     # without necessarily overriding any more specific keys.  (If the
841     # distro wants to override the more specific keys it can simply do
842     # so; whereas if we did the loop the other way around, it would be
843     # impossible to for an earlier distro to override a less specific
844     # key but not the more specific ones without restating the unknown
845     # values of the more specific keys.
846     my @realkeys;
847     my @rundef;
848     # We have to deal with RETURN-UNDEF specially, so that we don't
849     # terminate the search prematurely.
850     foreach (@keys) {
851         if (m/RETURN-UNDEF/) { push @rundef, $_; last; }
852         push @realkeys, $_
853     }
854     foreach my $d (access_distros()) {
855         push @cfgs, map { "dgit-distro.$d.$_" } @realkeys;
856     }
857     push @cfgs, map { "dgit.default.$_" } @realkeys;
858     push @cfgs, @rundef;
859     return @cfgs;
860 }
861
862 sub access_cfg (@) {
863     my (@keys) = @_;
864     my (@cfgs) = access_cfg_cfgs(@keys);
865     my $value = cfg(@cfgs);
866     return $value;
867 }
868
869 sub access_cfg_bool ($$) {
870     my ($def, @keys) = @_;
871     parse_cfg_bool($keys[0], $def, access_cfg(@keys, 'RETURN-UNDEF'));
872 }
873
874 sub string_to_ssh ($) {
875     my ($spec) = @_;
876     if ($spec =~ m/\s/) {
877         return qw(sh -ec), 'exec '.$spec.' "$@"', 'x';
878     } else {
879         return ($spec);
880     }
881 }
882
883 sub access_cfg_ssh () {
884     my $gitssh = access_cfg('ssh', 'RETURN-UNDEF');
885     if (!defined $gitssh) {
886         return @ssh;
887     } else {
888         return string_to_ssh $gitssh;
889     }
890 }
891
892 sub access_runeinfo ($) {
893     my ($info) = @_;
894     return ": dgit ".access_basedistro()." $info ;";
895 }
896
897 sub access_someuserhost ($) {
898     my ($some) = @_;
899     my $user = access_cfg("$some-user-force", 'RETURN-UNDEF');
900     defined($user) && length($user) or
901         $user = access_cfg("$some-user",'username');
902     my $host = access_cfg("$some-host");
903     return length($user) ? "$user\@$host" : $host;
904 }
905
906 sub access_gituserhost () {
907     return access_someuserhost('git');
908 }
909
910 sub access_giturl (;$) {
911     my ($optional) = @_;
912     my $url = access_cfg('git-url','RETURN-UNDEF');
913     my $suffix;
914     if (!length $url) {
915         my $proto = access_cfg('git-proto', 'RETURN-UNDEF');
916         return undef unless defined $proto;
917         $url =
918             $proto.
919             access_gituserhost().
920             access_cfg('git-path');
921     } else {
922         $suffix = access_cfg('git-url-suffix','RETURN-UNDEF');
923     }
924     $suffix //= '.git';
925     return "$url/$package$suffix";
926 }              
927
928 sub parsecontrolfh ($$;$) {
929     my ($fh, $desc, $allowsigned) = @_;
930     our $dpkgcontrolhash_noissigned;
931     my $c;
932     for (;;) {
933         my %opts = ('name' => $desc);
934         $opts{allow_pgp}= $allowsigned || !$dpkgcontrolhash_noissigned;
935         $c = Dpkg::Control::Hash->new(%opts);
936         $c->parse($fh,$desc) or die "parsing of $desc failed";
937         last if $allowsigned;
938         last if $dpkgcontrolhash_noissigned;
939         my $issigned= $c->get_option('is_pgp_signed');
940         if (!defined $issigned) {
941             $dpkgcontrolhash_noissigned= 1;
942             seek $fh, 0,0 or die "seek $desc: $!";
943         } elsif ($issigned) {
944             fail "control file $desc is (already) PGP-signed. ".
945                 " Note that dgit push needs to modify the .dsc and then".
946                 " do the signature itself";
947         } else {
948             last;
949         }
950     }
951     return $c;
952 }
953
954 sub parsecontrol {
955     my ($file, $desc, $allowsigned) = @_;
956     my $fh = new IO::Handle;
957     open $fh, '<', $file or die "$file: $!";
958     my $c = parsecontrolfh($fh,$desc,$allowsigned);
959     $fh->error and die $!;
960     close $fh;
961     return $c;
962 }
963
964 sub getfield ($$) {
965     my ($dctrl,$field) = @_;
966     my $v = $dctrl->{$field};
967     return $v if defined $v;
968     fail "missing field $field in ".$dctrl->get_option('name');
969 }
970
971 sub parsechangelog {
972     my $c = Dpkg::Control::Hash->new(name => 'parsed changelog');
973     my $p = new IO::Handle;
974     my @cmd = (qw(dpkg-parsechangelog), @_);
975     open $p, '-|', @cmd or die $!;
976     $c->parse($p);
977     $?=0; $!=0; close $p or failedcmd @cmd;
978     return $c;
979 }
980
981 sub commit_getclogp ($) {
982     # Returns the parsed changelog hashref for a particular commit
983     my ($objid) = @_;
984     our %commit_getclogp_memo;
985     my $memo = $commit_getclogp_memo{$objid};
986     return $memo if $memo;
987     
988     my $mclog = dgit_privdir()."clog-$objid";
989     runcmd shell_cmd "exec >$mclog", @git, qw(cat-file blob),
990         "$objid:debian/changelog";
991     $commit_getclogp_memo{$objid} = parsechangelog("-l$mclog");
992 }
993
994 sub parse_dscdata () {
995     my $dscfh = new IO::File \$dscdata, '<' or die $!;
996     printdebug Dumper($dscdata) if $debuglevel>1;
997     $dsc = parsecontrolfh($dscfh,$dscurl,1);
998     printdebug Dumper($dsc) if $debuglevel>1;
999 }
1000
1001 our %rmad;
1002
1003 sub archive_query ($;@) {
1004     my ($method) = shift @_;
1005     fail "this operation does not support multiple comma-separated suites"
1006         if $isuite =~ m/,/;
1007     my $query = access_cfg('archive-query','RETURN-UNDEF');
1008     $query =~ s/^(\w+):// or badcfg "invalid archive-query method \`$query'";
1009     my $proto = $1;
1010     my $data = $'; #';
1011     { no strict qw(refs); &{"${method}_${proto}"}($proto,$data,@_); }
1012 }
1013
1014 sub archive_query_prepend_mirror {
1015     my $m = access_cfg('mirror');
1016     return map { [ $_->[0], $m.$_->[1], @$_[2..$#$_] ] } @_;
1017 }
1018
1019 sub pool_dsc_subpath ($$) {
1020     my ($vsn,$component) = @_; # $package is implict arg
1021     my $prefix = substr($package, 0, $package =~ m/^l/ ? 4 : 1);
1022     return "/pool/$component/$prefix/$package/".dscfn($vsn);
1023 }
1024
1025 sub cfg_apply_map ($$$) {
1026     my ($varref, $what, $mapspec) = @_;
1027     return unless $mapspec;
1028
1029     printdebug "config $what EVAL{ $mapspec; }\n";
1030     $_ = $$varref;
1031     eval "package Dgit::Config; $mapspec;";
1032     die $@ if $@;
1033     $$varref = $_;
1034 }
1035
1036 #---------- `ftpmasterapi' archive query method (nascent) ----------
1037
1038 sub archive_api_query_cmd ($) {
1039     my ($subpath) = @_;
1040     my @cmd = (@curl, qw(-sS));
1041     my $url = access_cfg('archive-query-url');
1042     if ($url =~ m#^https://([-.0-9a-z]+)/#) {
1043         my $host = $1;
1044         my $keys = access_cfg('archive-query-tls-key','RETURN-UNDEF') //'';
1045         foreach my $key (split /\:/, $keys) {
1046             $key =~ s/\%HOST\%/$host/g;
1047             if (!stat $key) {
1048                 fail "for $url: stat $key: $!" unless $!==ENOENT;
1049                 next;
1050             }
1051             fail "config requested specific TLS key but do not know".
1052                 " how to get curl to use exactly that EE key ($key)";
1053 #           push @cmd, "--cacert", $key, "--capath", "/dev/enoent";
1054 #           # Sadly the above line does not work because of changes
1055 #           # to gnutls.   The real fix for #790093 may involve
1056 #           # new curl options.
1057             last;
1058         }
1059         # Fixing #790093 properly will involve providing a value
1060         # for this on clients.
1061         my $kargs = access_cfg('archive-query-tls-curl-ca-args','RETURN-UNDEF');
1062         push @cmd, split / /, $kargs if defined $kargs;
1063     }
1064     push @cmd, $url.$subpath;
1065     return @cmd;
1066 }
1067
1068 sub api_query ($$;$) {
1069     use JSON;
1070     my ($data, $subpath, $ok404) = @_;
1071     badcfg "ftpmasterapi archive query method takes no data part"
1072         if length $data;
1073     my @cmd = archive_api_query_cmd($subpath);
1074     my $url = $cmd[$#cmd];
1075     push @cmd, qw(-w %{http_code});
1076     my $json = cmdoutput @cmd;
1077     unless ($json =~ s/\d+\d+\d$//) {
1078         failedcmd_report_cmd undef, @cmd;
1079         fail "curl failed to print 3-digit HTTP code";
1080     }
1081     my $code = $&;
1082     return undef if $code eq '404' && $ok404;
1083     fail "fetch of $url gave HTTP code $code"
1084         unless $url =~ m#^file://# or $code =~ m/^2/;
1085     return decode_json($json);
1086 }
1087
1088 sub canonicalise_suite_ftpmasterapi {
1089     my ($proto,$data) = @_;
1090     my $suites = api_query($data, 'suites');
1091     my @matched;
1092     foreach my $entry (@$suites) {
1093         next unless grep { 
1094             my $v = $entry->{$_};
1095             defined $v && $v eq $isuite;
1096         } qw(codename name);
1097         push @matched, $entry;
1098     }
1099     fail "unknown suite $isuite" unless @matched;
1100     my $cn;
1101     eval {
1102         @matched==1 or die "multiple matches for suite $isuite\n";
1103         $cn = "$matched[0]{codename}";
1104         defined $cn or die "suite $isuite info has no codename\n";
1105         $cn =~ m/^$suite_re$/ or die "suite $isuite maps to bad codename\n";
1106     };
1107     die "bad ftpmaster api response: $@\n".Dumper(\@matched)
1108         if length $@;
1109     return $cn;
1110 }
1111
1112 sub archive_query_ftpmasterapi {
1113     my ($proto,$data) = @_;
1114     my $info = api_query($data, "dsc_in_suite/$isuite/$package");
1115     my @rows;
1116     my $digester = Digest::SHA->new(256);
1117     foreach my $entry (@$info) {
1118         eval {
1119             my $vsn = "$entry->{version}";
1120             my ($ok,$msg) = version_check $vsn;
1121             die "bad version: $msg\n" unless $ok;
1122             my $component = "$entry->{component}";
1123             $component =~ m/^$component_re$/ or die "bad component";
1124             my $filename = "$entry->{filename}";
1125             $filename && $filename !~ m#[^-+:._~0-9a-zA-Z/]|^[/.]|/[/.]#
1126                 or die "bad filename";
1127             my $sha256sum = "$entry->{sha256sum}";
1128             $sha256sum =~ m/^[0-9a-f]+$/ or die "bad sha256sum";
1129             push @rows, [ $vsn, "/pool/$component/$filename",
1130                           $digester, $sha256sum ];
1131         };
1132         die "bad ftpmaster api response: $@\n".Dumper($entry)
1133             if length $@;
1134     }
1135     @rows = sort { -version_compare($a->[0],$b->[0]) } @rows;
1136     return archive_query_prepend_mirror @rows;
1137 }
1138
1139 sub file_in_archive_ftpmasterapi {
1140     my ($proto,$data,$filename) = @_;
1141     my $pat = $filename;
1142     $pat =~ s/_/\\_/g;
1143     $pat = "%/$pat";
1144     $pat =~ s#[^-+_.0-9a-z/]# sprintf '%%%02x', ord $& #ge;
1145     my $info = api_query($data, "file_in_archive/$pat", 1);
1146 }
1147
1148 #---------- `aptget' archive query method ----------
1149
1150 our $aptget_base;
1151 our $aptget_releasefile;
1152 our $aptget_configpath;
1153
1154 sub aptget_aptget   () { return @aptget,   qw(-c), $aptget_configpath; }
1155 sub aptget_aptcache () { return @aptcache, qw(-c), $aptget_configpath; }
1156
1157 sub aptget_cache_clean {
1158     runcmd_ordryrun_local qw(sh -ec),
1159         'cd "$1"; find -atime +30 -type f -print0 | xargs -0r rm --',
1160         'x', $aptget_base;
1161 }
1162
1163 sub aptget_lock_acquire () {
1164     my $lockfile = "$aptget_base/lock";
1165     open APTGET_LOCK, '>', $lockfile or die "open $lockfile: $!";
1166     flock APTGET_LOCK, LOCK_EX or die "lock $lockfile: $!";
1167 }
1168
1169 sub aptget_prep ($) {
1170     my ($data) = @_;
1171     return if defined $aptget_base;
1172
1173     badcfg "aptget archive query method takes no data part"
1174         if length $data;
1175
1176     my $cache = $ENV{XDG_CACHE_DIR} // "$ENV{HOME}/.cache";
1177
1178     ensuredir $cache;
1179     ensuredir "$cache/dgit";
1180     my $cachekey =
1181         access_cfg('aptget-cachekey','RETURN-UNDEF')
1182         // access_nomdistro();
1183
1184     $aptget_base = "$cache/dgit/aptget";
1185     ensuredir $aptget_base;
1186
1187     my $quoted_base = $aptget_base;
1188     die "$quoted_base contains bad chars, cannot continue"
1189         if $quoted_base =~ m/["\\]/; # apt.conf(5) says no escaping :-/
1190
1191     ensuredir $aptget_base;
1192
1193     aptget_lock_acquire();
1194
1195     aptget_cache_clean();
1196
1197     $aptget_configpath = "$aptget_base/apt.conf#$cachekey";
1198     my $sourceslist = "source.list#$cachekey";
1199
1200     my $aptsuites = $isuite;
1201     cfg_apply_map(\$aptsuites, 'suite map',
1202                   access_cfg('aptget-suite-map', 'RETURN-UNDEF'));
1203
1204     open SRCS, ">", "$aptget_base/$sourceslist" or die $!;
1205     printf SRCS "deb-src %s %s %s\n",
1206         access_cfg('mirror'),
1207         $aptsuites,
1208         access_cfg('aptget-components')
1209         or die $!;
1210
1211     ensuredir "$aptget_base/cache";
1212     ensuredir "$aptget_base/lists";
1213
1214     open CONF, ">", $aptget_configpath or die $!;
1215     print CONF <<END;
1216 Debug::NoLocking "true";
1217 APT::Get::List-Cleanup "false";
1218 #clear APT::Update::Post-Invoke-Success;
1219 Dir::Etc::SourceList "$quoted_base/$sourceslist";
1220 Dir::State::Lists "$quoted_base/lists";
1221 Dir::Etc::preferences "$quoted_base/preferences";
1222 Dir::Cache::srcpkgcache "$quoted_base/cache/srcs#$cachekey";
1223 Dir::Cache::pkgcache "$quoted_base/cache/pkgs#$cachekey";
1224 END
1225
1226     foreach my $key (qw(
1227                         Dir::Cache
1228                         Dir::State
1229                         Dir::Cache::Archives
1230                         Dir::Etc::SourceParts
1231                         Dir::Etc::preferencesparts
1232                       )) {
1233         ensuredir "$aptget_base/$key";
1234         print CONF "$key \"$quoted_base/$key\";\n" or die $!;
1235     };
1236
1237     my $oldatime = (time // die $!) - 1;
1238     foreach my $oldlist (<$aptget_base/lists/*Release>) {
1239         next unless stat_exists $oldlist;
1240         my ($mtime) = (stat _)[9];
1241         utime $oldatime, $mtime, $oldlist or die "$oldlist $!";
1242     }
1243
1244     runcmd_ordryrun_local aptget_aptget(), qw(update);
1245
1246     my @releasefiles;
1247     foreach my $oldlist (<$aptget_base/lists/*Release>) {
1248         next unless stat_exists $oldlist;
1249         my ($atime) = (stat _)[8];
1250         next if $atime == $oldatime;
1251         push @releasefiles, $oldlist;
1252     }
1253     my @inreleasefiles = grep { m#/InRelease$# } @releasefiles;
1254     @releasefiles = @inreleasefiles if @inreleasefiles;
1255     die "apt updated wrong number of Release files (@releasefiles), erk"
1256         unless @releasefiles == 1;
1257
1258     ($aptget_releasefile) = @releasefiles;
1259 }
1260
1261 sub canonicalise_suite_aptget {
1262     my ($proto,$data) = @_;
1263     aptget_prep($data);
1264
1265     my $release = parsecontrol $aptget_releasefile, "Release file", 1;
1266
1267     foreach my $name (qw(Codename Suite)) {
1268         my $val = $release->{$name};
1269         if (defined $val) {
1270             printdebug "release file $name: $val\n";
1271             $val =~ m/^$suite_re$/o or fail
1272  "Release file ($aptget_releasefile) specifies intolerable $name";
1273             cfg_apply_map(\$val, 'suite rmap',
1274                           access_cfg('aptget-suite-rmap', 'RETURN-UNDEF'));
1275             return $val
1276         }
1277     }
1278     return $isuite;
1279 }
1280
1281 sub archive_query_aptget {
1282     my ($proto,$data) = @_;
1283     aptget_prep($data);
1284
1285     ensuredir "$aptget_base/source";
1286     foreach my $old (<$aptget_base/source/*.dsc>) {
1287         unlink $old or die "$old: $!";
1288     }
1289
1290     my $showsrc = cmdoutput aptget_aptcache(), qw(showsrc), $package;
1291     return () unless $showsrc =~ m/^package:\s*\Q$package\E\s*$/mi;
1292     # avoids apt-get source failing with ambiguous error code
1293
1294     runcmd_ordryrun_local
1295         shell_cmd 'cd "$1"/source; shift', $aptget_base,
1296         aptget_aptget(), qw(--download-only --only-source source), $package;
1297
1298     my @dscs = <$aptget_base/source/*.dsc>;
1299     fail "apt-get source did not produce a .dsc" unless @dscs;
1300     fail "apt-get source produced several .dscs (@dscs)" unless @dscs==1;
1301
1302     my $pre_dsc = parsecontrol $dscs[0], $dscs[0], 1;
1303
1304     use URI::Escape;
1305     my $uri = "file://". uri_escape $dscs[0];
1306     $uri =~ s{\%2f}{/}gi;
1307     return [ (getfield $pre_dsc, 'Version'), $uri ];
1308 }
1309
1310 sub file_in_archive_aptget () { return undef; }
1311
1312 #---------- `dummyapicat' archive query method ----------
1313
1314 sub archive_query_dummycatapi { archive_query_ftpmasterapi @_; }
1315 sub canonicalise_suite_dummycatapi { canonicalise_suite_ftpmasterapi @_; }
1316
1317 sub file_in_archive_dummycatapi ($$$) {
1318     my ($proto,$data,$filename) = @_;
1319     my $mirror = access_cfg('mirror');
1320     $mirror =~ s#^file://#/# or die "$mirror ?";
1321     my @out;
1322     my @cmd = (qw(sh -ec), '
1323             cd "$1"
1324             find -name "$2" -print0 |
1325             xargs -0r sha256sum
1326         ', qw(x), $mirror, $filename);
1327     debugcmd "-|", @cmd;
1328     open FIA, "-|", @cmd or die $!;
1329     while (<FIA>) {
1330         chomp or die;
1331         printdebug "| $_\n";
1332         m/^(\w+)  (\S+)$/ or die "$_ ?";
1333         push @out, { sha256sum => $1, filename => $2 };
1334     }
1335     close FIA or die failedcmd @cmd;
1336     return \@out;
1337 }
1338
1339 #---------- `madison' archive query method ----------
1340
1341 sub archive_query_madison {
1342     return archive_query_prepend_mirror
1343         map { [ @$_[0..1] ] } madison_get_parse(@_);
1344 }
1345
1346 sub madison_get_parse {
1347     my ($proto,$data) = @_;
1348     die unless $proto eq 'madison';
1349     if (!length $data) {
1350         $data= access_cfg('madison-distro','RETURN-UNDEF');
1351         $data //= access_basedistro();
1352     }
1353     $rmad{$proto,$data,$package} ||= cmdoutput
1354         qw(rmadison -asource),"-s$isuite","-u$data",$package;
1355     my $rmad = $rmad{$proto,$data,$package};
1356
1357     my @out;
1358     foreach my $l (split /\n/, $rmad) {
1359         $l =~ m{^ \s*( [^ \t|]+ )\s* \|
1360                   \s*( [^ \t|]+ )\s* \|
1361                   \s*( [^ \t|/]+ )(?:/([^ \t|/]+))? \s* \|
1362                   \s*( [^ \t|]+ )\s* }x or die "$rmad ?";
1363         $1 eq $package or die "$rmad $package ?";
1364         my $vsn = $2;
1365         my $newsuite = $3;
1366         my $component;
1367         if (defined $4) {
1368             $component = $4;
1369         } else {
1370             $component = access_cfg('archive-query-default-component');
1371         }
1372         $5 eq 'source' or die "$rmad ?";
1373         push @out, [$vsn,pool_dsc_subpath($vsn,$component),$newsuite];
1374     }
1375     return sort { -version_compare($a->[0],$b->[0]); } @out;
1376 }
1377
1378 sub canonicalise_suite_madison {
1379     # madison canonicalises for us
1380     my @r = madison_get_parse(@_);
1381     @r or fail
1382         "unable to canonicalise suite using package $package".
1383         " which does not appear to exist in suite $isuite;".
1384         " --existing-package may help";
1385     return $r[0][2];
1386 }
1387
1388 sub file_in_archive_madison { return undef; }
1389
1390 #---------- `sshpsql' archive query method ----------
1391
1392 sub sshpsql ($$$) {
1393     my ($data,$runeinfo,$sql) = @_;
1394     if (!length $data) {
1395         $data= access_someuserhost('sshpsql').':'.
1396             access_cfg('sshpsql-dbname');
1397     }
1398     $data =~ m/:/ or badcfg "invalid sshpsql method string \`$data'";
1399     my ($userhost,$dbname) = ($`,$'); #';
1400     my @rows;
1401     my @cmd = (access_cfg_ssh, $userhost,
1402                access_runeinfo("ssh-psql $runeinfo").
1403                " export LC_MESSAGES=C; export LC_CTYPE=C;".
1404                " ".shellquote qw(psql -A), $dbname, qw(-c), $sql);
1405     debugcmd "|",@cmd;
1406     open P, "-|", @cmd or die $!;
1407     while (<P>) {
1408         chomp or die;
1409         printdebug(">|$_|\n");
1410         push @rows, $_;
1411     }
1412     $!=0; $?=0; close P or failedcmd @cmd;
1413     @rows or die;
1414     my $nrows = pop @rows;
1415     $nrows =~ s/^\((\d+) rows?\)$/$1/ or die "$nrows ?";
1416     @rows == $nrows+1 or die "$nrows ".(scalar @rows)." ?";
1417     @rows = map { [ split /\|/, $_ ] } @rows;
1418     my $ncols = scalar @{ shift @rows };
1419     die if grep { scalar @$_ != $ncols } @rows;
1420     return @rows;
1421 }
1422
1423 sub sql_injection_check {
1424     foreach (@_) { die "$_ $& ?" if m{[^-+=:_.,/0-9a-zA-Z]}; }
1425 }
1426
1427 sub archive_query_sshpsql ($$) {
1428     my ($proto,$data) = @_;
1429     sql_injection_check $isuite, $package;
1430     my @rows = sshpsql($data, "archive-query $isuite $package", <<END);
1431         SELECT source.version, component.name, files.filename, files.sha256sum
1432           FROM source
1433           JOIN src_associations ON source.id = src_associations.source
1434           JOIN suite ON suite.id = src_associations.suite
1435           JOIN dsc_files ON dsc_files.source = source.id
1436           JOIN files_archive_map ON files_archive_map.file_id = dsc_files.file
1437           JOIN component ON component.id = files_archive_map.component_id
1438           JOIN files ON files.id = dsc_files.file
1439          WHERE ( suite.suite_name='$isuite' OR suite.codename='$isuite' )
1440            AND source.source='$package'
1441            AND files.filename LIKE '%.dsc';
1442 END
1443     @rows = sort { -version_compare($a->[0],$b->[0]) } @rows;
1444     my $digester = Digest::SHA->new(256);
1445     @rows = map {
1446         my ($vsn,$component,$filename,$sha256sum) = @$_;
1447         [ $vsn, "/pool/$component/$filename",$digester,$sha256sum ];
1448     } @rows;
1449     return archive_query_prepend_mirror @rows;
1450 }
1451
1452 sub canonicalise_suite_sshpsql ($$) {
1453     my ($proto,$data) = @_;
1454     sql_injection_check $isuite;
1455     my @rows = sshpsql($data, "canonicalise-suite $isuite", <<END);
1456         SELECT suite.codename
1457           FROM suite where suite_name='$isuite' or codename='$isuite';
1458 END
1459     @rows = map { $_->[0] } @rows;
1460     fail "unknown suite $isuite" unless @rows;
1461     die "ambiguous $isuite: @rows ?" if @rows>1;
1462     return $rows[0];
1463 }
1464
1465 sub file_in_archive_sshpsql ($$$) { return undef; }
1466
1467 #---------- `dummycat' archive query method ----------
1468
1469 sub canonicalise_suite_dummycat ($$) {
1470     my ($proto,$data) = @_;
1471     my $dpath = "$data/suite.$isuite";
1472     if (!open C, "<", $dpath) {
1473         $!==ENOENT or die "$dpath: $!";
1474         printdebug "dummycat canonicalise_suite $isuite $dpath ENOENT\n";
1475         return $isuite;
1476     }
1477     $!=0; $_ = <C>;
1478     chomp or die "$dpath: $!";
1479     close C;
1480     printdebug "dummycat canonicalise_suite $isuite $dpath = $_\n";
1481     return $_;
1482 }
1483
1484 sub archive_query_dummycat ($$) {
1485     my ($proto,$data) = @_;
1486     canonicalise_suite();
1487     my $dpath = "$data/package.$csuite.$package";
1488     if (!open C, "<", $dpath) {
1489         $!==ENOENT or die "$dpath: $!";
1490         printdebug "dummycat query $csuite $package $dpath ENOENT\n";
1491         return ();
1492     }
1493     my @rows;
1494     while (<C>) {
1495         next if m/^\#/;
1496         next unless m/\S/;
1497         die unless chomp;
1498         printdebug "dummycat query $csuite $package $dpath | $_\n";
1499         my @row = split /\s+/, $_;
1500         @row==2 or die "$dpath: $_ ?";
1501         push @rows, \@row;
1502     }
1503     C->error and die "$dpath: $!";
1504     close C;
1505     return archive_query_prepend_mirror
1506         sort { -version_compare($a->[0],$b->[0]); } @rows;
1507 }
1508
1509 sub file_in_archive_dummycat () { return undef; }
1510
1511 #---------- tag format handling ----------
1512
1513 sub access_cfg_tagformats () {
1514     split /\,/, access_cfg('dgit-tag-format');
1515 }
1516
1517 sub access_cfg_tagformats_can_splitbrain () {
1518     my %y = map { $_ => 1 } access_cfg_tagformats;
1519     foreach my $needtf (qw(new maint)) {
1520         next if $y{$needtf};
1521         return 0;
1522     }
1523     return 1;
1524 }
1525
1526 sub need_tagformat ($$) {
1527     my ($fmt, $why) = @_;
1528     fail "need to use tag format $fmt ($why) but also need".
1529         " to use tag format $tagformat_want->[0] ($tagformat_want->[1])".
1530         " - no way to proceed"
1531         if $tagformat_want && $tagformat_want->[0] ne $fmt;
1532     $tagformat_want = [$fmt, $why, $tagformat_want->[2] // 0];
1533 }
1534
1535 sub select_tagformat () {
1536     # sets $tagformatfn
1537     return if $tagformatfn && !$tagformat_want;
1538     die 'bug' if $tagformatfn && $tagformat_want;
1539     # ... $tagformat_want assigned after previous select_tagformat
1540
1541     my (@supported) = grep { $_ =~ m/^(?:old|new)$/ } access_cfg_tagformats();
1542     printdebug "select_tagformat supported @supported\n";
1543
1544     $tagformat_want //= [ $supported[0], "distro access configuration", 0 ];
1545     printdebug "select_tagformat specified @$tagformat_want\n";
1546
1547     my ($fmt,$why,$override) = @$tagformat_want;
1548
1549     fail "target distro supports tag formats @supported".
1550         " but have to use $fmt ($why)"
1551         unless $override
1552             or grep { $_ eq $fmt } @supported;
1553
1554     $tagformat_want = undef;
1555     $tagformat = $fmt;
1556     $tagformatfn = ${*::}{"debiantag_$fmt"};
1557
1558     fail "trying to use unknown tag format \`$fmt' ($why) !"
1559         unless $tagformatfn;
1560 }
1561
1562 #---------- archive query entrypoints and rest of program ----------
1563
1564 sub canonicalise_suite () {
1565     return if defined $csuite;
1566     fail "cannot operate on $isuite suite" if $isuite eq 'UNRELEASED';
1567     $csuite = archive_query('canonicalise_suite');
1568     if ($isuite ne $csuite) {
1569         progress "canonical suite name for $isuite is $csuite";
1570     } else {
1571         progress "canonical suite name is $csuite";
1572     }
1573 }
1574
1575 sub get_archive_dsc () {
1576     canonicalise_suite();
1577     my @vsns = archive_query('archive_query');
1578     foreach my $vinfo (@vsns) {
1579         my ($vsn,$vsn_dscurl,$digester,$digest) = @$vinfo;
1580         $dscurl = $vsn_dscurl;
1581         $dscdata = url_get($dscurl);
1582         if (!$dscdata) {
1583             $skew_warning_vsn = $vsn if !defined $skew_warning_vsn;
1584             next;
1585         }
1586         if ($digester) {
1587             $digester->reset();
1588             $digester->add($dscdata);
1589             my $got = $digester->hexdigest();
1590             $got eq $digest or
1591                 fail "$dscurl has hash $got but".
1592                     " archive told us to expect $digest";
1593         }
1594         parse_dscdata();
1595         my $fmt = getfield $dsc, 'Format';
1596         $format_ok{$fmt} or forceable_fail [qw(unsupported-source-format)],
1597             "unsupported source format $fmt, sorry";
1598             
1599         $dsc_checked = !!$digester;
1600         printdebug "get_archive_dsc: Version ".(getfield $dsc, 'Version')."\n";
1601         return;
1602     }
1603     $dsc = undef;
1604     printdebug "get_archive_dsc: nothing in archive, returning undef\n";
1605 }
1606
1607 sub check_for_git ();
1608 sub check_for_git () {
1609     # returns 0 or 1
1610     my $how = access_cfg('git-check');
1611     if ($how eq 'ssh-cmd') {
1612         my @cmd =
1613             (access_cfg_ssh, access_gituserhost(),
1614              access_runeinfo("git-check $package").
1615              " set -e; cd ".access_cfg('git-path').";".
1616              " if test -d $package.git; then echo 1; else echo 0; fi");
1617         my $r= cmdoutput @cmd;
1618         if (defined $r and $r =~ m/^divert (\w+)$/) {
1619             my $divert=$1;
1620             my ($usedistro,) = access_distros();
1621             # NB that if we are pushing, $usedistro will be $distro/push
1622             $instead_distro= cfg("dgit-distro.$usedistro.diverts.$divert");
1623             $instead_distro =~ s{^/}{ access_basedistro()."/" }e;
1624             progress "diverting to $divert (using config for $instead_distro)";
1625             return check_for_git();
1626         }
1627         failedcmd @cmd unless defined $r and $r =~ m/^[01]$/;
1628         return $r+0;
1629     } elsif ($how eq 'url') {
1630         my $prefix = access_cfg('git-check-url','git-url');
1631         my $suffix = access_cfg('git-check-suffix','git-suffix',
1632                                 'RETURN-UNDEF') // '.git';
1633         my $url = "$prefix/$package$suffix";
1634         my @cmd = (@curl, qw(-sS -I), $url);
1635         my $result = cmdoutput @cmd;
1636         $result =~ s/^\S+ 200 .*\n\r?\n//;
1637         # curl -sS -I with https_proxy prints
1638         # HTTP/1.0 200 Connection established
1639         $result =~ m/^\S+ (404|200) /s or
1640             fail "unexpected results from git check query - ".
1641                 Dumper($prefix, $result);
1642         my $code = $1;
1643         if ($code eq '404') {
1644             return 0;
1645         } elsif ($code eq '200') {
1646             return 1;
1647         } else {
1648             die;
1649         }
1650     } elsif ($how eq 'true') {
1651         return 1;
1652     } elsif ($how eq 'false') {
1653         return 0;
1654     } else {
1655         badcfg "unknown git-check \`$how'";
1656     }
1657 }
1658
1659 sub create_remote_git_repo () {
1660     my $how = access_cfg('git-create');
1661     if ($how eq 'ssh-cmd') {
1662         runcmd_ordryrun
1663             (access_cfg_ssh, access_gituserhost(),
1664              access_runeinfo("git-create $package").
1665              "set -e; cd ".access_cfg('git-path').";".
1666              " cp -a _template $package.git");
1667     } elsif ($how eq 'true') {
1668         # nothing to do
1669     } else {
1670         badcfg "unknown git-create \`$how'";
1671     }
1672 }
1673
1674 our ($dsc_hash,$lastpush_mergeinput);
1675 our ($dsc_distro, $dsc_hint_tag, $dsc_hint_url);
1676
1677
1678 sub prep_ud () {
1679     dgit_privdir(); # ensures that $dgit_privdir_made is based on $maindir
1680     fresh_playground 'dgit/unpack';
1681 }
1682
1683 sub mktree_in_ud_here () {
1684     playtree_setup $gitcfgs{local};
1685 }
1686
1687 sub git_write_tree () {
1688     my $tree = cmdoutput @git, qw(write-tree);
1689     $tree =~ m/^\w+$/ or die "$tree ?";
1690     return $tree;
1691 }
1692
1693 sub git_add_write_tree () {
1694     runcmd @git, qw(add -Af .);
1695     return git_write_tree();
1696 }
1697
1698 sub remove_stray_gits ($) {
1699     my ($what) = @_;
1700     my @gitscmd = qw(find -name .git -prune -print0);
1701     debugcmd "|",@gitscmd;
1702     open GITS, "-|", @gitscmd or die $!;
1703     {
1704         local $/="\0";
1705         while (<GITS>) {
1706             chomp or die;
1707             print STDERR "$us: warning: removing from $what: ",
1708                 (messagequote $_), "\n";
1709             rmtree $_;
1710         }
1711     }
1712     $!=0; $?=0; close GITS or failedcmd @gitscmd;
1713 }
1714
1715 sub mktree_in_ud_from_only_subdir ($;$) {
1716     my ($what,$raw) = @_;
1717     # changes into the subdir
1718
1719     my (@dirs) = <*/.>;
1720     die "expected one subdir but found @dirs ?" unless @dirs==1;
1721     $dirs[0] =~ m#^([^/]+)/\.$# or die;
1722     my $dir = $1;
1723     changedir $dir;
1724
1725     remove_stray_gits($what);
1726     mktree_in_ud_here();
1727     if (!$raw) {
1728         my ($format, $fopts) = get_source_format();
1729         if (madformat($format)) {
1730             rmtree '.pc';
1731         }
1732     }
1733
1734     my $tree=git_add_write_tree();
1735     return ($tree,$dir);
1736 }
1737
1738 our @files_csum_info_fields = 
1739     (['Checksums-Sha256','Digest::SHA', 'new(256)', 'sha256sum'],
1740      ['Checksums-Sha1',  'Digest::SHA', 'new(1)',   'sha1sum'],
1741      ['Files',           'Digest::MD5', 'new()',    'md5sum']);
1742
1743 sub dsc_files_info () {
1744     foreach my $csumi (@files_csum_info_fields) {
1745         my ($fname, $module, $method) = @$csumi;
1746         my $field = $dsc->{$fname};
1747         next unless defined $field;
1748         eval "use $module; 1;" or die $@;
1749         my @out;
1750         foreach (split /\n/, $field) {
1751             next unless m/\S/;
1752             m/^(\w+) (\d+) (\S+)$/ or
1753                 fail "could not parse .dsc $fname line \`$_'";
1754             my $digester = eval "$module"."->$method;" or die $@;
1755             push @out, {
1756                 Hash => $1,
1757                 Bytes => $2,
1758                 Filename => $3,
1759                 Digester => $digester,
1760             };
1761         }
1762         return @out;
1763     }
1764     fail "missing any supported Checksums-* or Files field in ".
1765         $dsc->get_option('name');
1766 }
1767
1768 sub dsc_files () {
1769     map { $_->{Filename} } dsc_files_info();
1770 }
1771
1772 sub files_compare_inputs (@) {
1773     my $inputs = \@_;
1774     my %record;
1775     my %fchecked;
1776
1777     my $showinputs = sub {
1778         return join "; ", map { $_->get_option('name') } @$inputs;
1779     };
1780
1781     foreach my $in (@$inputs) {
1782         my $expected_files;
1783         my $in_name = $in->get_option('name');
1784
1785         printdebug "files_compare_inputs $in_name\n";
1786
1787         foreach my $csumi (@files_csum_info_fields) {
1788             my ($fname) = @$csumi;
1789             printdebug "files_compare_inputs $in_name $fname\n";
1790
1791             my $field = $in->{$fname};
1792             next unless defined $field;
1793
1794             my @files;
1795             foreach (split /\n/, $field) {
1796                 next unless m/\S/;
1797
1798                 my ($info, $f) = m/^(\w+ \d+) (?:\S+ \S+ )?(\S+)$/ or
1799                     fail "could not parse $in_name $fname line \`$_'";
1800
1801                 printdebug "files_compare_inputs $in_name $fname $f\n";
1802
1803                 push @files, $f;
1804
1805                 my $re = \ $record{$f}{$fname};
1806                 if (defined $$re) {
1807                     $fchecked{$f}{$in_name} = 1;
1808                     $$re eq $info or
1809                         fail "hash or size of $f varies in $fname fields".
1810                         " (between: ".$showinputs->().")";
1811                 } else {
1812                     $$re = $info;
1813                 }
1814             }
1815             @files = sort @files;
1816             $expected_files //= \@files;
1817             "@$expected_files" eq "@files" or
1818                 fail "file list in $in_name varies between hash fields!";
1819         }
1820         $expected_files or
1821             fail "$in_name has no files list field(s)";
1822     }
1823     printdebug "files_compare_inputs ".Dumper(\%fchecked, \%record)
1824         if $debuglevel>=2;
1825
1826     grep { keys %$_ == @$inputs-1 } values %fchecked
1827         or fail "no file appears in all file lists".
1828         " (looked in: ".$showinputs->().")";
1829 }
1830
1831 sub is_orig_file_in_dsc ($$) {
1832     my ($f, $dsc_files_info) = @_;
1833     return 0 if @$dsc_files_info <= 1;
1834     # One file means no origs, and the filename doesn't have a "what
1835     # part of dsc" component.  (Consider versions ending `.orig'.)
1836     return 0 unless $f =~ m/\.$orig_f_tail_re$/o;
1837     return 1;
1838 }
1839
1840 sub is_orig_file_of_vsn ($$) {
1841     my ($f, $upstreamvsn) = @_;
1842     my $base = srcfn $upstreamvsn, '';
1843     return 0 unless $f =~ m/^\Q$base\E\.$orig_f_tail_re$/;
1844     return 1;
1845 }
1846
1847 sub changes_update_origs_from_dsc ($$$$) {
1848     my ($dsc, $changes, $upstreamvsn, $changesfile) = @_;
1849     my %changes_f;
1850     printdebug "checking origs needed ($upstreamvsn)...\n";
1851     $_ = getfield $changes, 'Files';
1852     m/^\w+ \d+ (\S+ \S+) \S+$/m or
1853         fail "cannot find section/priority from .changes Files field";
1854     my $placementinfo = $1;
1855     my %changed;
1856     printdebug "checking origs needed placement '$placementinfo'...\n";
1857     foreach my $l (split /\n/, getfield $dsc, 'Files') {
1858         $l =~ m/\S+$/ or next;
1859         my $file = $&;
1860         printdebug "origs $file | $l\n";
1861         next unless is_orig_file_of_vsn $file, $upstreamvsn;
1862         printdebug "origs $file is_orig\n";
1863         my $have = archive_query('file_in_archive', $file);
1864         if (!defined $have) {
1865             print STDERR <<END;
1866 archive does not support .orig check; hope you used --ch:--sa/-sd if needed
1867 END
1868             return;
1869         }
1870         my $found_same = 0;
1871         my @found_differ;
1872         printdebug "origs $file \$#\$have=$#$have\n";
1873         foreach my $h (@$have) {
1874             my $same = 0;
1875             my @differ;
1876             foreach my $csumi (@files_csum_info_fields) {
1877                 my ($fname, $module, $method, $archivefield) = @$csumi;
1878                 next unless defined $h->{$archivefield};
1879                 $_ = $dsc->{$fname};
1880                 next unless defined;
1881                 m/^(\w+) .* \Q$file\E$/m or
1882                     fail ".dsc $fname missing entry for $file";
1883                 if ($h->{$archivefield} eq $1) {
1884                     $same++;
1885                 } else {
1886                     push @differ,
1887  "$archivefield: $h->{$archivefield} (archive) != $1 (local .dsc)";
1888                 }
1889             }
1890             die "$file ".Dumper($h)." ?!" if $same && @differ;
1891             $found_same++
1892                 if $same;
1893             push @found_differ, "archive $h->{filename}: ".join "; ", @differ
1894                 if @differ;
1895         }
1896         printdebug "origs $file f.same=$found_same".
1897             " #f._differ=$#found_differ\n";
1898         if (@found_differ && !$found_same) {
1899             fail join "\n",
1900                 "archive contains $file with different checksum",
1901                 @found_differ;
1902         }
1903         # Now we edit the changes file to add or remove it
1904         foreach my $csumi (@files_csum_info_fields) {
1905             my ($fname, $module, $method, $archivefield) = @$csumi;
1906             next unless defined $changes->{$fname};
1907             if ($found_same) {
1908                 # in archive, delete from .changes if it's there
1909                 $changed{$file} = "removed" if
1910                     $changes->{$fname} =~ s/^.* \Q$file\E$(?:)\n//m;
1911             } elsif ($changes->{$fname} =~ m/^.* \Q$file\E$(?:)\n/m) {
1912                 # not in archive, but it's here in the .changes
1913             } else {
1914                 my $dsc_data = getfield $dsc, $fname;
1915                 $dsc_data =~ m/^(.* \Q$file\E$)\n/m or die "$dsc_data $file ?";
1916                 my $extra = $1;
1917                 $extra =~ s/ \d+ /$&$placementinfo /
1918                     or die "$fname $extra >$dsc_data< ?"
1919                     if $fname eq 'Files';
1920                 $changes->{$fname} .= "\n". $extra;
1921                 $changed{$file} = "added";
1922             }
1923         }
1924     }
1925     if (%changed) {
1926         foreach my $file (keys %changed) {
1927             progress sprintf
1928                 "edited .changes for archive .orig contents: %s %s",
1929                 $changed{$file}, $file;
1930         }
1931         my $chtmp = "$changesfile.tmp";
1932         $changes->save($chtmp);
1933         if (act_local()) {
1934             rename $chtmp,$changesfile or die "$changesfile $!";
1935         } else {
1936             progress "[new .changes left in $changesfile]";
1937         }
1938     } else {
1939         progress "$changesfile already has appropriate .orig(s) (if any)";
1940     }
1941 }
1942
1943 sub make_commit ($) {
1944     my ($file) = @_;
1945     return cmdoutput @git, qw(hash-object -w -t commit), $file;
1946 }
1947
1948 sub make_commit_text ($) {
1949     my ($text) = @_;
1950     my ($out, $in);
1951     my @cmd = (@git, qw(hash-object -w -t commit --stdin));
1952     debugcmd "|",@cmd;
1953     print Dumper($text) if $debuglevel > 1;
1954     my $child = open2($out, $in, @cmd) or die $!;
1955     my $h;
1956     eval {
1957         print $in $text or die $!;
1958         close $in or die $!;
1959         $h = <$out>;
1960         $h =~ m/^\w+$/ or die;
1961         $h = $&;
1962         printdebug "=> $h\n";
1963     };
1964     close $out;
1965     waitpid $child, 0 == $child or die "$child $!";
1966     $? and failedcmd @cmd;
1967     return $h;
1968 }
1969
1970 sub clogp_authline ($) {
1971     my ($clogp) = @_;
1972     my $author = getfield $clogp, 'Maintainer';
1973     if ($author =~ m/^[^"\@]+\,/) {
1974         # single entry Maintainer field with unquoted comma
1975         $author = ($& =~ y/,//rd).$'; # strip the comma
1976     }
1977     # git wants a single author; any remaining commas in $author
1978     # are by now preceded by @ (or ").  It seems safer to punt on
1979     # "..." for now rather than attempting to dequote or something.
1980     $author =~ s#,.*##ms unless $author =~ m/"/;
1981     my $date = cmdoutput qw(date), '+%s %z', qw(-d), getfield($clogp,'Date');
1982     my $authline = "$author $date";
1983     $authline =~ m/$git_authline_re/o or
1984         fail "unexpected commit author line format \`$authline'".
1985         " (was generated from changelog Maintainer field)";
1986     return ($1,$2,$3) if wantarray;
1987     return $authline;
1988 }
1989
1990 sub vendor_patches_distro ($$) {
1991     my ($checkdistro, $what) = @_;
1992     return unless defined $checkdistro;
1993
1994     my $series = "debian/patches/\L$checkdistro\E.series";
1995     printdebug "checking for vendor-specific $series ($what)\n";
1996
1997     if (!open SERIES, "<", $series) {
1998         die "$series $!" unless $!==ENOENT;
1999         return;
2000     }
2001     while (<SERIES>) {
2002         next unless m/\S/;
2003         next if m/^\s+\#/;
2004
2005         print STDERR <<END;
2006
2007 Unfortunately, this source package uses a feature of dpkg-source where
2008 the same source package unpacks to different source code on different
2009 distros.  dgit cannot safely operate on such packages on affected
2010 distros, because the meaning of source packages is not stable.
2011
2012 Please ask the distro/maintainer to remove the distro-specific series
2013 files and use a different technique (if necessary, uploading actually
2014 different packages, if different distros are supposed to have
2015 different code).
2016
2017 END
2018         fail "Found active distro-specific series file for".
2019             " $checkdistro ($what): $series, cannot continue";
2020     }
2021     die "$series $!" if SERIES->error;
2022     close SERIES;
2023 }
2024
2025 sub check_for_vendor_patches () {
2026     # This dpkg-source feature doesn't seem to be documented anywhere!
2027     # But it can be found in the changelog (reformatted):
2028
2029     #   commit  4fa01b70df1dc4458daee306cfa1f987b69da58c
2030     #   Author: Raphael Hertzog <hertzog@debian.org>
2031     #   Date: Sun  Oct  3  09:36:48  2010 +0200
2032
2033     #   dpkg-source: correctly create .pc/.quilt_series with alternate
2034     #   series files
2035     #   
2036     #   If you have debian/patches/ubuntu.series and you were
2037     #   unpacking the source package on ubuntu, quilt was still
2038     #   directed to debian/patches/series instead of
2039     #   debian/patches/ubuntu.series.
2040     #   
2041     #   debian/changelog                        |    3 +++
2042     #   scripts/Dpkg/Source/Package/V3/quilt.pm |    4 +++-
2043     #   2 files changed, 6 insertions(+), 1 deletion(-)
2044
2045     use Dpkg::Vendor;
2046     vendor_patches_distro($ENV{DEB_VENDOR}, "DEB_VENDOR");
2047     vendor_patches_distro(Dpkg::Vendor::get_current_vendor(),
2048                          "Dpkg::Vendor \`current vendor'");
2049     vendor_patches_distro(access_basedistro(),
2050                           "(base) distro being accessed");
2051     vendor_patches_distro(access_nomdistro(),
2052                           "(nominal) distro being accessed");
2053 }
2054
2055 sub generate_commits_from_dsc () {
2056     # See big comment in fetch_from_archive, below.
2057     # See also README.dsc-import.
2058     prep_ud();
2059     changedir $playground;
2060
2061     my @dfi = dsc_files_info();
2062     foreach my $fi (@dfi) {
2063         my $f = $fi->{Filename};
2064         die "$f ?" if $f =~ m#/|^\.|\.dsc$|\.tmp$#;
2065         my $upper_f = "$maindir/../$f";
2066
2067         printdebug "considering reusing $f: ";
2068
2069         if (link_ltarget "$upper_f,fetch", $f) {
2070             printdebug "linked (using ...,fetch).\n";
2071         } elsif ((printdebug "($!) "),
2072                  $! != ENOENT) {
2073             fail "accessing ../$f,fetch: $!";
2074         } elsif (link_ltarget $upper_f, $f) {
2075             printdebug "linked.\n";
2076         } elsif ((printdebug "($!) "),
2077                  $! != ENOENT) {
2078             fail "accessing ../$f: $!";
2079         } else {
2080             printdebug "absent.\n";
2081         }
2082
2083         my $refetched;
2084         complete_file_from_dsc('.', $fi, \$refetched)
2085             or next;
2086
2087         printdebug "considering saving $f: ";
2088
2089         if (link $f, $upper_f) {
2090             printdebug "linked.\n";
2091         } elsif ((printdebug "($!) "),
2092                  $! != EEXIST) {
2093             fail "saving ../$f: $!";
2094         } elsif (!$refetched) {
2095             printdebug "no need.\n";
2096         } elsif (link $f, "$upper_f,fetch") {
2097             printdebug "linked (using ...,fetch).\n";
2098         } elsif ((printdebug "($!) "),
2099                  $! != EEXIST) {
2100             fail "saving ../$f,fetch: $!";
2101         } else {
2102             printdebug "cannot.\n";
2103         }
2104     }
2105
2106     # We unpack and record the orig tarballs first, so that we only
2107     # need disk space for one private copy of the unpacked source.
2108     # But we can't make them into commits until we have the metadata
2109     # from the debian/changelog, so we record the tree objects now and
2110     # make them into commits later.
2111     my @tartrees;
2112     my $upstreamv = upstreamversion $dsc->{version};
2113     my $orig_f_base = srcfn $upstreamv, '';
2114
2115     foreach my $fi (@dfi) {
2116         # We actually import, and record as a commit, every tarball
2117         # (unless there is only one file, in which case there seems
2118         # little point.
2119
2120         my $f = $fi->{Filename};
2121         printdebug "import considering $f ";
2122         (printdebug "only one dfi\n"), next if @dfi == 1;
2123         (printdebug "not tar\n"), next unless $f =~ m/\.tar(\.\w+)?$/;
2124         (printdebug "signature\n"), next if $f =~ m/$orig_f_sig_re$/o;
2125         my $compr_ext = $1;
2126
2127         my ($orig_f_part) =
2128             $f =~ m/^\Q$orig_f_base\E\.([^._]+)?\.tar(?:\.\w+)?$/;
2129
2130         printdebug "Y ", (join ' ', map { $_//"(none)" }
2131                           $compr_ext, $orig_f_part
2132                          ), "\n";
2133
2134         my $input = new IO::File $f, '<' or die "$f $!";
2135         my $compr_pid;
2136         my @compr_cmd;
2137
2138         if (defined $compr_ext) {
2139             my $cname =
2140                 Dpkg::Compression::compression_guess_from_filename $f;
2141             fail "Dpkg::Compression cannot handle file $f in source package"
2142                 if defined $compr_ext && !defined $cname;
2143             my $compr_proc =
2144                 new Dpkg::Compression::Process compression => $cname;
2145             @compr_cmd = $compr_proc->get_uncompress_cmdline();
2146             my $compr_fh = new IO::Handle;
2147             my $compr_pid = open $compr_fh, "-|" // die $!;
2148             if (!$compr_pid) {
2149                 open STDIN, "<&", $input or die $!;
2150                 exec @compr_cmd;
2151                 die "dgit (child): exec $compr_cmd[0]: $!\n";
2152             }
2153             $input = $compr_fh;
2154         }
2155
2156         rmtree "_unpack-tar";
2157         mkdir "_unpack-tar" or die $!;
2158         my @tarcmd = qw(tar -x -f -
2159                         --no-same-owner --no-same-permissions
2160                         --no-acls --no-xattrs --no-selinux);
2161         my $tar_pid = fork // die $!;
2162         if (!$tar_pid) {
2163             chdir "_unpack-tar" or die $!;
2164             open STDIN, "<&", $input or die $!;
2165             exec @tarcmd;
2166             die "dgit (child): exec $tarcmd[0]: $!";
2167         }
2168         $!=0; (waitpid $tar_pid, 0) == $tar_pid or die $!;
2169         !$? or failedcmd @tarcmd;
2170
2171         close $input or
2172             (@compr_cmd ? ($?==SIGPIPE || failedcmd @compr_cmd)
2173              : die $!);
2174         # finally, we have the results in "tarball", but maybe
2175         # with the wrong permissions
2176
2177         runcmd qw(chmod -R +rwX _unpack-tar);
2178         changedir "_unpack-tar";
2179         remove_stray_gits($f);
2180         mktree_in_ud_here();
2181         
2182         my ($tree) = git_add_write_tree();
2183         my $tentries = cmdoutput @git, qw(ls-tree -z), $tree;
2184         if ($tentries =~ m/^\d+ tree (\w+)\t[^\000]+\000$/s) {
2185             $tree = $1;
2186             printdebug "one subtree $1\n";
2187         } else {
2188             printdebug "multiple subtrees\n";
2189         }
2190         changedir "..";
2191         rmtree "_unpack-tar";
2192
2193         my $ent = [ $f, $tree ];
2194         push @tartrees, {
2195             Orig => !!$orig_f_part,
2196             Sort => (!$orig_f_part         ? 2 :
2197                      $orig_f_part =~ m/-/g ? 1 :
2198                                              0),
2199             F => $f,
2200             Tree => $tree,
2201         };
2202     }
2203
2204     @tartrees = sort {
2205         # put any without "_" first (spec is not clear whether files
2206         # are always in the usual order).  Tarballs without "_" are
2207         # the main orig or the debian tarball.
2208         $a->{Sort} <=> $b->{Sort} or
2209         $a->{F}    cmp $b->{F}
2210     } @tartrees;
2211
2212     my $any_orig = grep { $_->{Orig} } @tartrees;
2213
2214     my $dscfn = "$package.dsc";
2215
2216     my $treeimporthow = 'package';
2217
2218     open D, ">", $dscfn or die "$dscfn: $!";
2219     print D $dscdata or die "$dscfn: $!";
2220     close D or die "$dscfn: $!";
2221     my @cmd = qw(dpkg-source);
2222     push @cmd, '--no-check' if $dsc_checked;
2223     if (madformat $dsc->{format}) {
2224         push @cmd, '--skip-patches';
2225         $treeimporthow = 'unpatched';
2226     }
2227     push @cmd, qw(-x --), $dscfn;
2228     runcmd @cmd;
2229
2230     my ($tree,$dir) = mktree_in_ud_from_only_subdir("source package");
2231     if (madformat $dsc->{format}) { 
2232         check_for_vendor_patches();
2233     }
2234
2235     my $dappliedtree;
2236     if (madformat $dsc->{format}) {
2237         my @pcmd = qw(dpkg-source --before-build .);
2238         runcmd shell_cmd 'exec >/dev/null', @pcmd;
2239         rmtree '.pc';
2240         $dappliedtree = git_add_write_tree();
2241     }
2242
2243     my @clogcmd = qw(dpkg-parsechangelog --format rfc822 --all);
2244     debugcmd "|",@clogcmd;
2245     open CLOGS, "-|", @clogcmd or die $!;
2246
2247     my $clogp;
2248     my $r1clogp;
2249
2250     printdebug "import clog search...\n";
2251
2252     for (;;) {
2253         my $stanzatext = do { local $/=""; <CLOGS>; };
2254         printdebug "import clogp ".Dumper($stanzatext) if $debuglevel>1;
2255         last if !defined $stanzatext;
2256
2257         my $desc = "package changelog, entry no.$.";
2258         open my $stanzafh, "<", \$stanzatext or die;
2259         my $thisstanza = parsecontrolfh $stanzafh, $desc, 1;
2260         $clogp //= $thisstanza;
2261
2262         printdebug "import clog $thisstanza->{version} $desc...\n";
2263
2264         last if !$any_orig; # we don't need $r1clogp
2265
2266         # We look for the first (most recent) changelog entry whose
2267         # version number is lower than the upstream version of this
2268         # package.  Then the last (least recent) previous changelog
2269         # entry is treated as the one which introduced this upstream
2270         # version and used for the synthetic commits for the upstream
2271         # tarballs.
2272
2273         # One might think that a more sophisticated algorithm would be
2274         # necessary.  But: we do not want to scan the whole changelog
2275         # file.  Stopping when we see an earlier version, which
2276         # necessarily then is an earlier upstream version, is the only
2277         # realistic way to do that.  Then, either the earliest
2278         # changelog entry we have seen so far is indeed the earliest
2279         # upload of this upstream version; or there are only changelog
2280         # entries relating to later upstream versions (which is not
2281         # possible unless the changelog and .dsc disagree about the
2282         # version).  Then it remains to choose between the physically
2283         # last entry in the file, and the one with the lowest version
2284         # number.  If these are not the same, we guess that the
2285         # versions were created in a non-monotic order rather than
2286         # that the changelog entries have been misordered.
2287
2288         printdebug "import clog $thisstanza->{version} vs $upstreamv...\n";
2289
2290         last if version_compare($thisstanza->{version}, $upstreamv) < 0;
2291         $r1clogp = $thisstanza;
2292
2293         printdebug "import clog $r1clogp->{version} becomes r1\n";
2294     }
2295     die $! if CLOGS->error;
2296     close CLOGS or $?==SIGPIPE or failedcmd @clogcmd;
2297
2298     $clogp or fail "package changelog has no entries!";
2299
2300     my $authline = clogp_authline $clogp;
2301     my $changes = getfield $clogp, 'Changes';
2302     $changes =~ s/^\n//; # Changes: \n
2303     my $cversion = getfield $clogp, 'Version';
2304
2305     if (@tartrees) {
2306         $r1clogp //= $clogp; # maybe there's only one entry;
2307         my $r1authline = clogp_authline $r1clogp;
2308         # Strictly, r1authline might now be wrong if it's going to be
2309         # unused because !$any_orig.  Whatever.
2310
2311         printdebug "import tartrees authline   $authline\n";
2312         printdebug "import tartrees r1authline $r1authline\n";
2313
2314         foreach my $tt (@tartrees) {
2315             printdebug "import tartree $tt->{F} $tt->{Tree}\n";
2316
2317             $tt->{Commit} = make_commit_text($tt->{Orig} ? <<END_O : <<END_T);
2318 tree $tt->{Tree}
2319 author $r1authline
2320 committer $r1authline
2321
2322 Import $tt->{F}
2323
2324 [dgit import orig $tt->{F}]
2325 END_O
2326 tree $tt->{Tree}
2327 author $authline
2328 committer $authline
2329
2330 Import $tt->{F}
2331
2332 [dgit import tarball $package $cversion $tt->{F}]
2333 END_T
2334         }
2335     }
2336
2337     printdebug "import main commit\n";
2338
2339     open C, ">../commit.tmp" or die $!;
2340     print C <<END or die $!;
2341 tree $tree
2342 END
2343     print C <<END or die $! foreach @tartrees;
2344 parent $_->{Commit}
2345 END
2346     print C <<END or die $!;
2347 author $authline
2348 committer $authline
2349
2350 $changes
2351
2352 [dgit import $treeimporthow $package $cversion]
2353 END
2354
2355     close C or die $!;
2356     my $rawimport_hash = make_commit qw(../commit.tmp);
2357
2358     if (madformat $dsc->{format}) {
2359         printdebug "import apply patches...\n";
2360
2361         # regularise the state of the working tree so that
2362         # the checkout of $rawimport_hash works nicely.
2363         my $dappliedcommit = make_commit_text(<<END);
2364 tree $dappliedtree
2365 author $authline
2366 committer $authline
2367
2368 [dgit dummy commit]
2369 END
2370         runcmd @git, qw(checkout -q -b dapplied), $dappliedcommit;
2371
2372         runcmd @git, qw(checkout -q -b unpa), $rawimport_hash;
2373
2374         # We need the answers to be reproducible
2375         my @authline = clogp_authline($clogp);
2376         local $ENV{GIT_COMMITTER_NAME} =  $authline[0];
2377         local $ENV{GIT_COMMITTER_EMAIL} = $authline[1];
2378         local $ENV{GIT_COMMITTER_DATE} =  $authline[2];
2379         local $ENV{GIT_AUTHOR_NAME} =  $authline[0];
2380         local $ENV{GIT_AUTHOR_EMAIL} = $authline[1];
2381         local $ENV{GIT_AUTHOR_DATE} =  $authline[2];
2382
2383         my $path = $ENV{PATH} or die;
2384         
2385         # we use ../../gbp-pq-output, which (given that we are in
2386         # $playground/PLAYTREE, and $playground is .git/dgit/unpack,
2387         # is .git/dgit.
2388
2389         foreach my $use_absurd (qw(0 1)) {
2390             runcmd @git, qw(checkout -q unpa);
2391             runcmd @git, qw(update-ref -d refs/heads/patch-queue/unpa);
2392             local $ENV{PATH} = $path;
2393             if ($use_absurd) {
2394                 chomp $@;
2395                 progress "warning: $@";
2396                 $path = "$absurdity:$path";
2397                 progress "$us: trying slow absurd-git-apply...";
2398                 rename "../../gbp-pq-output","../../gbp-pq-output.0"
2399                     or $!==ENOENT
2400                     or die $!;
2401             }
2402             eval {
2403                 die "forbid absurd git-apply\n" if $use_absurd
2404                     && forceing [qw(import-gitapply-no-absurd)];
2405                 die "only absurd git-apply!\n" if !$use_absurd
2406                     && forceing [qw(import-gitapply-absurd)];
2407
2408                 local $ENV{DGIT_ABSURD_DEBUG} = $debuglevel if $use_absurd;
2409                 local $ENV{PATH} = $path                    if $use_absurd;
2410
2411                 my @showcmd = (gbp_pq, qw(import));
2412                 my @realcmd = shell_cmd
2413                     'exec >/dev/null 2>>../../gbp-pq-output', @showcmd;
2414                 debugcmd "+",@realcmd;
2415                 if (system @realcmd) {
2416                     die +(shellquote @showcmd).
2417                         " failed: ".
2418                         failedcmd_waitstatus()."\n";
2419                 }
2420
2421                 my $gapplied = git_rev_parse('HEAD');
2422                 my $gappliedtree = cmdoutput @git, qw(rev-parse HEAD:);
2423                 $gappliedtree eq $dappliedtree or
2424                     fail <<END;
2425 gbp-pq import and dpkg-source disagree!
2426  gbp-pq import gave commit $gapplied
2427  gbp-pq import gave tree $gappliedtree
2428  dpkg-source --before-build gave tree $dappliedtree
2429 END
2430                 $rawimport_hash = $gapplied;
2431             };
2432             last unless $@;
2433         }
2434         if ($@) {
2435             { local $@; eval { runcmd qw(cat ../../gbp-pq-output); }; }
2436             die $@;
2437         }
2438     }
2439
2440     progress "synthesised git commit from .dsc $cversion";
2441
2442     my $rawimport_mergeinput = {
2443         Commit => $rawimport_hash,
2444         Info => "Import of source package",
2445     };
2446     my @output = ($rawimport_mergeinput);
2447
2448     if ($lastpush_mergeinput) {
2449         my $oldclogp = mergeinfo_getclogp($lastpush_mergeinput);
2450         my $oversion = getfield $oldclogp, 'Version';
2451         my $vcmp =
2452             version_compare($oversion, $cversion);
2453         if ($vcmp < 0) {
2454             @output = ($rawimport_mergeinput, $lastpush_mergeinput,
2455                 { Message => <<END, ReverseParents => 1 });
2456 Record $package ($cversion) in archive suite $csuite
2457 END
2458         } elsif ($vcmp > 0) {
2459             print STDERR <<END or die $!;
2460
2461 Version actually in archive:   $cversion (older)
2462 Last version pushed with dgit: $oversion (newer or same)
2463 $later_warning_msg
2464 END
2465             @output = $lastpush_mergeinput;
2466         } else {
2467             # Same version.  Use what's in the server git branch,
2468             # discarding our own import.  (This could happen if the
2469             # server automatically imports all packages into git.)
2470             @output = $lastpush_mergeinput;
2471         }
2472     }
2473     changedir $maindir;
2474     rmtree $playground;
2475     return @output;
2476 }
2477
2478 sub complete_file_from_dsc ($$;$) {
2479     our ($dstdir, $fi, $refetched) = @_;
2480     # Ensures that we have, in $dstdir, the file $fi, with the correct
2481     # contents.  (Downloading it from alongside $dscurl if necessary.)
2482     # If $refetched is defined, can overwrite "$dstdir/$fi->{Filename}"
2483     # and will set $$refetched=1 if it did so (or tried to).
2484
2485     my $f = $fi->{Filename};
2486     my $tf = "$dstdir/$f";
2487     my $downloaded = 0;
2488
2489     my $got;
2490     my $checkhash = sub {
2491         open F, "<", "$tf" or die "$tf: $!";
2492         $fi->{Digester}->reset();
2493         $fi->{Digester}->addfile(*F);
2494         F->error and die $!;
2495         $got = $fi->{Digester}->hexdigest();
2496         return $got eq $fi->{Hash};
2497     };
2498
2499     if (stat_exists $tf) {
2500         if ($checkhash->()) {
2501             progress "using existing $f";
2502             return 1;
2503         }
2504         if (!$refetched) {
2505             fail "file $f has hash $got but .dsc".
2506                 " demands hash $fi->{Hash} ".
2507                 "(perhaps you should delete this file?)";
2508         }
2509         progress "need to fetch correct version of $f";
2510         unlink $tf or die "$tf $!";
2511         $$refetched = 1;
2512     } else {
2513         printdebug "$tf does not exist, need to fetch\n";
2514     }
2515
2516     my $furl = $dscurl;
2517     $furl =~ s{/[^/]+$}{};
2518     $furl .= "/$f";
2519     die "$f ?" unless $f =~ m/^\Q${package}\E_/;
2520     die "$f ?" if $f =~ m#/#;
2521     runcmd_ordryrun_local @curl,qw(-f -o),$tf,'--',"$furl";
2522     return 0 if !act_local();
2523
2524     $checkhash->() or
2525         fail "file $f has hash $got but .dsc".
2526             " demands hash $fi->{Hash} ".
2527             "(got wrong file from archive!)";
2528
2529     return 1;
2530 }
2531
2532 sub ensure_we_have_orig () {
2533     my @dfi = dsc_files_info();
2534     foreach my $fi (@dfi) {
2535         my $f = $fi->{Filename};
2536         next unless is_orig_file_in_dsc($f, \@dfi);
2537         complete_file_from_dsc('..', $fi)
2538             or next;
2539     }
2540 }
2541
2542 #---------- git fetch ----------
2543
2544 sub lrfetchrefs () { return "refs/dgit-fetch/".access_basedistro(); }
2545 sub lrfetchref () { return lrfetchrefs.'/'.server_branch($csuite); }
2546
2547 # We fetch some parts of lrfetchrefs/*.  Ideally we delete these
2548 # locally fetched refs because they have unhelpful names and clutter
2549 # up gitk etc.  So we track whether we have "used up" head ref (ie,
2550 # whether we have made another local ref which refers to this object).
2551 #
2552 # (If we deleted them unconditionally, then we might end up
2553 # re-fetching the same git objects each time dgit fetch was run.)
2554 #
2555 # So, each use of lrfetchrefs needs to be accompanied by arrangements
2556 # in git_fetch_us to fetch the refs in question, and possibly a call
2557 # to lrfetchref_used.
2558
2559 our (%lrfetchrefs_f, %lrfetchrefs_d);
2560 # $lrfetchrefs_X{lrfetchrefs."/heads/whatever"} = $objid
2561
2562 sub lrfetchref_used ($) {
2563     my ($fullrefname) = @_;
2564     my $objid = $lrfetchrefs_f{$fullrefname};
2565     $lrfetchrefs_d{$fullrefname} = $objid if defined $objid;
2566 }
2567
2568 sub git_lrfetch_sane {
2569     my ($url, $supplementary, @specs) = @_;
2570     # Make a 'refs/'.lrfetchrefs.'/*' be just like on server,
2571     # at least as regards @specs.  Also leave the results in
2572     # %lrfetchrefs_f, and arrange for lrfetchref_used to be
2573     # able to clean these up.
2574     #
2575     # With $supplementary==1, @specs must not contain wildcards
2576     # and we add to our previous fetches (non-atomically).
2577
2578     # This is rather miserable:
2579     # When git fetch --prune is passed a fetchspec ending with a *,
2580     # it does a plausible thing.  If there is no * then:
2581     # - it matches subpaths too, even if the supplied refspec
2582     #   starts refs, and behaves completely madly if the source
2583     #   has refs/refs/something.  (See, for example, Debian #NNNN.)
2584     # - if there is no matching remote ref, it bombs out the whole
2585     #   fetch.
2586     # We want to fetch a fixed ref, and we don't know in advance
2587     # if it exists, so this is not suitable.
2588     #
2589     # Our workaround is to use git ls-remote.  git ls-remote has its
2590     # own qairks.  Notably, it has the absurd multi-tail-matching
2591     # behaviour: git ls-remote R refs/foo can report refs/foo AND
2592     # refs/refs/foo etc.
2593     #
2594     # Also, we want an idempotent snapshot, but we have to make two
2595     # calls to the remote: one to git ls-remote and to git fetch.  The
2596     # solution is use git ls-remote to obtain a target state, and
2597     # git fetch to try to generate it.  If we don't manage to generate
2598     # the target state, we try again.
2599
2600     printdebug "git_lrfetch_sane suppl=$supplementary specs @specs\n";
2601
2602     my $specre = join '|', map {
2603         my $x = $_;
2604         $x =~ s/\W/\\$&/g;
2605         my $wildcard = $x =~ s/\\\*$/.*/;
2606         die if $wildcard && $supplementary;
2607         "(?:refs/$x)";
2608     } @specs;
2609     printdebug "git_lrfetch_sane specre=$specre\n";
2610     my $wanted_rref = sub {
2611         local ($_) = @_;
2612         return m/^(?:$specre)$/;
2613     };
2614
2615     my $fetch_iteration = 0;
2616     FETCH_ITERATION:
2617     for (;;) {
2618         printdebug "git_lrfetch_sane iteration $fetch_iteration\n";
2619         if (++$fetch_iteration > 10) {
2620             fail "too many iterations trying to get sane fetch!";
2621         }
2622
2623         my @look = map { "refs/$_" } @specs;
2624         my @lcmd = (@git, qw(ls-remote -q --refs), $url, @look);
2625         debugcmd "|",@lcmd;
2626
2627         my %wantr;
2628         open GITLS, "-|", @lcmd or die $!;
2629         while (<GITLS>) {
2630             printdebug "=> ", $_;
2631             m/^(\w+)\s+(\S+)\n/ or die "ls-remote $_ ?";
2632             my ($objid,$rrefname) = ($1,$2);
2633             if (!$wanted_rref->($rrefname)) {
2634                 print STDERR <<END;
2635 warning: git ls-remote @look reported $rrefname; this is silly, ignoring it.
2636 END
2637                 next;
2638             }
2639             $wantr{$rrefname} = $objid;
2640         }
2641         $!=0; $?=0;
2642         close GITLS or failedcmd @lcmd;
2643
2644         # OK, now %want is exactly what we want for refs in @specs
2645         my @fspecs = map {
2646             !m/\*$/ && !exists $wantr{"refs/$_"} ? () :
2647             "+refs/$_:".lrfetchrefs."/$_";
2648         } @specs;
2649
2650         printdebug "git_lrfetch_sane fspecs @fspecs\n";
2651
2652         my @fcmd = (@git, qw(fetch -p -n -q), $url, @fspecs);
2653         runcmd_ordryrun_local @fcmd if @fspecs;
2654
2655         if (!$supplementary) {
2656             %lrfetchrefs_f = ();
2657         }
2658         my %objgot;
2659
2660         git_for_each_ref(lrfetchrefs, sub {
2661             my ($objid,$objtype,$lrefname,$reftail) = @_;
2662             $lrfetchrefs_f{$lrefname} = $objid;
2663             $objgot{$objid} = 1;
2664         });
2665
2666         if ($supplementary) {
2667             last;
2668         }
2669
2670         foreach my $lrefname (sort keys %lrfetchrefs_f) {
2671             my $rrefname = 'refs'.substr($lrefname, length lrfetchrefs);
2672             if (!exists $wantr{$rrefname}) {
2673                 if ($wanted_rref->($rrefname)) {
2674                     printdebug <<END;
2675 git-fetch @fspecs created $lrefname which git ls-remote @look didn't list.
2676 END
2677                 } else {
2678                     print STDERR <<END
2679 warning: git fetch @fspecs created $lrefname; this is silly, deleting it.
2680 END
2681                 }
2682                 runcmd_ordryrun_local @git, qw(update-ref -d), $lrefname;
2683                 delete $lrfetchrefs_f{$lrefname};
2684                 next;
2685             }
2686         }
2687         foreach my $rrefname (sort keys %wantr) {
2688             my $lrefname = lrfetchrefs.substr($rrefname, 4);
2689             my $got = $lrfetchrefs_f{$lrefname} // '<none>';
2690             my $want = $wantr{$rrefname};
2691             next if $got eq $want;
2692             if (!defined $objgot{$want}) {
2693                 print STDERR <<END;
2694 warning: git ls-remote suggests we want $lrefname
2695 warning:  and it should refer to $want
2696 warning:  but git fetch didn't fetch that object to any relevant ref.
2697 warning:  This may be due to a race with someone updating the server.
2698 warning:  Will try again...
2699 END
2700                 next FETCH_ITERATION;
2701             }
2702             printdebug <<END;
2703 git-fetch @fspecs made $lrefname=$got but want git ls-remote @look says $want
2704 END
2705             runcmd_ordryrun_local @git, qw(update-ref -m),
2706                 "dgit fetch git fetch fixup", $lrefname, $want;
2707             $lrfetchrefs_f{$lrefname} = $want;
2708         }
2709         last;
2710     }
2711
2712     if (defined $csuite) {
2713         printdebug "git_lrfetch_sane: tidying any old suite lrfetchrefs\n";
2714         git_for_each_ref("refs/dgit-fetch/$csuite", sub {
2715             my ($objid,$objtype,$lrefname,$reftail) = @_;
2716             next if $lrfetchrefs_f{$lrefname}; # $csuite eq $distro ?
2717             runcmd_ordryrun_local @git, qw(update-ref -d), $lrefname;
2718         });
2719     }
2720
2721     printdebug "git_lrfetch_sane: git fetch --no-insane emulation complete\n",
2722         Dumper(\%lrfetchrefs_f);
2723 }
2724
2725 sub git_fetch_us () {
2726     # Want to fetch only what we are going to use, unless
2727     # deliberately-not-ff, in which case we must fetch everything.
2728
2729     my @specs = deliberately_not_fast_forward ? qw(tags/*) :
2730         map { "tags/$_" }
2731         (quiltmode_splitbrain
2732          ? (map { $_->('*',access_nomdistro) }
2733             \&debiantag_new, \&debiantag_maintview)
2734          : debiantags('*',access_nomdistro));
2735     push @specs, server_branch($csuite);
2736     push @specs, $rewritemap;
2737     push @specs, qw(heads/*) if deliberately_not_fast_forward;
2738
2739     my $url = access_giturl();
2740     git_lrfetch_sane $url, 0, @specs;
2741
2742     my %here;
2743     my @tagpats = debiantags('*',access_nomdistro);
2744
2745     git_for_each_ref([map { "refs/tags/$_" } @tagpats], sub {
2746         my ($objid,$objtype,$fullrefname,$reftail) = @_;
2747         printdebug "currently $fullrefname=$objid\n";
2748         $here{$fullrefname} = $objid;
2749     });
2750     git_for_each_ref([map { lrfetchrefs."/tags/".$_ } @tagpats], sub {
2751         my ($objid,$objtype,$fullrefname,$reftail) = @_;
2752         my $lref = "refs".substr($fullrefname, length(lrfetchrefs));
2753         printdebug "offered $lref=$objid\n";
2754         if (!defined $here{$lref}) {
2755             my @upd = (@git, qw(update-ref), $lref, $objid, '');
2756             runcmd_ordryrun_local @upd;
2757             lrfetchref_used $fullrefname;
2758         } elsif ($here{$lref} eq $objid) {
2759             lrfetchref_used $fullrefname;
2760         } else {
2761             print STDERR
2762                 "Not updating $lref from $here{$lref} to $objid.\n";
2763         }
2764     });
2765 }
2766
2767 #---------- dsc and archive handling ----------
2768
2769 sub mergeinfo_getclogp ($) {
2770     # Ensures thit $mi->{Clogp} exists and returns it
2771     my ($mi) = @_;
2772     $mi->{Clogp} = commit_getclogp($mi->{Commit});
2773 }
2774
2775 sub mergeinfo_version ($) {
2776     return getfield( (mergeinfo_getclogp $_[0]), 'Version' );
2777 }
2778
2779 sub fetch_from_archive_record_1 ($) {
2780     my ($hash) = @_;
2781     runcmd @git, qw(update-ref -m), "dgit fetch $csuite",
2782             'DGIT_ARCHIVE', $hash;
2783     cmdoutput @git, qw(log -n2), $hash;
2784     # ... gives git a chance to complain if our commit is malformed
2785 }
2786
2787 sub fetch_from_archive_record_2 ($) {
2788     my ($hash) = @_;
2789     my @upd_cmd = (@git, qw(update-ref -m), 'dgit fetch', lrref(), $hash);
2790     if (act_local()) {
2791         cmdoutput @upd_cmd;
2792     } else {
2793         dryrun_report @upd_cmd;
2794     }
2795 }
2796
2797 sub parse_dsc_field_def_dsc_distro () {
2798     $dsc_distro //= cfg qw(dgit.default.old-dsc-distro
2799                            dgit.default.distro);
2800 }
2801
2802 sub parse_dsc_field ($$) {
2803     my ($dsc, $what) = @_;
2804     my $f;
2805     foreach my $field (@ourdscfield) {
2806         $f = $dsc->{$field};
2807         last if defined $f;
2808     }
2809
2810     if (!defined $f) {
2811         progress "$what: NO git hash";
2812         parse_dsc_field_def_dsc_distro();
2813     } elsif (($dsc_hash, $dsc_distro, $dsc_hint_tag, $dsc_hint_url)
2814              = $f =~ m/^(\w+)\s+($distro_re)\s+($versiontag_re)\s+(\S+)(?:\s|$)/) {
2815         progress "$what: specified git info ($dsc_distro)";
2816         $dsc_hint_tag = [ $dsc_hint_tag ];
2817     } elsif ($f =~ m/^\w+\s*$/) {
2818         $dsc_hash = $&;
2819         parse_dsc_field_def_dsc_distro();
2820         $dsc_hint_tag = [ debiantags +(getfield $dsc, 'Version'),
2821                           $dsc_distro ];
2822         progress "$what: specified git hash";
2823     } else {
2824         fail "$what: invalid Dgit info";
2825     }
2826 }
2827
2828 sub resolve_dsc_field_commit ($$) {
2829     my ($already_distro, $already_mapref) = @_;
2830
2831     return unless defined $dsc_hash;
2832
2833     my $mapref =
2834         defined $already_mapref &&
2835         ($already_distro eq $dsc_distro || !$chase_dsc_distro)
2836         ? $already_mapref : undef;
2837
2838     my $do_fetch;
2839     $do_fetch = sub {
2840         my ($what, @fetch) = @_;
2841
2842         local $idistro = $dsc_distro;
2843         my $lrf = lrfetchrefs;
2844
2845         if (!$chase_dsc_distro) {
2846             progress
2847                 "not chasing .dsc distro $dsc_distro: not fetching $what";
2848             return 0;
2849         }
2850
2851         progress
2852             ".dsc names distro $dsc_distro: fetching $what";
2853
2854         my $url = access_giturl();
2855         if (!defined $url) {
2856             defined $dsc_hint_url or fail <<END;
2857 .dsc Dgit metadata is in context of distro $dsc_distro
2858 for which we have no configured url and .dsc provides no hint
2859 END
2860             my $proto =
2861                 $dsc_hint_url =~ m#^([-+0-9a-zA-Z]+):# ? $1 :
2862                 $dsc_hint_url =~ m#^/# ? 'file' : 'bad-syntax';
2863             parse_cfg_bool "dsc-url-proto-ok", 'false',
2864                 cfg("dgit.dsc-url-proto-ok.$proto",
2865                     "dgit.default.dsc-url-proto-ok")
2866                 or fail <<END;
2867 .dsc Dgit metadata is in context of distro $dsc_distro
2868 for which we have no configured url;
2869 .dsc provides hinted url with protocol $proto which is unsafe.
2870 (can be overridden by config - consult documentation)
2871 END
2872             $url = $dsc_hint_url;
2873         }
2874
2875         git_lrfetch_sane $url, 1, @fetch;
2876
2877         return $lrf;
2878     };
2879
2880     my $rewrite_enable = do {
2881         local $idistro = $dsc_distro;
2882         access_cfg('rewrite-map-enable', 'RETURN-UNDEF');
2883     };
2884
2885     if (parse_cfg_bool 'rewrite-map-enable', 'true', $rewrite_enable) {
2886         if (!defined $mapref) {
2887             my $lrf = $do_fetch->("rewrite map", $rewritemap) or return;
2888             $mapref = $lrf.'/'.$rewritemap;
2889         }
2890         my $rewritemapdata = git_cat_file $mapref.':map';
2891         if (defined $rewritemapdata
2892             && $rewritemapdata =~ m/^$dsc_hash(?:[ \t](\w+))/m) {
2893             progress
2894                 "server's git history rewrite map contains a relevant entry!";
2895
2896             $dsc_hash = $1;
2897             if (defined $dsc_hash) {
2898                 progress "using rewritten git hash in place of .dsc value";
2899             } else {
2900                 progress "server data says .dsc hash is to be disregarded";
2901             }
2902         }
2903     }
2904
2905     if (!defined git_cat_file $dsc_hash) {
2906         my @tags = map { "tags/".$_ } @$dsc_hint_tag;
2907         my $lrf = $do_fetch->("additional commits", @tags) &&
2908             defined git_cat_file $dsc_hash
2909             or fail <<END;
2910 .dsc Dgit metadata requires commit $dsc_hash
2911 but we could not obtain that object anywhere.
2912 END
2913         foreach my $t (@tags) {
2914             my $fullrefname = $lrf.'/'.$t;
2915 #           print STDERR "CHK $t $fullrefname ".Dumper(\%lrfetchrefs_f);
2916             next unless $lrfetchrefs_f{$fullrefname};
2917             next unless is_fast_fwd "$fullrefname~0", $dsc_hash;
2918             lrfetchref_used $fullrefname;
2919         }
2920     }
2921 }
2922
2923 sub fetch_from_archive () {
2924     ensure_setup_existing_tree();
2925
2926     # Ensures that lrref() is what is actually in the archive, one way
2927     # or another, according to us - ie this client's
2928     # appropritaely-updated archive view.  Also returns the commit id.
2929     # If there is nothing in the archive, leaves lrref alone and
2930     # returns undef.  git_fetch_us must have already been called.
2931     get_archive_dsc();
2932
2933     if ($dsc) {
2934         parse_dsc_field($dsc, 'last upload to archive');
2935         resolve_dsc_field_commit access_basedistro,
2936             lrfetchrefs."/".$rewritemap
2937     } else {
2938         progress "no version available from the archive";
2939     }
2940
2941     # If the archive's .dsc has a Dgit field, there are three
2942     # relevant git commitids we need to choose between and/or merge
2943     # together:
2944     #   1. $dsc_hash: the Dgit field from the archive
2945     #   2. $lastpush_hash: the suite branch on the dgit git server
2946     #   3. $lastfetch_hash: our local tracking brach for the suite
2947     #
2948     # These may all be distinct and need not be in any fast forward
2949     # relationship:
2950     #
2951     # If the dsc was pushed to this suite, then the server suite
2952     # branch will have been updated; but it might have been pushed to
2953     # a different suite and copied by the archive.  Conversely a more
2954     # recent version may have been pushed with dgit but not appeared
2955     # in the archive (yet).
2956     #
2957     # $lastfetch_hash may be awkward because archive imports
2958     # (particularly, imports of Dgit-less .dscs) are performed only as
2959     # needed on individual clients, so different clients may perform a
2960     # different subset of them - and these imports are only made
2961     # public during push.  So $lastfetch_hash may represent a set of
2962     # imports different to a subsequent upload by a different dgit
2963     # client.
2964     #
2965     # Our approach is as follows:
2966     #
2967     # As between $dsc_hash and $lastpush_hash: if $lastpush_hash is a
2968     # descendant of $dsc_hash, then it was pushed by a dgit user who
2969     # had based their work on $dsc_hash, so we should prefer it.
2970     # Otherwise, $dsc_hash was installed into this suite in the
2971     # archive other than by a dgit push, and (necessarily) after the
2972     # last dgit push into that suite (since a dgit push would have
2973     # been descended from the dgit server git branch); thus, in that
2974     # case, we prefer the archive's version (and produce a
2975     # pseudo-merge to overwrite the dgit server git branch).
2976     #
2977     # (If there is no Dgit field in the archive's .dsc then
2978     # generate_commit_from_dsc uses the version numbers to decide
2979     # whether the suite branch or the archive is newer.  If the suite
2980     # branch is newer it ignores the archive's .dsc; otherwise it
2981     # generates an import of the .dsc, and produces a pseudo-merge to
2982     # overwrite the suite branch with the archive contents.)
2983     #
2984     # The outcome of that part of the algorithm is the `public view',
2985     # and is same for all dgit clients: it does not depend on any
2986     # unpublished history in the local tracking branch.
2987     #
2988     # As between the public view and the local tracking branch: The
2989     # local tracking branch is only updated by dgit fetch, and
2990     # whenever dgit fetch runs it includes the public view in the
2991     # local tracking branch.  Therefore if the public view is not
2992     # descended from the local tracking branch, the local tracking
2993     # branch must contain history which was imported from the archive
2994     # but never pushed; and, its tip is now out of date.  So, we make
2995     # a pseudo-merge to overwrite the old imports and stitch the old
2996     # history in.
2997     #
2998     # Finally: we do not necessarily reify the public view (as
2999     # described above).  This is so that we do not end up stacking two
3000     # pseudo-merges.  So what we actually do is figure out the inputs
3001     # to any public view pseudo-merge and put them in @mergeinputs.
3002
3003     my @mergeinputs;
3004     # $mergeinputs[]{Commit}
3005     # $mergeinputs[]{Info}
3006     # $mergeinputs[0] is the one whose tree we use
3007     # @mergeinputs is in the order we use in the actual commit)
3008     #
3009     # Also:
3010     # $mergeinputs[]{Message} is a commit message to use
3011     # $mergeinputs[]{ReverseParents} if def specifies that parent
3012     #                                list should be in opposite order
3013     # Such an entry has no Commit or Info.  It applies only when found
3014     # in the last entry.  (This ugliness is to support making
3015     # identical imports to previous dgit versions.)
3016
3017     my $lastpush_hash = git_get_ref(lrfetchref());
3018     printdebug "previous reference hash=$lastpush_hash\n";
3019     $lastpush_mergeinput = $lastpush_hash && {
3020         Commit => $lastpush_hash,
3021         Info => "dgit suite branch on dgit git server",
3022     };
3023
3024     my $lastfetch_hash = git_get_ref(lrref());
3025     printdebug "fetch_from_archive: lastfetch=$lastfetch_hash\n";
3026     my $lastfetch_mergeinput = $lastfetch_hash && {
3027         Commit => $lastfetch_hash,
3028         Info => "dgit client's archive history view",
3029     };
3030
3031     my $dsc_mergeinput = $dsc_hash && {
3032         Commit => $dsc_hash,
3033         Info => "Dgit field in .dsc from archive",
3034     };
3035
3036     my $cwd = getcwd();
3037     my $del_lrfetchrefs = sub {
3038         changedir $cwd;
3039         my $gur;
3040         printdebug "del_lrfetchrefs...\n";
3041         foreach my $fullrefname (sort keys %lrfetchrefs_d) {
3042             my $objid = $lrfetchrefs_d{$fullrefname};
3043             printdebug "del_lrfetchrefs: $objid $fullrefname\n";
3044             if (!$gur) {
3045                 $gur ||= new IO::Handle;
3046                 open $gur, "|-", qw(git update-ref --stdin) or die $!;
3047             }
3048             printf $gur "delete %s %s\n", $fullrefname, $objid;
3049         }
3050         if ($gur) {
3051             close $gur or failedcmd "git update-ref delete lrfetchrefs";
3052         }
3053     };
3054
3055     if (defined $dsc_hash) {
3056         ensure_we_have_orig();
3057         if (!$lastpush_hash || $dsc_hash eq $lastpush_hash) {
3058             @mergeinputs = $dsc_mergeinput
3059         } elsif (is_fast_fwd($dsc_hash,$lastpush_hash)) {
3060             print STDERR <<END or die $!;
3061
3062 Git commit in archive is behind the last version allegedly pushed/uploaded.
3063 Commit referred to by archive: $dsc_hash
3064 Last version pushed with dgit: $lastpush_hash
3065 $later_warning_msg
3066 END
3067             @mergeinputs = ($lastpush_mergeinput);
3068         } else {
3069             # Archive has .dsc which is not a descendant of the last dgit
3070             # push.  This can happen if the archive moves .dscs about.
3071             # Just follow its lead.
3072             if (is_fast_fwd($lastpush_hash,$dsc_hash)) {
3073                 progress "archive .dsc names newer git commit";
3074                 @mergeinputs = ($dsc_mergeinput);
3075             } else {
3076                 progress "archive .dsc names other git commit, fixing up";
3077                 @mergeinputs = ($dsc_mergeinput, $lastpush_mergeinput);
3078             }
3079         }
3080     } elsif ($dsc) {
3081         @mergeinputs = generate_commits_from_dsc();
3082         # We have just done an import.  Now, our import algorithm might
3083         # have been improved.  But even so we do not want to generate
3084         # a new different import of the same package.  So if the
3085         # version numbers are the same, just use our existing version.
3086         # If the version numbers are different, the archive has changed
3087         # (perhaps, rewound).
3088         if ($lastfetch_mergeinput &&
3089             !version_compare( (mergeinfo_version $lastfetch_mergeinput),
3090                               (mergeinfo_version $mergeinputs[0]) )) {
3091             @mergeinputs = ($lastfetch_mergeinput);
3092         }
3093     } elsif ($lastpush_hash) {
3094         # only in git, not in the archive yet
3095         @mergeinputs = ($lastpush_mergeinput);
3096         print STDERR <<END or die $!;
3097
3098 Package not found in the archive, but has allegedly been pushed using dgit.
3099 $later_warning_msg
3100 END
3101     } else {
3102         printdebug "nothing found!\n";
3103         if (defined $skew_warning_vsn) {
3104             print STDERR <<END or die $!;
3105
3106 Warning: relevant archive skew detected.
3107 Archive allegedly contains $skew_warning_vsn
3108 But we were not able to obtain any version from the archive or git.
3109
3110 END
3111         }
3112         unshift @end, $del_lrfetchrefs;
3113         return undef;
3114     }
3115
3116     if ($lastfetch_hash &&
3117         !grep {
3118             my $h = $_->{Commit};
3119             $h and is_fast_fwd($lastfetch_hash, $h);
3120             # If true, one of the existing parents of this commit
3121             # is a descendant of the $lastfetch_hash, so we'll
3122             # be ff from that automatically.
3123         } @mergeinputs
3124         ) {
3125         # Otherwise:
3126         push @mergeinputs, $lastfetch_mergeinput;
3127     }
3128
3129     printdebug "fetch mergeinfos:\n";
3130     foreach my $mi (@mergeinputs) {
3131         if ($mi->{Info}) {
3132             printdebug " commit $mi->{Commit} $mi->{Info}\n";
3133         } else {
3134             printdebug sprintf " ReverseParents=%d Message=%s",
3135                 $mi->{ReverseParents}, $mi->{Message};
3136         }
3137     }
3138
3139     my $compat_info= pop @mergeinputs
3140         if $mergeinputs[$#mergeinputs]{Message};
3141
3142     @mergeinputs = grep { defined $_->{Commit} } @mergeinputs;
3143
3144     my $hash;
3145     if (@mergeinputs > 1) {
3146         # here we go, then:
3147         my $tree_commit = $mergeinputs[0]{Commit};
3148
3149         my $tree = cmdoutput @git, qw(cat-file commit), $tree_commit;
3150         $tree =~ m/\n\n/;  $tree = $`;
3151         $tree =~ m/^tree (\w+)$/m or die "$dsc_hash tree ?";
3152         $tree = $1;
3153
3154         # We use the changelog author of the package in question the
3155         # author of this pseudo-merge.  This is (roughly) correct if
3156         # this commit is simply representing aa non-dgit upload.
3157         # (Roughly because it does not record sponsorship - but we
3158         # don't have sponsorship info because that's in the .changes,
3159         # which isn't in the archivw.)
3160         #
3161         # But, it might be that we are representing archive history
3162         # updates (including in-archive copies).  These are not really
3163         # the responsibility of the person who created the .dsc, but
3164         # there is no-one whose name we should better use.  (The
3165         # author of the .dsc-named commit is clearly worse.)
3166
3167         my $useclogp = mergeinfo_getclogp $mergeinputs[0];
3168         my $author = clogp_authline $useclogp;
3169         my $cversion = getfield $useclogp, 'Version';
3170
3171         my $mcf = dgit_privdir()."/mergecommit";
3172         open MC, ">", $mcf or die "$mcf $!";
3173         print MC <<END or die $!;
3174 tree $tree
3175 END
3176
3177         my @parents = grep { $_->{Commit} } @mergeinputs;
3178         @parents = reverse @parents if $compat_info->{ReverseParents};
3179         print MC <<END or die $! foreach @parents;
3180 parent $_->{Commit}
3181 END
3182
3183         print MC <<END or die $!;
3184 author $author
3185 committer $author
3186
3187 END
3188
3189         if (defined $compat_info->{Message}) {
3190             print MC $compat_info->{Message} or die $!;
3191         } else {
3192             print MC <<END or die $!;
3193 Record $package ($cversion) in archive suite $csuite
3194
3195 Record that
3196 END
3197             my $message_add_info = sub {
3198                 my ($mi) = (@_);
3199                 my $mversion = mergeinfo_version $mi;
3200                 printf MC "  %-20s %s\n", $mversion, $mi->{Info}
3201                     or die $!;
3202             };
3203
3204             $message_add_info->($mergeinputs[0]);
3205             print MC <<END or die $!;
3206 should be treated as descended from
3207 END
3208             $message_add_info->($_) foreach @mergeinputs[1..$#mergeinputs];
3209         }
3210
3211         close MC or die $!;
3212         $hash = make_commit $mcf;
3213     } else {
3214         $hash = $mergeinputs[0]{Commit};
3215     }
3216     printdebug "fetch hash=$hash\n";
3217
3218     my $chkff = sub {
3219         my ($lasth, $what) = @_;
3220         return unless $lasth;
3221         die "$lasth $hash $what ?" unless is_fast_fwd($lasth, $hash);
3222     };
3223
3224     $chkff->($lastpush_hash, 'dgit repo server tip (last push)')
3225         if $lastpush_hash;
3226     $chkff->($lastfetch_hash, 'local tracking tip (last fetch)');
3227
3228     fetch_from_archive_record_1($hash);
3229
3230     if (defined $skew_warning_vsn) {
3231         printdebug "SKEW CHECK WANT $skew_warning_vsn\n";
3232         my $gotclogp = commit_getclogp($hash);
3233         my $got_vsn = getfield $gotclogp, 'Version';
3234         printdebug "SKEW CHECK GOT $got_vsn\n";
3235         if (version_compare($got_vsn, $skew_warning_vsn) < 0) {
3236             print STDERR <<END or die $!;
3237
3238 Warning: archive skew detected.  Using the available version:
3239 Archive allegedly contains    $skew_warning_vsn
3240 We were able to obtain only   $got_vsn
3241
3242 END
3243         }
3244     }
3245
3246     if ($lastfetch_hash ne $hash) {
3247         fetch_from_archive_record_2($hash);
3248     }
3249
3250     lrfetchref_used lrfetchref();
3251
3252     check_gitattrs($hash, "fetched source tree");
3253
3254     unshift @end, $del_lrfetchrefs;
3255     return $hash;
3256 }
3257
3258 sub set_local_git_config ($$) {
3259     my ($k, $v) = @_;
3260     runcmd @git, qw(config), $k, $v;
3261 }
3262
3263 sub setup_mergechangelogs (;$) {
3264     my ($always) = @_;
3265     return unless $always || access_cfg_bool(1, 'setup-mergechangelogs');
3266
3267     my $driver = 'dpkg-mergechangelogs';
3268     my $cb = "merge.$driver";
3269     my $attrs = '.git/info/attributes';
3270     ensuredir '.git/info';
3271
3272     open NATTRS, ">", "$attrs.new" or die "$attrs.new $!";
3273     if (!open ATTRS, "<", $attrs) {
3274         $!==ENOENT or die "$attrs: $!";
3275     } else {
3276         while (<ATTRS>) {
3277             chomp;
3278             next if m{^debian/changelog\s};
3279             print NATTRS $_, "\n" or die $!;
3280         }
3281         ATTRS->error and die $!;
3282         close ATTRS;
3283     }
3284     print NATTRS "debian/changelog merge=$driver\n" or die $!;
3285     close NATTRS;
3286
3287     set_local_git_config "$cb.name", 'debian/changelog merge driver';
3288     set_local_git_config "$cb.driver", 'dpkg-mergechangelogs -m %O %A %B %A';
3289
3290     rename "$attrs.new", "$attrs" or die "$attrs: $!";
3291 }
3292
3293 sub setup_useremail (;$) {
3294     my ($always) = @_;
3295     return unless $always || access_cfg_bool(1, 'setup-useremail');
3296
3297     my $setup = sub {
3298         my ($k, $envvar) = @_;
3299         my $v = access_cfg("user-$k", 'RETURN-UNDEF') // $ENV{$envvar};
3300         return unless defined $v;
3301         set_local_git_config "user.$k", $v;
3302     };
3303
3304     $setup->('email', 'DEBEMAIL');
3305     $setup->('name', 'DEBFULLNAME');
3306 }
3307
3308 sub ensure_setup_existing_tree () {
3309     my $k = "remote.$remotename.skipdefaultupdate";
3310     my $c = git_get_config $k;
3311     return if defined $c;
3312     set_local_git_config $k, 'true';
3313 }
3314
3315 sub open_gitattrs () {
3316     my $gai = new IO::File ".git/info/attributes"
3317         or $!==ENOENT
3318         or die "open .git/info/attributes: $!";
3319     return $gai;
3320 }
3321
3322 sub is_gitattrs_setup () {
3323     my $gai = open_gitattrs();
3324     return 0 unless $gai;
3325     while (<$gai>) {
3326         return 1 if m{^\[attr\]dgit-defuse-attrs\s};
3327     }
3328     $gai->error and die $!;
3329     return 0;
3330 }    
3331
3332 sub setup_gitattrs (;$) {
3333     my ($always) = @_;
3334     return unless $always || access_cfg_bool(1, 'setup-gitattributes');
3335
3336     if (is_gitattrs_setup()) {
3337         progress <<END;
3338 [attr]dgit-defuse-attrs already found in .git/info/attributes
3339  not doing further gitattributes setup
3340 END
3341         return;
3342     }
3343     my $af = ".git/info/attributes";
3344     ensuredir '.git/info';
3345     open GAO, "> $af.new" or die $!;
3346     print GAO <<END or die $!;
3347 *       dgit-defuse-attrs
3348 [attr]dgit-defuse-attrs $negate_harmful_gitattrs
3349 # ^ see GITATTRIBUTES in dgit(7) and dgit setup-new-tree in dgit(1)
3350 END
3351     my $gai = open_gitattrs();
3352     if ($gai) {
3353         while (<$gai>) {
3354             chomp;
3355             print GAO $_, "\n" or die $!;
3356         }
3357         $gai->error and die $!;
3358     }
3359     close GAO or die $!;
3360     rename "$af.new", "$af" or die "install $af: $!";
3361 }
3362
3363 sub setup_new_tree () {
3364     setup_mergechangelogs();
3365     setup_useremail();
3366     setup_gitattrs();
3367 }
3368
3369 sub check_gitattrs ($$) {
3370     my ($treeish, $what) = @_;
3371
3372     return if is_gitattrs_setup;
3373
3374     local $/="\0";
3375     my @cmd = (@git, qw(ls-tree -lrz --), "${treeish}:");
3376     debugcmd "|",@cmd;
3377     my $gafl = new IO::File;
3378     open $gafl, "-|", @cmd or die $!;
3379     while (<$gafl>) {
3380         chomp or die;
3381         s/^\d+\s+\w+\s+\w+\s+(\d+)\t// or die;
3382         next if $1 == 0;
3383         next unless m{(?:^|/)\.gitattributes$};
3384
3385         # oh dear, found one
3386         print STDERR <<END;
3387 dgit: warning: $what contains .gitattributes
3388 dgit: .gitattributes have not been defused.  Recommended: dgit setup-new-tree.
3389 END
3390         close $gafl;
3391         return;
3392     }
3393     # tree contains no .gitattributes files
3394     $?=0; $!=0; close $gafl or failedcmd @cmd;
3395 }
3396
3397
3398 sub multisuite_suite_child ($$$) {
3399     my ($tsuite, $merginputs, $fn) = @_;
3400     # in child, sets things up, calls $fn->(), and returns undef
3401     # in parent, returns canonical suite name for $tsuite
3402     my $canonsuitefh = IO::File::new_tmpfile;
3403     my $pid = fork // die $!;
3404     if (!$pid) {
3405         forkcheck_setup();
3406         $isuite = $tsuite;
3407         $us .= " [$isuite]";
3408         $debugprefix .= " ";
3409         progress "fetching $tsuite...";
3410         canonicalise_suite();
3411         print $canonsuitefh $csuite, "\n" or die $!;
3412         close $canonsuitefh or die $!;
3413         $fn->();
3414         return undef;
3415     }
3416     waitpid $pid,0 == $pid or die $!;
3417     fail "failed to obtain $tsuite: ".waitstatusmsg() if $? && $?!=256*4;
3418     seek $canonsuitefh,0,0 or die $!;
3419     local $csuite = <$canonsuitefh>;
3420     die $! unless defined $csuite && chomp $csuite;
3421     if ($? == 256*4) {
3422         printdebug "multisuite $tsuite missing\n";
3423         return $csuite;
3424     }
3425     printdebug "multisuite $tsuite ok (canon=$csuite)\n";
3426     push @$merginputs, {
3427         Ref => lrref,
3428         Info => $csuite,
3429     };
3430     return $csuite;
3431 }
3432
3433 sub fork_for_multisuite ($) {
3434     my ($before_fetch_merge) = @_;
3435     # if nothing unusual, just returns ''
3436     #
3437     # if multisuite:
3438     # returns 0 to caller in child, to do first of the specified suites
3439     # in child, $csuite is not yet set
3440     #
3441     # returns 1 to caller in parent, to finish up anything needed after
3442     # in parent, $csuite is set to canonicalised portmanteau
3443
3444     my $org_isuite = $isuite;
3445     my @suites = split /\,/, $isuite;
3446     return '' unless @suites > 1;
3447     printdebug "fork_for_multisuite: @suites\n";
3448
3449     my @mergeinputs;
3450
3451     my $cbasesuite = multisuite_suite_child($suites[0], \@mergeinputs,
3452                                             sub { });
3453     return 0 unless defined $cbasesuite;
3454
3455     fail "package $package missing in (base suite) $cbasesuite"
3456         unless @mergeinputs;
3457
3458     my @csuites = ($cbasesuite);
3459
3460     $before_fetch_merge->();
3461
3462     foreach my $tsuite (@suites[1..$#suites]) {
3463         $tsuite =~ s/^-/$cbasesuite-/;
3464         my $csubsuite = multisuite_suite_child($tsuite, \@mergeinputs,
3465                                                sub {
3466             @end = ();
3467             fetch();
3468             exit 0;
3469         });
3470         # xxx collecte the ref here
3471
3472         $csubsuite =~ s/^\Q$cbasesuite\E-/-/;
3473         push @csuites, $csubsuite;
3474     }
3475
3476     foreach my $mi (@mergeinputs) {
3477         my $ref = git_get_ref $mi->{Ref};
3478         die "$mi->{Ref} ?" unless length $ref;
3479         $mi->{Commit} = $ref;
3480     }
3481
3482     $csuite = join ",", @csuites;
3483
3484     my $previous = git_get_ref lrref;
3485     if ($previous) {
3486         unshift @mergeinputs, {
3487             Commit => $previous,
3488             Info => "local combined tracking branch",
3489             Warning =>
3490  "archive seems to have rewound: local tracking branch is ahead!",
3491         };
3492     }
3493
3494     foreach my $ix (0..$#mergeinputs) {
3495         $mergeinputs[$ix]{Index} = $ix;
3496     }
3497
3498     @mergeinputs = sort {
3499         -version_compare(mergeinfo_version $a,
3500                          mergeinfo_version $b) # highest version first
3501             or
3502         $a->{Index} <=> $b->{Index}; # earliest in spec first
3503     } @mergeinputs;
3504
3505     my @needed;
3506
3507   NEEDED:
3508     foreach my $mi (@mergeinputs) {
3509         printdebug "multisuite merge check $mi->{Info}\n";
3510         foreach my $previous (@needed) {
3511             next unless is_fast_fwd $mi->{Commit}, $previous->{Commit};
3512             printdebug "multisuite merge un-needed $previous->{Info}\n";
3513             next NEEDED;
3514         }
3515         push @needed, $mi;
3516         printdebug "multisuite merge this-needed\n";
3517         $mi->{Character} = '+';
3518     }
3519
3520     $needed[0]{Character} = '*';
3521
3522     my $output = $needed[0]{Commit};
3523
3524     if (@needed > 1) {
3525         printdebug "multisuite merge nontrivial\n";
3526         my $tree = cmdoutput qw(git rev-parse), $needed[0]{Commit}.':';
3527
3528         my $commit = "tree $tree\n";
3529         my $msg = "Combine archive branches $csuite [dgit]\n\n".
3530             "Input branches:\n";
3531
3532         foreach my $mi (sort { $a->{Index} <=> $b->{Index} } @mergeinputs) {
3533             printdebug "multisuite merge include $mi->{Info}\n";
3534             $mi->{Character} //= ' ';
3535             $commit .= "parent $mi->{Commit}\n";
3536             $msg .= sprintf " %s  %-25s %s\n",
3537                 $mi->{Character},
3538                 (mergeinfo_version $mi),
3539                 $mi->{Info};
3540         }
3541         my $authline = clogp_authline mergeinfo_getclogp $needed[0];
3542         $msg .= "\nKey\n".
3543             " * marks the highest version branch, which choose to use\n".
3544             " + marks each branch which was not already an ancestor\n\n".
3545             "[dgit multi-suite $csuite]\n";
3546         $commit .=
3547             "author $authline\n".
3548             "committer $authline\n\n";
3549         $output = make_commit_text $commit.$msg;
3550         printdebug "multisuite merge generated $output\n";
3551     }
3552
3553     fetch_from_archive_record_1($output);
3554     fetch_from_archive_record_2($output);
3555
3556     progress "calculated combined tracking suite $csuite";
3557
3558     return 1;
3559 }
3560
3561 sub clone_set_head () {
3562     open H, "> .git/HEAD" or die $!;
3563     print H "ref: ".lref()."\n" or die $!;
3564     close H or die $!;
3565 }
3566 sub clone_finish ($) {
3567     my ($dstdir) = @_;
3568     runcmd @git, qw(reset --hard), lrref();
3569     runcmd qw(bash -ec), <<'END';
3570         set -o pipefail
3571         git ls-tree -r --name-only -z HEAD | \
3572         xargs -0r touch -h -r . --
3573 END
3574     printdone "ready for work in $dstdir";
3575 }
3576
3577 sub clone ($) {
3578     # in multisuite, returns twice!
3579     # once in parent after first suite fetched,
3580     # and then again in child after everything is finished
3581     my ($dstdir) = @_;
3582     badusage "dry run makes no sense with clone" unless act_local();
3583
3584     my $multi_fetched = fork_for_multisuite(sub {
3585         printdebug "multi clone before fetch merge\n";
3586         changedir $dstdir;
3587         record_maindir();
3588     });
3589     if ($multi_fetched) {
3590         printdebug "multi clone after fetch merge\n";
3591         clone_set_head();
3592         clone_finish($dstdir);
3593         return;
3594     }
3595     printdebug "clone main body\n";
3596
3597     canonicalise_suite();
3598     my $hasgit = check_for_git();
3599     mkdir $dstdir or fail "create \`$dstdir': $!";
3600     changedir $dstdir;
3601     runcmd @git, qw(init -q);
3602     record_maindir();
3603     setup_new_tree();
3604     clone_set_head();
3605     my $giturl = access_giturl(1);
3606     if (defined $giturl) {
3607         runcmd @git, qw(remote add), 'origin', $giturl;
3608     }
3609     if ($hasgit) {
3610         progress "fetching existing git history";
3611         git_fetch_us();
3612         runcmd_ordryrun_local @git, qw(fetch origin);
3613     } else {
3614         progress "starting new git history";
3615     }
3616     fetch_from_archive() or no_such_package;
3617     my $vcsgiturl = $dsc->{'Vcs-Git'};
3618     if (length $vcsgiturl) {
3619         $vcsgiturl =~ s/\s+-b\s+\S+//g;
3620         runcmd @git, qw(remote add vcs-git), $vcsgiturl;
3621     }
3622     clone_finish($dstdir);
3623 }
3624
3625 sub fetch () {
3626     canonicalise_suite();
3627     if (check_for_git()) {
3628         git_fetch_us();
3629     }
3630     fetch_from_archive() or no_such_package();
3631     printdone "fetched into ".lrref();
3632 }
3633
3634 sub pull () {
3635     my $multi_fetched = fork_for_multisuite(sub { });
3636     fetch() unless $multi_fetched; # parent
3637     return if $multi_fetched eq '0'; # child
3638     runcmd_ordryrun_local @git, qw(merge -m),"Merge from $csuite [dgit]",
3639         lrref();
3640     printdone "fetched to ".lrref()." and merged into HEAD";
3641 }
3642
3643 sub check_not_dirty () {
3644     foreach my $f (qw(local-options local-patch-header)) {
3645         if (stat_exists "debian/source/$f") {
3646             fail "git tree contains debian/source/$f";
3647         }
3648     }
3649
3650     return if $ignoredirty;
3651
3652     my @cmd = (@git, qw(diff --quiet HEAD));
3653     debugcmd "+",@cmd;
3654     $!=0; $?=-1; system @cmd;
3655     return if !$?;
3656     if ($?==256) {
3657         fail "working tree is dirty (does not match HEAD)";
3658     } else {
3659         failedcmd @cmd;
3660     }
3661 }
3662
3663 sub commit_admin ($) {
3664     my ($m) = @_;
3665     progress "$m";
3666     runcmd_ordryrun_local @git, qw(commit -m), $m;
3667 }
3668
3669 sub commit_quilty_patch () {
3670     my $output = cmdoutput @git, qw(status --porcelain);
3671     my %adds;
3672     foreach my $l (split /\n/, $output) {
3673         next unless $l =~ m/\S/;
3674         if ($l =~ m{^(?:\?\?| M) (.pc|debian/patches)}) {
3675             $adds{$1}++;
3676         }
3677     }
3678     delete $adds{'.pc'}; # if there wasn't one before, don't add it
3679     if (!%adds) {
3680         progress "nothing quilty to commit, ok.";
3681         return;
3682     }
3683     my @adds = map { s/[][*?\\]/\\$&/g; $_; } sort keys %adds;
3684     runcmd_ordryrun_local @git, qw(add -f), @adds;
3685     commit_admin <<END
3686 Commit Debian 3.0 (quilt) metadata
3687
3688 [dgit ($our_version) quilt-fixup]
3689 END
3690 }
3691
3692 sub get_source_format () {
3693     my %options;
3694     if (open F, "debian/source/options") {
3695         while (<F>) {
3696             next if m/^\s*\#/;
3697             next unless m/\S/;
3698             s/\s+$//; # ignore missing final newline
3699             if (m/\s*\#\s*/) {
3700                 my ($k, $v) = ($`, $'); #');
3701                 $v =~ s/^"(.*)"$/$1/;
3702                 $options{$k} = $v;
3703             } else {
3704                 $options{$_} = 1;
3705             }
3706         }
3707         F->error and die $!;
3708         close F;
3709     } else {
3710         die $! unless $!==&ENOENT;
3711     }
3712
3713     if (!open F, "debian/source/format") {
3714         die $! unless $!==&ENOENT;
3715         return '';
3716     }
3717     $_ = <F>;
3718     F->error and die $!;
3719     chomp;
3720     return ($_, \%options);
3721 }
3722
3723 sub madformat_wantfixup ($) {
3724     my ($format) = @_;
3725     return 0 unless $format eq '3.0 (quilt)';
3726     our $quilt_mode_warned;
3727     if ($quilt_mode eq 'nocheck') {
3728         progress "Not doing any fixup of \`$format' due to".
3729             " ----no-quilt-fixup or --quilt=nocheck"
3730             unless $quilt_mode_warned++;
3731         return 0;
3732     }
3733     progress "Format \`$format', need to check/update patch stack"
3734         unless $quilt_mode_warned++;
3735     return 1;
3736 }
3737
3738 sub maybe_split_brain_save ($$$) {
3739     my ($headref, $dgitview, $msg) = @_;
3740     # => message fragment "$saved" describing disposition of $dgitview
3741     return "commit id $dgitview" unless defined $split_brain_save;
3742     my @cmd = (shell_cmd 'cd "$1"; shift', $maindir,
3743                @git, qw(update-ref -m),
3744                "dgit --dgit-view-save $msg HEAD=$headref",
3745                $split_brain_save, $dgitview);
3746     runcmd @cmd;
3747     return "and left in $split_brain_save";
3748 }
3749
3750 # An "infopair" is a tuple [ $thing, $what ]
3751 # (often $thing is a commit hash; $what is a description)
3752
3753 sub infopair_cond_equal ($$) {
3754     my ($x,$y) = @_;
3755     $x->[0] eq $y->[0] or fail <<END;
3756 $x->[1] ($x->[0]) not equal to $y->[1] ($y->[0])
3757 END
3758 };
3759
3760 sub infopair_lrf_tag_lookup ($$) {
3761     my ($tagnames, $what) = @_;
3762     # $tagname may be an array ref
3763     my @tagnames = ref $tagnames ? @$tagnames : ($tagnames);
3764     printdebug "infopair_lrfetchref_tag_lookup $what @tagnames\n";
3765     foreach my $tagname (@tagnames) {
3766         my $lrefname = lrfetchrefs."/tags/$tagname";
3767         my $tagobj = $lrfetchrefs_f{$lrefname};
3768         next unless defined $tagobj;
3769         printdebug "infopair_lrfetchref_tag_lookup $tagobj $tagname $what\n";
3770         return [ git_rev_parse($tagobj), $what ];
3771     }
3772     fail @tagnames==1 ? <<END : <<END;
3773 Wanted tag $what (@tagnames) on dgit server, but not found
3774 END
3775 Wanted tag $what (one of: @tagnames) on dgit server, but not found
3776 END
3777 }
3778
3779 sub infopair_cond_ff ($$) {
3780     my ($anc,$desc) = @_;
3781     is_fast_fwd($anc->[0], $desc->[0]) or fail <<END;
3782 $anc->[1] ($anc->[0]) .. $desc->[1] ($desc->[0]) is not fast forward
3783 END
3784 };
3785
3786 sub pseudomerge_version_check ($$) {
3787     my ($clogp, $archive_hash) = @_;
3788
3789     my $arch_clogp = commit_getclogp $archive_hash;
3790     my $i_arch_v = [ (getfield $arch_clogp, 'Version'),
3791                      'version currently in archive' ];
3792     if (defined $overwrite_version) {
3793         if (length $overwrite_version) {
3794             infopair_cond_equal([ $overwrite_version,
3795                                   '--overwrite= version' ],
3796                                 $i_arch_v);
3797         } else {
3798             my $v = $i_arch_v->[0];
3799             progress "Checking package changelog for archive version $v ...";
3800             my $cd;
3801             eval {
3802                 my @xa = ("-f$v", "-t$v");
3803                 my $vclogp = parsechangelog @xa;
3804                 my $gf = sub {
3805                     my ($fn) = @_;
3806                     [ (getfield $vclogp, $fn),
3807                       "$fn field from dpkg-parsechangelog @xa" ];
3808                 };
3809                 my $cv = $gf->('Version');
3810                 infopair_cond_equal($i_arch_v, $cv);
3811                 $cd = $gf->('Distribution');
3812             };
3813             if ($@) {
3814                 $@ =~ s/^dgit: //gm;
3815                 fail "$@".
3816                     "Perhaps debian/changelog does not mention $v ?";
3817             }
3818             fail <<END if $cd->[0] =~ m/UNRELEASED/;
3819 $cd->[1] is $cd->[0]
3820 Your tree seems to based on earlier (not uploaded) $v.
3821 END
3822         }
3823     }
3824     
3825     printdebug "pseudomerge_version_check i_arch_v @$i_arch_v\n";
3826     return $i_arch_v;
3827 }
3828
3829 sub pseudomerge_make_commit ($$$$ $$) {
3830     my ($clogp, $dgitview, $archive_hash, $i_arch_v,
3831         $msg_cmd, $msg_msg) = @_;
3832     progress "Declaring that HEAD inciudes all changes in $i_arch_v->[0]...";
3833
3834     my $tree = cmdoutput qw(git rev-parse), "${dgitview}:";
3835     my $authline = clogp_authline $clogp;
3836
3837     chomp $msg_msg;
3838     $msg_cmd .=
3839         !defined $overwrite_version ? ""
3840         : !length  $overwrite_version ? " --overwrite"
3841         : " --overwrite=".$overwrite_version;
3842
3843     my $pmf = dgit_privdir()."/pseudomerge";
3844     open MC, ">", $pmf or die "$pmf $!";
3845     print MC <<END or die $!;
3846 tree $tree
3847 parent $dgitview
3848 parent $archive_hash
3849 author $authline
3850 committer $authline
3851
3852 $msg_msg
3853
3854 [$msg_cmd]
3855 END
3856     close MC or die $!;
3857
3858     return make_commit($pmf);
3859 }
3860
3861 sub splitbrain_pseudomerge ($$$$) {
3862     my ($clogp, $maintview, $dgitview, $archive_hash) = @_;
3863     # => $merged_dgitview
3864     printdebug "splitbrain_pseudomerge...\n";
3865     #
3866     #     We:      debian/PREVIOUS    HEAD($maintview)
3867     # expect:          o ----------------- o
3868     #                    \                   \
3869     #                     o                   o
3870     #                 a/d/PREVIOUS        $dgitview
3871     #                $archive_hash              \
3872     #  If so,                \                   \
3873     #  we do:                 `------------------ o
3874     #   this:                                   $dgitview'
3875     #
3876
3877     return $dgitview unless defined $archive_hash;
3878     return $dgitview if deliberately_not_fast_forward();
3879
3880     printdebug "splitbrain_pseudomerge...\n";
3881
3882     my $i_arch_v = pseudomerge_version_check($clogp, $archive_hash);
3883
3884     if (!defined $overwrite_version) {
3885         progress "Checking that HEAD inciudes all changes in archive...";
3886     }
3887
3888     return $dgitview if is_fast_fwd $archive_hash, $dgitview;
3889
3890     if (defined $overwrite_version) {
3891     } elsif (!eval {
3892         my $t_dep14 = debiantag_maintview $i_arch_v->[0], access_nomdistro;
3893         my $i_dep14 = infopair_lrf_tag_lookup($t_dep14, "maintainer view tag");
3894         my $t_dgit = debiantag_new $i_arch_v->[0], access_nomdistro;
3895         my $i_dgit = infopair_lrf_tag_lookup($t_dgit, "dgit view tag");
3896         my $i_archive = [ $archive_hash, "current archive contents" ];
3897
3898         printdebug "splitbrain_pseudomerge i_archive @$i_archive\n";
3899
3900         infopair_cond_equal($i_dgit, $i_archive);
3901         infopair_cond_ff($i_dep14, $i_dgit);
3902         infopair_cond_ff($i_dep14, [ $maintview, 'HEAD' ]);
3903         1;
3904     }) {
3905         print STDERR <<END;
3906 $us: check failed (maybe --overwrite is needed, consult documentation)
3907 END
3908         die "$@";
3909     }
3910
3911     my $r = pseudomerge_make_commit
3912         $clogp, $dgitview, $archive_hash, $i_arch_v,
3913         "dgit --quilt=$quilt_mode",
3914         (defined $overwrite_version ? <<END_OVERWR : <<END_MAKEFF);
3915 Declare fast forward from $i_arch_v->[0]
3916 END_OVERWR
3917 Make fast forward from $i_arch_v->[0]
3918 END_MAKEFF
3919
3920     maybe_split_brain_save $maintview, $r, "pseudomerge";
3921
3922     progress "Made pseudo-merge of $i_arch_v->[0] into dgit view.";
3923     return $r;
3924 }       
3925
3926 sub plain_overwrite_pseudomerge ($$$) {
3927     my ($clogp, $head, $archive_hash) = @_;
3928
3929     printdebug "plain_overwrite_pseudomerge...";
3930
3931     my $i_arch_v = pseudomerge_version_check($clogp, $archive_hash);
3932
3933     return $head if is_fast_fwd $archive_hash, $head;
3934
3935     my $m = "Declare fast forward from $i_arch_v->[0]";
3936
3937     my $r = pseudomerge_make_commit
3938         $clogp, $head, $archive_hash, $i_arch_v,
3939         "dgit", $m;
3940
3941     runcmd @git, qw(update-ref -m), $m, 'HEAD', $r, $head;
3942
3943     progress "Make pseudo-merge of $i_arch_v->[0] into your HEAD.";
3944     return $r;
3945 }
3946
3947 sub push_parse_changelog ($) {
3948     my ($clogpfn) = @_;
3949
3950     my $clogp = Dpkg::Control::Hash->new();
3951     $clogp->load($clogpfn) or die;
3952
3953     my $clogpackage = getfield $clogp, 'Source';
3954     $package //= $clogpackage;
3955     fail "-p specified $package but changelog specified $clogpackage"
3956         unless $package eq $clogpackage;
3957     my $cversion = getfield $clogp, 'Version';
3958
3959     if (!$we_are_initiator) {
3960         # rpush initiator can't do this because it doesn't have $isuite yet
3961         my $tag = debiantag($cversion, access_nomdistro);
3962         runcmd @git, qw(check-ref-format), $tag;
3963     }
3964
3965     my $dscfn = dscfn($cversion);
3966
3967     return ($clogp, $cversion, $dscfn);
3968 }
3969
3970 sub push_parse_dsc ($$$) {
3971     my ($dscfn,$dscfnwhat, $cversion) = @_;
3972     $dsc = parsecontrol($dscfn,$dscfnwhat);
3973     my $dversion = getfield $dsc, 'Version';
3974     my $dscpackage = getfield $dsc, 'Source';
3975     ($dscpackage eq $package && $dversion eq $cversion) or
3976         fail "$dscfn is for $dscpackage $dversion".
3977             " but debian/changelog is for $package $cversion";
3978 }
3979
3980 sub push_tagwants ($$$$) {
3981     my ($cversion, $dgithead, $maintviewhead, $tfbase) = @_;
3982     my @tagwants;
3983     push @tagwants, {
3984         TagFn => \&debiantag,
3985         Objid => $dgithead,
3986         TfSuffix => '',
3987         View => 'dgit',
3988     };
3989     if (defined $maintviewhead) {
3990         push @tagwants, {
3991             TagFn => \&debiantag_maintview,
3992             Objid => $maintviewhead,
3993             TfSuffix => '-maintview',
3994             View => 'maint',
3995         };
3996     } elsif ($dodep14tag eq 'no' ? 0
3997              : $dodep14tag eq 'want' ? access_cfg_tagformats_can_splitbrain
3998              : $dodep14tag eq 'always'
3999              ? (access_cfg_tagformats_can_splitbrain or fail <<END)
4000 --dep14tag-always (or equivalent in config) means server must support
4001  both "new" and "maint" tag formats, but config says it doesn't.
4002 END
4003             : die "$dodep14tag ?") {
4004         push @tagwants, {
4005             TagFn => \&debiantag_maintview,
4006             Objid => $dgithead,
4007             TfSuffix => '-dgit',
4008             View => 'dgit',
4009         };
4010     };
4011     foreach my $tw (@tagwants) {
4012         $tw->{Tag} = $tw->{TagFn}($cversion, access_nomdistro);
4013         $tw->{Tfn} = sub { $tfbase.$tw->{TfSuffix}.$_[0]; };
4014     }
4015     printdebug 'push_tagwants: ', Dumper(\@_, \@tagwants);
4016     return @tagwants;
4017 }
4018
4019 sub push_mktags ($$ $$ $) {
4020     my ($clogp,$dscfn,
4021         $changesfile,$changesfilewhat,
4022         $tagwants) = @_;
4023
4024     die unless $tagwants->[0]{View} eq 'dgit';
4025
4026     my $declaredistro = access_nomdistro();
4027     my $reader_giturl = do { local $access_forpush=0; access_giturl(); };
4028     $dsc->{$ourdscfield[0]} = join " ",
4029         $tagwants->[0]{Objid}, $declaredistro, $tagwants->[0]{Tag},
4030         $reader_giturl;
4031     $dsc->save("$dscfn.tmp") or die $!;
4032
4033     my $changes = parsecontrol($changesfile,$changesfilewhat);
4034     foreach my $field (qw(Source Distribution Version)) {
4035         $changes->{$field} eq $clogp->{$field} or
4036             fail "changes field $field \`$changes->{$field}'".
4037                 " does not match changelog \`$clogp->{$field}'";
4038     }
4039
4040     my $cversion = getfield $clogp, 'Version';
4041     my $clogsuite = getfield $clogp, 'Distribution';
4042
4043     # We make the git tag by hand because (a) that makes it easier
4044     # to control the "tagger" (b) we can do remote signing
4045     my $authline = clogp_authline $clogp;
4046     my $delibs = join(" ", "",@deliberatelies);
4047
4048     my $mktag = sub {
4049         my ($tw) = @_;
4050         my $tfn = $tw->{Tfn};
4051         my $head = $tw->{Objid};
4052         my $tag = $tw->{Tag};
4053
4054         open TO, '>', $tfn->('.tmp') or die $!;
4055         print TO <<END or die $!;
4056 object $head
4057 type commit
4058 tag $tag
4059 tagger $authline
4060
4061 END
4062         if ($tw->{View} eq 'dgit') {
4063             print TO <<END or die $!;
4064 $package release $cversion for $clogsuite ($csuite) [dgit]
4065 [dgit distro=$declaredistro$delibs]
4066 END
4067             foreach my $ref (sort keys %previously) {
4068                 print TO <<END or die $!;
4069 [dgit previously:$ref=$previously{$ref}]
4070 END
4071             }
4072         } elsif ($tw->{View} eq 'maint') {
4073             print TO <<END or die $!;
4074 $package release $cversion for $clogsuite ($csuite)
4075 (maintainer view tag generated by dgit --quilt=$quilt_mode)
4076 END
4077         } else {
4078             die Dumper($tw)."?";
4079         }
4080
4081         close TO or die $!;
4082
4083         my $tagobjfn = $tfn->('.tmp');
4084         if ($sign) {
4085             if (!defined $keyid) {
4086                 $keyid = access_cfg('keyid','RETURN-UNDEF');
4087             }
4088             if (!defined $keyid) {
4089                 $keyid = getfield $clogp, 'Maintainer';
4090             }
4091             unlink $tfn->('.tmp.asc') or $!==&ENOENT or die $!;
4092             my @sign_cmd = (@gpg, qw(--detach-sign --armor));
4093             push @sign_cmd, qw(-u),$keyid if defined $keyid;
4094             push @sign_cmd, $tfn->('.tmp');
4095             runcmd_ordryrun @sign_cmd;
4096             if (act_scary()) {
4097                 $tagobjfn = $tfn->('.signed.tmp');
4098                 runcmd shell_cmd "exec >$tagobjfn", qw(cat --),
4099                     $tfn->('.tmp'), $tfn->('.tmp.asc');
4100             }
4101         }
4102         return $tagobjfn;
4103     };
4104
4105     my @r = map { $mktag->($_); } @$tagwants;
4106     return @r;
4107 }
4108
4109 sub sign_changes ($) {
4110     my ($changesfile) = @_;
4111     if ($sign) {
4112         my @debsign_cmd = @debsign;
4113         push @debsign_cmd, "-k$keyid" if defined $keyid;
4114         push @debsign_cmd, "-p$gpg[0]" if $gpg[0] ne 'gpg';
4115         push @debsign_cmd, $changesfile;
4116         runcmd_ordryrun @debsign_cmd;
4117     }
4118 }
4119
4120 sub dopush () {
4121     printdebug "actually entering push\n";
4122
4123     supplementary_message(<<'END');
4124 Push failed, while checking state of the archive.
4125 You can retry the push, after fixing the problem, if you like.
4126 END
4127     if (check_for_git()) {
4128         git_fetch_us();
4129     }
4130     my $archive_hash = fetch_from_archive();
4131     if (!$archive_hash) {
4132         $new_package or
4133             fail "package appears to be new in this suite;".
4134                 " if this is intentional, use --new";
4135     }
4136
4137     supplementary_message(<<'END');
4138 Push failed, while preparing your push.
4139 You can retry the push, after fixing the problem, if you like.
4140 END
4141
4142     need_tagformat 'new', "quilt mode $quilt_mode"
4143         if quiltmode_splitbrain;
4144
4145     prep_ud();
4146
4147     access_giturl(); # check that success is vaguely likely
4148     rpush_handle_protovsn_bothends() if $we_are_initiator;
4149     select_tagformat();
4150
4151     my $clogpfn = dgit_privdir()."/changelog.822.tmp";
4152     runcmd shell_cmd "exec >$clogpfn", qw(dpkg-parsechangelog);
4153
4154     responder_send_file('parsed-changelog', $clogpfn);
4155
4156     my ($clogp, $cversion, $dscfn) =
4157         push_parse_changelog("$clogpfn");
4158
4159     my $dscpath = "$buildproductsdir/$dscfn";
4160     stat_exists $dscpath or
4161         fail "looked for .dsc $dscpath, but $!;".
4162             " maybe you forgot to build";
4163
4164     responder_send_file('dsc', $dscpath);
4165
4166     push_parse_dsc($dscpath, $dscfn, $cversion);
4167
4168     my $format = getfield $dsc, 'Format';
4169     printdebug "format $format\n";
4170
4171     my $actualhead = git_rev_parse('HEAD');
4172     my $dgithead = $actualhead;
4173     my $maintviewhead = undef;
4174
4175     my $upstreamversion = upstreamversion $clogp->{Version};
4176
4177     if (madformat_wantfixup($format)) {
4178         # user might have not used dgit build, so maybe do this now:
4179         if (quiltmode_splitbrain()) {
4180             changedir $playground;
4181             quilt_make_fake_dsc($upstreamversion);
4182             my $cachekey;
4183             ($dgithead, $cachekey) =
4184                 quilt_check_splitbrain_cache($actualhead, $upstreamversion);
4185             $dgithead or fail
4186  "--quilt=$quilt_mode but no cached dgit view:
4187  perhaps tree changed since dgit build[-source] ?";
4188             $split_brain = 1;
4189             $dgithead = splitbrain_pseudomerge($clogp,
4190                                                $actualhead, $dgithead,
4191                                                $archive_hash);
4192             $maintviewhead = $actualhead;
4193             changedir $maindir;
4194             prep_ud(); # so _only_subdir() works, below
4195         } else {
4196             commit_quilty_patch();
4197         }
4198     }
4199
4200     if (defined $overwrite_version && !defined $maintviewhead) {
4201         $dgithead = plain_overwrite_pseudomerge($clogp,
4202                                                 $dgithead,
4203                                                 $archive_hash);
4204     }
4205
4206     check_not_dirty();
4207
4208     my $forceflag = '';
4209     if ($archive_hash) {
4210         if (is_fast_fwd($archive_hash, $dgithead)) {
4211             # ok
4212         } elsif (deliberately_not_fast_forward) {
4213             $forceflag = '+';
4214         } else {
4215             fail "dgit push: HEAD is not a descendant".
4216                 " of the archive's version.\n".
4217                 "To overwrite the archive's contents,".
4218                 " pass --overwrite[=VERSION].\n".
4219                 "To rewind history, if permitted by the archive,".
4220                 " use --deliberately-not-fast-forward.";
4221         }
4222     }
4223
4224     changedir $playground;
4225     progress "checking that $dscfn corresponds to HEAD";
4226     runcmd qw(dpkg-source -x --),
4227         $dscpath =~ m#^/# ? $dscpath : "$maindir/$dscpath";
4228     my ($tree,$dir) = mktree_in_ud_from_only_subdir("source package");
4229     check_for_vendor_patches() if madformat($dsc->{format});
4230     changedir $maindir;
4231     my @diffcmd = (@git, qw(diff --quiet), $tree, $dgithead);
4232     debugcmd "+",@diffcmd;
4233     $!=0; $?=-1;
4234     my $r = system @diffcmd;
4235     if ($r) {
4236         if ($r==256) {
4237             my $diffs = cmdoutput @git, qw(diff --stat), $tree, $dgithead;
4238             fail <<END
4239 HEAD specifies a different tree to $dscfn:
4240 $diffs
4241 Perhaps you forgot to build.  Or perhaps there is a problem with your
4242  source tree (see dgit(7) for some hints).  To see a full diff, run
4243    git diff $tree HEAD
4244 END
4245         } else {
4246             failedcmd @diffcmd;
4247         }
4248     }
4249     if (!$changesfile) {
4250         my $pat = changespat $cversion;
4251         my @cs = glob "$buildproductsdir/$pat";
4252         fail "failed to find unique changes file".
4253             " (looked for $pat in $buildproductsdir);".
4254             " perhaps you need to use dgit -C"
4255             unless @cs==1;
4256         ($changesfile) = @cs;
4257     } else {
4258         $changesfile = "$buildproductsdir/$changesfile";
4259     }
4260
4261     # Check that changes and .dsc agree enough
4262     $changesfile =~ m{[^/]*$};
4263     my $changes = parsecontrol($changesfile,$&);
4264     files_compare_inputs($dsc, $changes)
4265         unless forceing [qw(dsc-changes-mismatch)];
4266
4267     # Perhaps adjust .dsc to contain right set of origs
4268     changes_update_origs_from_dsc($dsc, $changes, $upstreamversion,
4269                                   $changesfile)
4270         unless forceing [qw(changes-origs-exactly)];
4271
4272     # Checks complete, we're going to try and go ahead:
4273
4274     responder_send_file('changes',$changesfile);
4275     responder_send_command("param head $dgithead");
4276     responder_send_command("param csuite $csuite");
4277     responder_send_command("param isuite $isuite");
4278     responder_send_command("param tagformat $tagformat");
4279     if (defined $maintviewhead) {
4280         die unless ($protovsn//4) >= 4;
4281         responder_send_command("param maint-view $maintviewhead");
4282     }
4283
4284     # Perhaps send buildinfo(s) for signing
4285     my $changes_files = getfield $changes, 'Files';
4286     my @buildinfos = ($changes_files =~ m/ .* (\S+\.buildinfo)$/mg);
4287     foreach my $bi (@buildinfos) {
4288         responder_send_command("param buildinfo-filename $bi");
4289         responder_send_file('buildinfo', "$buildproductsdir/$bi");
4290     }
4291
4292     if (deliberately_not_fast_forward) {
4293         git_for_each_ref(lrfetchrefs, sub {
4294             my ($objid,$objtype,$lrfetchrefname,$reftail) = @_;
4295             my $rrefname= substr($lrfetchrefname, length(lrfetchrefs) + 1);
4296             responder_send_command("previously $rrefname=$objid");
4297             $previously{$rrefname} = $objid;
4298         });
4299     }
4300
4301     my @tagwants = push_tagwants($cversion, $dgithead, $maintviewhead,
4302                                  dgit_privdir()."/tag");
4303     my @tagobjfns;
4304
4305     supplementary_message(<<'END');
4306 Push failed, while signing the tag.
4307 You can retry the push, after fixing the problem, if you like.
4308 END
4309     # If we manage to sign but fail to record it anywhere, it's fine.
4310     if ($we_are_responder) {
4311         @tagobjfns = map { $_->{Tfn}('.signed-tmp') } @tagwants;
4312         responder_receive_files('signed-tag', @tagobjfns);
4313     } else {
4314         @tagobjfns = push_mktags($clogp,$dscpath,
4315                               $changesfile,$changesfile,
4316                               \@tagwants);
4317     }
4318     supplementary_message(<<'END');
4319 Push failed, *after* signing the tag.
4320 If you want to try again, you should use a new version number.
4321 END
4322
4323     pairwise { $a->{TagObjFn} = $b } @tagwants, @tagobjfns;
4324
4325     foreach my $tw (@tagwants) {
4326         my $tag = $tw->{Tag};
4327         my $tagobjfn = $tw->{TagObjFn};
4328         my $tag_obj_hash =
4329             cmdoutput @git, qw(hash-object -w -t tag), $tagobjfn;
4330         runcmd_ordryrun @git, qw(verify-tag), $tag_obj_hash;
4331         runcmd_ordryrun_local
4332             @git, qw(update-ref), "refs/tags/$tag", $tag_obj_hash;
4333     }
4334
4335     supplementary_message(<<'END');
4336 Push failed, while updating the remote git repository - see messages above.
4337 If you want to try again, you should use a new version number.
4338 END
4339     if (!check_for_git()) {
4340         create_remote_git_repo();
4341     }
4342
4343     my @pushrefs = $forceflag.$dgithead.":".rrref();
4344     foreach my $tw (@tagwants) {
4345         push @pushrefs, $forceflag."refs/tags/$tw->{Tag}";
4346     }
4347
4348     runcmd_ordryrun @git,
4349         qw(-c push.followTags=false push), access_giturl(), @pushrefs;
4350     runcmd_ordryrun @git, qw(update-ref -m), 'dgit push', lrref(), $dgithead;
4351
4352     supplementary_message(<<'END');
4353 Push failed, while obtaining signatures on the .changes and .dsc.
4354 If it was just that the signature failed, you may try again by using
4355 debsign by hand to sign the changes
4356    $changesfile
4357 and then dput to complete the upload.
4358 If you need to change the package, you must use a new version number.
4359 END
4360     if ($we_are_responder) {
4361         my $dryrunsuffix = act_local() ? "" : ".tmp";
4362         my @rfiles = ($dscpath, $changesfile);
4363         push @rfiles, map { "$buildproductsdir/$_" } @buildinfos;
4364         responder_receive_files('signed-dsc-changes',
4365                                 map { "$_$dryrunsuffix" } @rfiles);
4366     } else {
4367         if (act_local()) {
4368             rename "$dscpath.tmp",$dscpath or die "$dscfn $!";
4369         } else {
4370             progress "[new .dsc left in $dscpath.tmp]";
4371         }
4372         sign_changes $changesfile;
4373     }
4374
4375     supplementary_message(<<END);
4376 Push failed, while uploading package(s) to the archive server.
4377 You can retry the upload of exactly these same files with dput of:
4378   $changesfile
4379 If that .changes file is broken, you will need to use a new version
4380 number for your next attempt at the upload.
4381 END