chiark / gitweb /
directory handling: dgit: Use $maindir rather than ../../..
[dgit.git] / dgit
1 #!/usr/bin/perl -w
2 # dgit
3 # Integration between git and Debian-style archives
4 #
5 # Copyright (C)2013-2016 Ian Jackson
6 #
7 # This program is free software: you can redistribute it and/or modify
8 # it under the terms of the GNU General Public License as published by
9 # the Free Software Foundation, either version 3 of the License, or
10 # (at your option) any later version.
11 #
12 # This program is distributed in the hope that it will be useful,
13 # but WITHOUT ANY WARRANTY; without even the implied warranty of
14 # MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
15 # GNU General Public License for more details.
16 #
17 # You should have received a copy of the GNU General Public License
18 # along with this program.  If not, see <http://www.gnu.org/licenses/>.
19
20 use strict;
21
22 use Debian::Dgit qw(:DEFAULT :playground);
23 setup_sigwarn();
24
25 use IO::Handle;
26 use Data::Dumper;
27 use LWP::UserAgent;
28 use Dpkg::Control::Hash;
29 use File::Path;
30 use File::Temp qw(tempdir);
31 use File::Basename;
32 use Dpkg::Version;
33 use POSIX;
34 use IPC::Open2;
35 use Digest::SHA;
36 use Digest::MD5;
37 use List::MoreUtils qw(pairwise);
38 use Text::Glob qw(match_glob);
39 use Fcntl qw(:DEFAULT :flock);
40 use Carp;
41
42 use Debian::Dgit;
43
44 our $our_version = 'UNRELEASED'; ###substituted###
45 our $absurdity = undef; ###substituted###
46
47 our @rpushprotovsn_support = qw(4 3 2); # 4 is new tag format
48 our $protovsn;
49
50 our $cmd;
51 our $subcommand;
52 our $isuite;
53 our $idistro;
54 our $package;
55 our @ropts;
56
57 our $sign = 1;
58 our $dryrun_level = 0;
59 our $changesfile;
60 our $buildproductsdir = '..';
61 our $new_package = 0;
62 our $ignoredirty = 0;
63 our $rmonerror = 1;
64 our @deliberatelies;
65 our %previously;
66 our $existing_package = 'dpkg';
67 our $cleanmode;
68 our $changes_since_version;
69 our $rmchanges;
70 our $overwrite_version; # undef: not specified; '': check changelog
71 our $quilt_mode;
72 our $quilt_modes_re = 'linear|smash|auto|nofix|nocheck|gbp|dpm|unapplied';
73 our $dodep14tag;
74 our $split_brain_save;
75 our $we_are_responder;
76 our $we_are_initiator;
77 our $initiator_tempdir;
78 our $patches_applied_dirtily = 00;
79 our $tagformat_want;
80 our $tagformat;
81 our $tagformatfn;
82 our $chase_dsc_distro=1;
83
84 our %forceopts = map { $_=>0 }
85     qw(unrepresentable unsupported-source-format
86        dsc-changes-mismatch changes-origs-exactly
87        import-gitapply-absurd
88        import-gitapply-no-absurd
89        import-dsc-with-dgit-field);
90
91 our %format_ok = map { $_=>1 } ("1.0","3.0 (native)","3.0 (quilt)");
92
93 our $suite_re = '[-+.0-9a-z]+';
94 our $cleanmode_re = 'dpkg-source(?:-d)?|git|git-ff|check|none';
95 our $orig_f_comp_re = 'orig(?:-[-0-9a-z]+)?';
96 our $orig_f_sig_re = '\\.(?:asc|gpg|pgp)';
97 our $orig_f_tail_re = "$orig_f_comp_re\\.tar(?:\\.\\w+)?(?:$orig_f_sig_re)?";
98
99 our $git_authline_re = '^([^<>]+) \<(\S+)\> (\d+ [-+]\d+)$';
100 our $splitbraincache = 'dgit-intern/quilt-cache';
101 our $rewritemap = 'dgit-rewrite/map';
102
103 our (@git) = qw(git);
104 our (@dget) = qw(dget);
105 our (@curl) = (qw(curl --proto-redir), '-all,http,https', qw(-L));
106 our (@dput) = qw(dput);
107 our (@debsign) = qw(debsign);
108 our (@gpg) = qw(gpg);
109 our (@sbuild) = qw(sbuild);
110 our (@ssh) = 'ssh';
111 our (@dgit) = qw(dgit);
112 our (@aptget) = qw(apt-get);
113 our (@aptcache) = qw(apt-cache);
114 our (@dpkgbuildpackage) = qw(dpkg-buildpackage -i\.git/ -I.git);
115 our (@dpkgsource) = qw(dpkg-source -i\.git/ -I.git);
116 our (@dpkggenchanges) = qw(dpkg-genchanges);
117 our (@mergechanges) = qw(mergechanges -f);
118 our (@gbp_build) = ('');
119 our (@gbp_pq) = ('gbp pq');
120 our (@changesopts) = ('');
121
122 our %opts_opt_map = ('dget' => \@dget, # accept for compatibility
123                      'curl' => \@curl,
124                      'dput' => \@dput,
125                      'debsign' => \@debsign,
126                      'gpg' => \@gpg,
127                      'sbuild' => \@sbuild,
128                      'ssh' => \@ssh,
129                      'dgit' => \@dgit,
130                      'git' => \@git,
131                      'apt-get' => \@aptget,
132                      'apt-cache' => \@aptcache,
133                      'dpkg-source' => \@dpkgsource,
134                      'dpkg-buildpackage' => \@dpkgbuildpackage,
135                      'dpkg-genchanges' => \@dpkggenchanges,
136                      'gbp-build' => \@gbp_build,
137                      'gbp-pq' => \@gbp_pq,
138                      'ch' => \@changesopts,
139                      'mergechanges' => \@mergechanges);
140
141 our %opts_opt_cmdonly = ('gpg' => 1, 'git' => 1);
142 our %opts_cfg_insertpos = map {
143     $_,
144     scalar @{ $opts_opt_map{$_} }
145 } keys %opts_opt_map;
146
147 sub parseopts_late_defaults();
148 sub setup_gitattrs(;$);
149 sub check_gitattrs($$);
150
151 our $keyid;
152
153 autoflush STDOUT 1;
154
155 our $supplementary_message = '';
156 our $need_split_build_invocation = 0;
157 our $split_brain = 0;
158
159 END {
160     local ($@, $?);
161     return unless forkcheck_mainprocess();
162     print STDERR "! $_\n" foreach $supplementary_message =~ m/^.+$/mg;
163 }
164
165 our $remotename = 'dgit';
166 our @ourdscfield = qw(Dgit Vcs-Dgit-Master);
167 our $csuite;
168 our $instead_distro;
169
170 if (!defined $absurdity) {
171     $absurdity = $0;
172     $absurdity =~ s{/[^/]+$}{/absurd} or die;
173 }
174
175 sub debiantag ($$) {
176     my ($v,$distro) = @_;
177     return $tagformatfn->($v, $distro);
178 }
179
180 sub debiantag_maintview ($$) { 
181     my ($v,$distro) = @_;
182     return "$distro/".dep14_version_mangle $v;
183 }
184
185 sub madformat ($) { $_[0] eq '3.0 (quilt)' }
186
187 sub lbranch () { return "$branchprefix/$csuite"; }
188 my $lbranch_re = '^refs/heads/'.$branchprefix.'/([^/.]+)$';
189 sub lref () { return "refs/heads/".lbranch(); }
190 sub lrref () { return "refs/remotes/$remotename/".server_branch($csuite); }
191 sub rrref () { return server_ref($csuite); }
192
193 sub stripepoch ($) {
194     my ($vsn) = @_;
195     $vsn =~ s/^\d+\://;
196     return $vsn;
197 }
198
199 sub srcfn ($$) {
200     my ($vsn,$sfx) = @_;
201     return "${package}_".(stripepoch $vsn).$sfx
202 }
203
204 sub dscfn ($) {
205     my ($vsn) = @_;
206     return srcfn($vsn,".dsc");
207 }
208
209 sub changespat ($;$) {
210     my ($vsn, $arch) = @_;
211     return "${package}_".(stripepoch $vsn)."_".($arch//'*').".changes";
212 }
213
214 sub upstreamversion ($) {
215     my ($vsn) = @_;
216     $vsn =~ s/-[^-]+$//;
217     return $vsn;
218 }
219
220 our $us = 'dgit';
221 initdebug('');
222
223 our @end;
224 END { 
225     local ($?);
226     return unless forkcheck_mainprocess();
227     foreach my $f (@end) {
228         eval { $f->(); };
229         print STDERR "$us: cleanup: $@" if length $@;
230     }
231 };
232
233 sub badcfg { print STDERR "$us: invalid configuration: @_\n"; exit 12; }
234
235 sub forceable_fail ($$) {
236     my ($forceoptsl, $msg) = @_;
237     fail $msg unless grep { $forceopts{$_} } @$forceoptsl;
238     print STDERR "warning: overriding problem due to --force:\n". $msg;
239 }
240
241 sub forceing ($) {
242     my ($forceoptsl) = @_;
243     my @got = grep { $forceopts{$_} } @$forceoptsl;
244     return 0 unless @got;
245     print STDERR
246  "warning: skipping checks or functionality due to --force-$got[0]\n";
247 }
248
249 sub no_such_package () {
250     print STDERR "$us: package $package does not exist in suite $isuite\n";
251     exit 4;
252 }
253
254 sub deliberately ($) {
255     my ($enquiry) = @_;
256     return !!grep { $_ eq "--deliberately-$enquiry" } @deliberatelies;
257 }
258
259 sub deliberately_not_fast_forward () {
260     foreach (qw(not-fast-forward fresh-repo)) {
261         return 1 if deliberately($_) || deliberately("TEST-dgit-only-$_");
262     }
263 }
264
265 sub quiltmode_splitbrain () {
266     $quilt_mode =~ m/gbp|dpm|unapplied/;
267 }
268
269 sub opts_opt_multi_cmd {
270     my @cmd;
271     push @cmd, split /\s+/, shift @_;
272     push @cmd, @_;
273     @cmd;
274 }
275
276 sub gbp_pq {
277     return opts_opt_multi_cmd @gbp_pq;
278 }
279
280 #---------- remote protocol support, common ----------
281
282 # remote push initiator/responder protocol:
283 #  $ dgit remote-push-build-host <n-rargs> <rargs>... <push-args>...
284 #  where <rargs> is <push-host-dir> <supported-proto-vsn>,... ...
285 #  < dgit-remote-push-ready <actual-proto-vsn>
286 #
287 # occasionally:
288 #
289 #  > progress NBYTES
290 #  [NBYTES message]
291 #
292 #  > supplementary-message NBYTES          # $protovsn >= 3
293 #  [NBYTES message]
294 #
295 # main sequence:
296 #
297 #  > file parsed-changelog
298 #  [indicates that output of dpkg-parsechangelog follows]
299 #  > data-block NBYTES
300 #  > [NBYTES bytes of data (no newline)]
301 #  [maybe some more blocks]
302 #  > data-end
303 #
304 #  > file dsc
305 #  [etc]
306 #
307 #  > file changes
308 #  [etc]
309 #
310 #  > param head DGIT-VIEW-HEAD
311 #  > param csuite SUITE
312 #  > param tagformat old|new
313 #  > param maint-view MAINT-VIEW-HEAD
314 #
315 #  > param buildinfo-filename P_V_X.buildinfo   # zero or more times
316 #  > file buildinfo                             # for buildinfos to sign
317 #
318 #  > previously REFNAME=OBJNAME       # if --deliberately-not-fast-forward
319 #                                     # goes into tag, for replay prevention
320 #
321 #  > want signed-tag
322 #  [indicates that signed tag is wanted]
323 #  < data-block NBYTES
324 #  < [NBYTES bytes of data (no newline)]
325 #  [maybe some more blocks]
326 #  < data-end
327 #  < files-end
328 #
329 #  > want signed-dsc-changes
330 #  < data-block NBYTES    [transfer of signed dsc]
331 #  [etc]
332 #  < data-block NBYTES    [transfer of signed changes]
333 #  [etc]
334 #  < data-block NBYTES    [transfer of each signed buildinfo
335 #  [etc]                   same number and order as "file buildinfo"]
336 #  ...
337 #  < files-end
338 #
339 #  > complete
340
341 our $i_child_pid;
342
343 sub i_child_report () {
344     # Sees if our child has died, and reap it if so.  Returns a string
345     # describing how it died if it failed, or undef otherwise.
346     return undef unless $i_child_pid;
347     my $got = waitpid $i_child_pid, WNOHANG;
348     return undef if $got <= 0;
349     die unless $got == $i_child_pid;
350     $i_child_pid = undef;
351     return undef unless $?;
352     return "build host child ".waitstatusmsg();
353 }
354
355 sub badproto ($$) {
356     my ($fh, $m) = @_;
357     fail "connection lost: $!" if $fh->error;
358     fail "protocol violation; $m not expected";
359 }
360
361 sub badproto_badread ($$) {
362     my ($fh, $wh) = @_;
363     fail "connection lost: $!" if $!;
364     my $report = i_child_report();
365     fail $report if defined $report;
366     badproto $fh, "eof (reading $wh)";
367 }
368
369 sub protocol_expect (&$) {
370     my ($match, $fh) = @_;
371     local $_;
372     $_ = <$fh>;
373     defined && chomp or badproto_badread $fh, "protocol message";
374     if (wantarray) {
375         my @r = &$match;
376         return @r if @r;
377     } else {
378         my $r = &$match;
379         return $r if $r;
380     }
381     badproto $fh, "\`$_'";
382 }
383
384 sub protocol_send_file ($$) {
385     my ($fh, $ourfn) = @_;
386     open PF, "<", $ourfn or die "$ourfn: $!";
387     for (;;) {
388         my $d;
389         my $got = read PF, $d, 65536;
390         die "$ourfn: $!" unless defined $got;
391         last if !$got;
392         print $fh "data-block ".length($d)."\n" or die $!;
393         print $fh $d or die $!;
394     }
395     PF->error and die "$ourfn $!";
396     print $fh "data-end\n" or die $!;
397     close PF;
398 }
399
400 sub protocol_read_bytes ($$) {
401     my ($fh, $nbytes) = @_;
402     $nbytes =~ m/^[1-9]\d{0,5}$|^0$/ or badproto \*RO, "bad byte count";
403     my $d;
404     my $got = read $fh, $d, $nbytes;
405     $got==$nbytes or badproto_badread $fh, "data block";
406     return $d;
407 }
408
409 sub protocol_receive_file ($$) {
410     my ($fh, $ourfn) = @_;
411     printdebug "() $ourfn\n";
412     open PF, ">", $ourfn or die "$ourfn: $!";
413     for (;;) {
414         my ($y,$l) = protocol_expect {
415             m/^data-block (.*)$/ ? (1,$1) :
416             m/^data-end$/ ? (0,) :
417             ();
418         } $fh;
419         last unless $y;
420         my $d = protocol_read_bytes $fh, $l;
421         print PF $d or die $!;
422     }
423     close PF or die $!;
424 }
425
426 #---------- remote protocol support, responder ----------
427
428 sub responder_send_command ($) {
429     my ($command) = @_;
430     return unless $we_are_responder;
431     # called even without $we_are_responder
432     printdebug ">> $command\n";
433     print PO $command, "\n" or die $!;
434 }    
435
436 sub responder_send_file ($$) {
437     my ($keyword, $ourfn) = @_;
438     return unless $we_are_responder;
439     printdebug "]] $keyword $ourfn\n";
440     responder_send_command "file $keyword";
441     protocol_send_file \*PO, $ourfn;
442 }
443
444 sub responder_receive_files ($@) {
445     my ($keyword, @ourfns) = @_;
446     die unless $we_are_responder;
447     printdebug "[[ $keyword @ourfns\n";
448     responder_send_command "want $keyword";
449     foreach my $fn (@ourfns) {
450         protocol_receive_file \*PI, $fn;
451     }
452     printdebug "[[\$\n";
453     protocol_expect { m/^files-end$/ } \*PI;
454 }
455
456 #---------- remote protocol support, initiator ----------
457
458 sub initiator_expect (&) {
459     my ($match) = @_;
460     protocol_expect { &$match } \*RO;
461 }
462
463 #---------- end remote code ----------
464
465 sub progress {
466     if ($we_are_responder) {
467         my $m = join '', @_;
468         responder_send_command "progress ".length($m) or die $!;
469         print PO $m or die $!;
470     } else {
471         print @_, "\n";
472     }
473 }
474
475 our $ua;
476
477 sub url_get {
478     if (!$ua) {
479         $ua = LWP::UserAgent->new();
480         $ua->env_proxy;
481     }
482     my $what = $_[$#_];
483     progress "downloading $what...";
484     my $r = $ua->get(@_) or die $!;
485     return undef if $r->code == 404;
486     $r->is_success or fail "failed to fetch $what: ".$r->status_line;
487     return $r->decoded_content(charset => 'none');
488 }
489
490 our ($dscdata,$dscurl,$dsc,$dsc_checked,$skew_warning_vsn);
491
492 sub act_local () { return $dryrun_level <= 1; }
493 sub act_scary () { return !$dryrun_level; }
494
495 sub printdone {
496     if (!$dryrun_level) {
497         progress "$us ok: @_";
498     } else {
499         progress "would be ok: @_ (but dry run only)";
500     }
501 }
502
503 sub dryrun_report {
504     printcmd(\*STDERR,$debugprefix."#",@_);
505 }
506
507 sub runcmd_ordryrun {
508     if (act_scary()) {
509         runcmd @_;
510     } else {
511         dryrun_report @_;
512     }
513 }
514
515 sub runcmd_ordryrun_local {
516     if (act_local()) {
517         runcmd @_;
518     } else {
519         dryrun_report @_;
520     }
521 }
522
523 sub shell_cmd {
524     my ($first_shell, @cmd) = @_;
525     return qw(sh -ec), $first_shell.'; exec "$@"', 'x', @cmd;
526 }
527
528 our $helpmsg = <<END;
529 main usages:
530   dgit [dgit-opts] clone [dgit-opts] package [suite] [./dir|/dir]
531   dgit [dgit-opts] fetch|pull [dgit-opts] [suite]
532   dgit [dgit-opts] build [dpkg-buildpackage-opts]
533   dgit [dgit-opts] sbuild [sbuild-opts]
534   dgit [dgit-opts] push [dgit-opts] [suite]
535   dgit [dgit-opts] rpush build-host:build-dir ...
536 important dgit options:
537   -k<keyid>           sign tag and package with <keyid> instead of default
538   --dry-run -n        do not change anything, but go through the motions
539   --damp-run -L       like --dry-run but make local changes, without signing
540   --new -N            allow introducing a new package
541   --debug -D          increase debug level
542   -c<name>=<value>    set git config option (used directly by dgit too)
543 END
544
545 our $later_warning_msg = <<END;
546 Perhaps the upload is stuck in incoming.  Using the version from git.
547 END
548
549 sub badusage {
550     print STDERR "$us: @_\n", $helpmsg or die $!;
551     exit 8;
552 }
553
554 sub nextarg {
555     @ARGV or badusage "too few arguments";
556     return scalar shift @ARGV;
557 }
558
559 sub pre_help () {
560     not_necessarily_a_tree();
561 }
562 sub cmd_help () {
563     print $helpmsg or die $!;
564     exit 0;
565 }
566
567 our $td = $ENV{DGIT_TEST_DUMMY_DIR} || "DGIT_TEST_DUMMY_DIR-unset";
568
569 our %defcfg = ('dgit.default.distro' => 'debian',
570                'dgit.default.default-suite' => 'unstable',
571                'dgit.default.old-dsc-distro' => 'debian',
572                'dgit-suite.*-security.distro' => 'debian-security',
573                'dgit.default.username' => '',
574                'dgit.default.archive-query-default-component' => 'main',
575                'dgit.default.ssh' => 'ssh',
576                'dgit.default.archive-query' => 'madison:',
577                'dgit.default.sshpsql-dbname' => 'service=projectb',
578                'dgit.default.aptget-components' => 'main',
579                'dgit.default.dgit-tag-format' => 'new,old,maint',
580                'dgit.dsc-url-proto-ok.http'    => 'true',
581                'dgit.dsc-url-proto-ok.https'   => 'true',
582                'dgit.dsc-url-proto-ok.git'     => 'true',
583                'dgit.default.dsc-url-proto-ok' => 'false',
584                # old means "repo server accepts pushes with old dgit tags"
585                # new means "repo server accepts pushes with new dgit tags"
586                # maint means "repo server accepts split brain pushes"
587                # hist means "repo server may have old pushes without new tag"
588                #   ("hist" is implied by "old")
589                'dgit-distro.debian.archive-query' => 'ftpmasterapi:',
590                'dgit-distro.debian.git-check' => 'url',
591                'dgit-distro.debian.git-check-suffix' => '/info/refs',
592                'dgit-distro.debian.new-private-pushers' => 't',
593                'dgit-distro.debian/push.git-url' => '',
594                'dgit-distro.debian/push.git-host' => 'push.dgit.debian.org',
595                'dgit-distro.debian/push.git-user-force' => 'dgit',
596                'dgit-distro.debian/push.git-proto' => 'git+ssh://',
597                'dgit-distro.debian/push.git-path' => '/dgit/debian/repos',
598                'dgit-distro.debian/push.git-create' => 'true',
599                'dgit-distro.debian/push.git-check' => 'ssh-cmd',
600  'dgit-distro.debian.archive-query-url', 'https://api.ftp-master.debian.org/',
601 # 'dgit-distro.debian.archive-query-tls-key',
602 #    '/etc/ssl/certs/%HOST%.pem:/etc/dgit/%HOST%.pem',
603 # ^ this does not work because curl is broken nowadays
604 # Fixing #790093 properly will involve providing providing the key
605 # in some pacagke and maybe updating these paths.
606 #
607 # 'dgit-distro.debian.archive-query-tls-curl-args',
608 #   '--ca-path=/etc/ssl/ca-debian',
609 # ^ this is a workaround but works (only) on DSA-administered machines
610                'dgit-distro.debian.git-url' => 'https://git.dgit.debian.org',
611                'dgit-distro.debian.git-url-suffix' => '',
612                'dgit-distro.debian.upload-host' => 'ftp-master', # for dput
613                'dgit-distro.debian.mirror' => 'http://ftp.debian.org/debian/',
614  'dgit-distro.debian-security.archive-query' => 'aptget:',
615  'dgit-distro.debian-security.mirror' => 'http://security.debian.org/debian-security/',
616  'dgit-distro.debian-security.aptget-suite-map' => 's#-security$#/updates#',
617  'dgit-distro.debian-security.aptget-suite-rmap' => 's#$#-security#',
618  'dgit-distro.debian-security.nominal-distro' => 'debian',
619  'dgit-distro.debian.backports-quirk' => '(squeeze)-backports*',
620  'dgit-distro.debian-backports.mirror' => 'http://backports.debian.org/debian-backports/',
621                'dgit-distro.ubuntu.git-check' => 'false',
622  'dgit-distro.ubuntu.mirror' => 'http://archive.ubuntu.com/ubuntu',
623                'dgit-distro.test-dummy.ssh' => "$td/ssh",
624                'dgit-distro.test-dummy.username' => "alice",
625                'dgit-distro.test-dummy.git-check' => "ssh-cmd",
626                'dgit-distro.test-dummy.git-create' => "ssh-cmd",
627                'dgit-distro.test-dummy.git-url' => "$td/git",
628                'dgit-distro.test-dummy.git-host' => "git",
629                'dgit-distro.test-dummy.git-path' => "$td/git",
630                'dgit-distro.test-dummy.archive-query' => "dummycatapi:",
631                'dgit-distro.test-dummy.archive-query-url' => "file://$td/aq/",
632                'dgit-distro.test-dummy.mirror' => "file://$td/mirror/",
633                'dgit-distro.test-dummy.upload-host' => 'test-dummy',
634                );
635
636 our %gitcfgs;
637 our @gitcfgsources = qw(cmdline local global system);
638 our $invoked_in_git_tree = 1;
639
640 sub git_slurp_config () {
641     # This algoritm is a bit subtle, but this is needed so that for
642     # options which we want to be single-valued, we allow the
643     # different config sources to override properly.  See #835858.
644     foreach my $src (@gitcfgsources) {
645         next if $src eq 'cmdline';
646         # we do this ourselves since git doesn't handle it
647
648         $gitcfgs{$src} = git_slurp_config_src $src;
649     }
650 }
651
652 sub git_get_config ($) {
653     my ($c) = @_;
654     foreach my $src (@gitcfgsources) {
655         my $l = $gitcfgs{$src}{$c};
656         confess "internal error ($l $c)" if $l && !ref $l;
657         printdebug"C $c ".(defined $l ?
658                            join " ", map { messagequote "'$_'" } @$l :
659                            "undef")."\n"
660             if $debuglevel >= 4;
661         $l or next;
662         @$l==1 or badcfg "multiple values for $c".
663             " (in $src git config)" if @$l > 1;
664         return $l->[0];
665     }
666     return undef;
667 }
668
669 sub cfg {
670     foreach my $c (@_) {
671         return undef if $c =~ /RETURN-UNDEF/;
672         printdebug "C? $c\n" if $debuglevel >= 5;
673         my $v = git_get_config($c);
674         return $v if defined $v;
675         my $dv = $defcfg{$c};
676         if (defined $dv) {
677             printdebug "CD $c $dv\n" if $debuglevel >= 4;
678             return $dv;
679         }
680     }
681     badcfg "need value for one of: @_\n".
682         "$us: distro or suite appears not to be (properly) supported";
683 }
684
685 sub not_necessarily_a_tree () {
686     # needs to be called from pre_*
687     @gitcfgsources = grep { $_ ne 'local' } @gitcfgsources;
688     $invoked_in_git_tree = 0;
689 }
690
691 sub access_basedistro__noalias () {
692     if (defined $idistro) {
693         return $idistro;
694     } else {    
695         my $def = cfg("dgit-suite.$isuite.distro", 'RETURN-UNDEF');
696         return $def if defined $def;
697         foreach my $src (@gitcfgsources, 'internal') {
698             my $kl = $src eq 'internal' ? \%defcfg : $gitcfgs{$src};
699             next unless $kl;
700             foreach my $k (keys %$kl) {
701                 next unless $k =~ m#^dgit-suite\.(.*)\.distro$#;
702                 my $dpat = $1;
703                 next unless match_glob $dpat, $isuite;
704                 return $kl->{$k};
705             }
706         }
707         return cfg("dgit.default.distro");
708     }
709 }
710
711 sub access_basedistro () {
712     my $noalias = access_basedistro__noalias();
713     my $canon = cfg("dgit-distro.$noalias.alias-canon",'RETURN-UNDEF');
714     return $canon // $noalias;
715 }
716
717 sub access_nomdistro () {
718     my $base = access_basedistro();
719     my $r = cfg("dgit-distro.$base.nominal-distro",'RETURN-UNDEF') // $base;
720     $r =~ m/^$distro_re$/ or badcfg
721  "bad syntax for (nominal) distro \`$r' (does not match /^$distro_re$/)";
722     return $r;
723 }
724
725 sub access_quirk () {
726     # returns (quirk name, distro to use instead or undef, quirk-specific info)
727     my $basedistro = access_basedistro();
728     my $backports_quirk = cfg("dgit-distro.$basedistro.backports-quirk",
729                               'RETURN-UNDEF');
730     if (defined $backports_quirk) {
731         my $re = $backports_quirk;
732         $re =~ s/[^-0-9a-z_\%*()]/\\$&/ig;
733         $re =~ s/\*/.*/g;
734         $re =~ s/\%/([-0-9a-z_]+)/
735             or $re =~ m/[()]/ or badcfg "backports-quirk needs \% or ( )";
736         if ($isuite =~ m/^$re$/) {
737             return ('backports',"$basedistro-backports",$1);
738         }
739     }
740     return ('none',undef);
741 }
742
743 our $access_forpush;
744
745 sub parse_cfg_bool ($$$) {
746     my ($what,$def,$v) = @_;
747     $v //= $def;
748     return
749         $v =~ m/^[ty1]/ ? 1 :
750         $v =~ m/^[fn0]/ ? 0 :
751         badcfg "$what needs t (true, y, 1) or f (false, n, 0) not \`$v'";
752 }       
753
754 sub access_forpush_config () {
755     my $d = access_basedistro();
756
757     return 1 if
758         $new_package &&
759         parse_cfg_bool('new-private-pushers', 0,
760                        cfg("dgit-distro.$d.new-private-pushers",
761                            'RETURN-UNDEF'));
762
763     my $v = cfg("dgit-distro.$d.readonly", 'RETURN-UNDEF');
764     $v //= 'a';
765     return
766         $v =~ m/^[ty1]/ ? 0 : # force readonly,    forpush = 0
767         $v =~ m/^[fn0]/ ? 1 : # force nonreadonly, forpush = 1
768         $v =~ m/^[a]/  ? '' : # auto,              forpush = ''
769         badcfg "readonly needs t (true, y, 1) or f (false, n, 0) or a (auto)";
770 }
771
772 sub access_forpush () {
773     $access_forpush //= access_forpush_config();
774     return $access_forpush;
775 }
776
777 sub pushing () {
778     die "$access_forpush ?" if ($access_forpush // 1) ne 1;
779     badcfg "pushing but distro is configured readonly"
780         if access_forpush_config() eq '0';
781     $access_forpush = 1;
782     $supplementary_message = <<'END' unless $we_are_responder;
783 Push failed, before we got started.
784 You can retry the push, after fixing the problem, if you like.
785 END
786     parseopts_late_defaults();
787 }
788
789 sub notpushing () {
790     parseopts_late_defaults();
791 }
792
793 sub supplementary_message ($) {
794     my ($msg) = @_;
795     if (!$we_are_responder) {
796         $supplementary_message = $msg;
797         return;
798     } elsif ($protovsn >= 3) {
799         responder_send_command "supplementary-message ".length($msg)
800             or die $!;
801         print PO $msg or die $!;
802     }
803 }
804
805 sub access_distros () {
806     # Returns list of distros to try, in order
807     #
808     # We want to try:
809     #    0. `instead of' distro name(s) we have been pointed to
810     #    1. the access_quirk distro, if any
811     #    2a. the user's specified distro, or failing that  } basedistro
812     #    2b. the distro calculated from the suite          }
813     my @l = access_basedistro();
814
815     my (undef,$quirkdistro) = access_quirk();
816     unshift @l, $quirkdistro;
817     unshift @l, $instead_distro;
818     @l = grep { defined } @l;
819
820     push @l, access_nomdistro();
821
822     if (access_forpush()) {
823         @l = map { ("$_/push", $_) } @l;
824     }
825     @l;
826 }
827
828 sub access_cfg_cfgs (@) {
829     my (@keys) = @_;
830     my @cfgs;
831     # The nesting of these loops determines the search order.  We put
832     # the key loop on the outside so that we search all the distros
833     # for each key, before going on to the next key.  That means that
834     # if access_cfg is called with a more specific, and then a less
835     # specific, key, an earlier distro can override the less specific
836     # without necessarily overriding any more specific keys.  (If the
837     # distro wants to override the more specific keys it can simply do
838     # so; whereas if we did the loop the other way around, it would be
839     # impossible to for an earlier distro to override a less specific
840     # key but not the more specific ones without restating the unknown
841     # values of the more specific keys.
842     my @realkeys;
843     my @rundef;
844     # We have to deal with RETURN-UNDEF specially, so that we don't
845     # terminate the search prematurely.
846     foreach (@keys) {
847         if (m/RETURN-UNDEF/) { push @rundef, $_; last; }
848         push @realkeys, $_
849     }
850     foreach my $d (access_distros()) {
851         push @cfgs, map { "dgit-distro.$d.$_" } @realkeys;
852     }
853     push @cfgs, map { "dgit.default.$_" } @realkeys;
854     push @cfgs, @rundef;
855     return @cfgs;
856 }
857
858 sub access_cfg (@) {
859     my (@keys) = @_;
860     my (@cfgs) = access_cfg_cfgs(@keys);
861     my $value = cfg(@cfgs);
862     return $value;
863 }
864
865 sub access_cfg_bool ($$) {
866     my ($def, @keys) = @_;
867     parse_cfg_bool($keys[0], $def, access_cfg(@keys, 'RETURN-UNDEF'));
868 }
869
870 sub string_to_ssh ($) {
871     my ($spec) = @_;
872     if ($spec =~ m/\s/) {
873         return qw(sh -ec), 'exec '.$spec.' "$@"', 'x';
874     } else {
875         return ($spec);
876     }
877 }
878
879 sub access_cfg_ssh () {
880     my $gitssh = access_cfg('ssh', 'RETURN-UNDEF');
881     if (!defined $gitssh) {
882         return @ssh;
883     } else {
884         return string_to_ssh $gitssh;
885     }
886 }
887
888 sub access_runeinfo ($) {
889     my ($info) = @_;
890     return ": dgit ".access_basedistro()." $info ;";
891 }
892
893 sub access_someuserhost ($) {
894     my ($some) = @_;
895     my $user = access_cfg("$some-user-force", 'RETURN-UNDEF');
896     defined($user) && length($user) or
897         $user = access_cfg("$some-user",'username');
898     my $host = access_cfg("$some-host");
899     return length($user) ? "$user\@$host" : $host;
900 }
901
902 sub access_gituserhost () {
903     return access_someuserhost('git');
904 }
905
906 sub access_giturl (;$) {
907     my ($optional) = @_;
908     my $url = access_cfg('git-url','RETURN-UNDEF');
909     my $suffix;
910     if (!length $url) {
911         my $proto = access_cfg('git-proto', 'RETURN-UNDEF');
912         return undef unless defined $proto;
913         $url =
914             $proto.
915             access_gituserhost().
916             access_cfg('git-path');
917     } else {
918         $suffix = access_cfg('git-url-suffix','RETURN-UNDEF');
919     }
920     $suffix //= '.git';
921     return "$url/$package$suffix";
922 }              
923
924 sub parsecontrolfh ($$;$) {
925     my ($fh, $desc, $allowsigned) = @_;
926     our $dpkgcontrolhash_noissigned;
927     my $c;
928     for (;;) {
929         my %opts = ('name' => $desc);
930         $opts{allow_pgp}= $allowsigned || !$dpkgcontrolhash_noissigned;
931         $c = Dpkg::Control::Hash->new(%opts);
932         $c->parse($fh,$desc) or die "parsing of $desc failed";
933         last if $allowsigned;
934         last if $dpkgcontrolhash_noissigned;
935         my $issigned= $c->get_option('is_pgp_signed');
936         if (!defined $issigned) {
937             $dpkgcontrolhash_noissigned= 1;
938             seek $fh, 0,0 or die "seek $desc: $!";
939         } elsif ($issigned) {
940             fail "control file $desc is (already) PGP-signed. ".
941                 " Note that dgit push needs to modify the .dsc and then".
942                 " do the signature itself";
943         } else {
944             last;
945         }
946     }
947     return $c;
948 }
949
950 sub parsecontrol {
951     my ($file, $desc, $allowsigned) = @_;
952     my $fh = new IO::Handle;
953     open $fh, '<', $file or die "$file: $!";
954     my $c = parsecontrolfh($fh,$desc,$allowsigned);
955     $fh->error and die $!;
956     close $fh;
957     return $c;
958 }
959
960 sub getfield ($$) {
961     my ($dctrl,$field) = @_;
962     my $v = $dctrl->{$field};
963     return $v if defined $v;
964     fail "missing field $field in ".$dctrl->get_option('name');
965 }
966
967 sub parsechangelog {
968     my $c = Dpkg::Control::Hash->new(name => 'parsed changelog');
969     my $p = new IO::Handle;
970     my @cmd = (qw(dpkg-parsechangelog), @_);
971     open $p, '-|', @cmd or die $!;
972     $c->parse($p);
973     $?=0; $!=0; close $p or failedcmd @cmd;
974     return $c;
975 }
976
977 sub commit_getclogp ($) {
978     # Returns the parsed changelog hashref for a particular commit
979     my ($objid) = @_;
980     our %commit_getclogp_memo;
981     my $memo = $commit_getclogp_memo{$objid};
982     return $memo if $memo;
983     mkpath '.git/dgit';
984     my $mclog = ".git/dgit/clog-$objid";
985     runcmd shell_cmd "exec >$mclog", @git, qw(cat-file blob),
986         "$objid:debian/changelog";
987     $commit_getclogp_memo{$objid} = parsechangelog("-l$mclog");
988 }
989
990 sub parse_dscdata () {
991     my $dscfh = new IO::File \$dscdata, '<' or die $!;
992     printdebug Dumper($dscdata) if $debuglevel>1;
993     $dsc = parsecontrolfh($dscfh,$dscurl,1);
994     printdebug Dumper($dsc) if $debuglevel>1;
995 }
996
997 our %rmad;
998
999 sub archive_query ($;@) {
1000     my ($method) = shift @_;
1001     fail "this operation does not support multiple comma-separated suites"
1002         if $isuite =~ m/,/;
1003     my $query = access_cfg('archive-query','RETURN-UNDEF');
1004     $query =~ s/^(\w+):// or badcfg "invalid archive-query method \`$query'";
1005     my $proto = $1;
1006     my $data = $'; #';
1007     { no strict qw(refs); &{"${method}_${proto}"}($proto,$data,@_); }
1008 }
1009
1010 sub archive_query_prepend_mirror {
1011     my $m = access_cfg('mirror');
1012     return map { [ $_->[0], $m.$_->[1], @$_[2..$#$_] ] } @_;
1013 }
1014
1015 sub pool_dsc_subpath ($$) {
1016     my ($vsn,$component) = @_; # $package is implict arg
1017     my $prefix = substr($package, 0, $package =~ m/^l/ ? 4 : 1);
1018     return "/pool/$component/$prefix/$package/".dscfn($vsn);
1019 }
1020
1021 sub cfg_apply_map ($$$) {
1022     my ($varref, $what, $mapspec) = @_;
1023     return unless $mapspec;
1024
1025     printdebug "config $what EVAL{ $mapspec; }\n";
1026     $_ = $$varref;
1027     eval "package Dgit::Config; $mapspec;";
1028     die $@ if $@;
1029     $$varref = $_;
1030 }
1031
1032 #---------- `ftpmasterapi' archive query method (nascent) ----------
1033
1034 sub archive_api_query_cmd ($) {
1035     my ($subpath) = @_;
1036     my @cmd = (@curl, qw(-sS));
1037     my $url = access_cfg('archive-query-url');
1038     if ($url =~ m#^https://([-.0-9a-z]+)/#) {
1039         my $host = $1;
1040         my $keys = access_cfg('archive-query-tls-key','RETURN-UNDEF') //'';
1041         foreach my $key (split /\:/, $keys) {
1042             $key =~ s/\%HOST\%/$host/g;
1043             if (!stat $key) {
1044                 fail "for $url: stat $key: $!" unless $!==ENOENT;
1045                 next;
1046             }
1047             fail "config requested specific TLS key but do not know".
1048                 " how to get curl to use exactly that EE key ($key)";
1049 #           push @cmd, "--cacert", $key, "--capath", "/dev/enoent";
1050 #           # Sadly the above line does not work because of changes
1051 #           # to gnutls.   The real fix for #790093 may involve
1052 #           # new curl options.
1053             last;
1054         }
1055         # Fixing #790093 properly will involve providing a value
1056         # for this on clients.
1057         my $kargs = access_cfg('archive-query-tls-curl-ca-args','RETURN-UNDEF');
1058         push @cmd, split / /, $kargs if defined $kargs;
1059     }
1060     push @cmd, $url.$subpath;
1061     return @cmd;
1062 }
1063
1064 sub api_query ($$;$) {
1065     use JSON;
1066     my ($data, $subpath, $ok404) = @_;
1067     badcfg "ftpmasterapi archive query method takes no data part"
1068         if length $data;
1069     my @cmd = archive_api_query_cmd($subpath);
1070     my $url = $cmd[$#cmd];
1071     push @cmd, qw(-w %{http_code});
1072     my $json = cmdoutput @cmd;
1073     unless ($json =~ s/\d+\d+\d$//) {
1074         failedcmd_report_cmd undef, @cmd;
1075         fail "curl failed to print 3-digit HTTP code";
1076     }
1077     my $code = $&;
1078     return undef if $code eq '404' && $ok404;
1079     fail "fetch of $url gave HTTP code $code"
1080         unless $url =~ m#^file://# or $code =~ m/^2/;
1081     return decode_json($json);
1082 }
1083
1084 sub canonicalise_suite_ftpmasterapi {
1085     my ($proto,$data) = @_;
1086     my $suites = api_query($data, 'suites');
1087     my @matched;
1088     foreach my $entry (@$suites) {
1089         next unless grep { 
1090             my $v = $entry->{$_};
1091             defined $v && $v eq $isuite;
1092         } qw(codename name);
1093         push @matched, $entry;
1094     }
1095     fail "unknown suite $isuite" unless @matched;
1096     my $cn;
1097     eval {
1098         @matched==1 or die "multiple matches for suite $isuite\n";
1099         $cn = "$matched[0]{codename}";
1100         defined $cn or die "suite $isuite info has no codename\n";
1101         $cn =~ m/^$suite_re$/ or die "suite $isuite maps to bad codename\n";
1102     };
1103     die "bad ftpmaster api response: $@\n".Dumper(\@matched)
1104         if length $@;
1105     return $cn;
1106 }
1107
1108 sub archive_query_ftpmasterapi {
1109     my ($proto,$data) = @_;
1110     my $info = api_query($data, "dsc_in_suite/$isuite/$package");
1111     my @rows;
1112     my $digester = Digest::SHA->new(256);
1113     foreach my $entry (@$info) {
1114         eval {
1115             my $vsn = "$entry->{version}";
1116             my ($ok,$msg) = version_check $vsn;
1117             die "bad version: $msg\n" unless $ok;
1118             my $component = "$entry->{component}";
1119             $component =~ m/^$component_re$/ or die "bad component";
1120             my $filename = "$entry->{filename}";
1121             $filename && $filename !~ m#[^-+:._~0-9a-zA-Z/]|^[/.]|/[/.]#
1122                 or die "bad filename";
1123             my $sha256sum = "$entry->{sha256sum}";
1124             $sha256sum =~ m/^[0-9a-f]+$/ or die "bad sha256sum";
1125             push @rows, [ $vsn, "/pool/$component/$filename",
1126                           $digester, $sha256sum ];
1127         };
1128         die "bad ftpmaster api response: $@\n".Dumper($entry)
1129             if length $@;
1130     }
1131     @rows = sort { -version_compare($a->[0],$b->[0]) } @rows;
1132     return archive_query_prepend_mirror @rows;
1133 }
1134
1135 sub file_in_archive_ftpmasterapi {
1136     my ($proto,$data,$filename) = @_;
1137     my $pat = $filename;
1138     $pat =~ s/_/\\_/g;
1139     $pat = "%/$pat";
1140     $pat =~ s#[^-+_.0-9a-z/]# sprintf '%%%02x', ord $& #ge;
1141     my $info = api_query($data, "file_in_archive/$pat", 1);
1142 }
1143
1144 #---------- `aptget' archive query method ----------
1145
1146 our $aptget_base;
1147 our $aptget_releasefile;
1148 our $aptget_configpath;
1149
1150 sub aptget_aptget   () { return @aptget,   qw(-c), $aptget_configpath; }
1151 sub aptget_aptcache () { return @aptcache, qw(-c), $aptget_configpath; }
1152
1153 sub aptget_cache_clean {
1154     runcmd_ordryrun_local qw(sh -ec),
1155         'cd "$1"; find -atime +30 -type f -print0 | xargs -0r rm --',
1156         'x', $aptget_base;
1157 }
1158
1159 sub aptget_lock_acquire () {
1160     my $lockfile = "$aptget_base/lock";
1161     open APTGET_LOCK, '>', $lockfile or die "open $lockfile: $!";
1162     flock APTGET_LOCK, LOCK_EX or die "lock $lockfile: $!";
1163 }
1164
1165 sub aptget_prep ($) {
1166     my ($data) = @_;
1167     return if defined $aptget_base;
1168
1169     badcfg "aptget archive query method takes no data part"
1170         if length $data;
1171
1172     my $cache = $ENV{XDG_CACHE_DIR} // "$ENV{HOME}/.cache";
1173
1174     ensuredir $cache;
1175     ensuredir "$cache/dgit";
1176     my $cachekey =
1177         access_cfg('aptget-cachekey','RETURN-UNDEF')
1178         // access_nomdistro();
1179
1180     $aptget_base = "$cache/dgit/aptget";
1181     ensuredir $aptget_base;
1182
1183     my $quoted_base = $aptget_base;
1184     die "$quoted_base contains bad chars, cannot continue"
1185         if $quoted_base =~ m/["\\]/; # apt.conf(5) says no escaping :-/
1186
1187     ensuredir $aptget_base;
1188
1189     aptget_lock_acquire();
1190
1191     aptget_cache_clean();
1192
1193     $aptget_configpath = "$aptget_base/apt.conf#$cachekey";
1194     my $sourceslist = "source.list#$cachekey";
1195
1196     my $aptsuites = $isuite;
1197     cfg_apply_map(\$aptsuites, 'suite map',
1198                   access_cfg('aptget-suite-map', 'RETURN-UNDEF'));
1199
1200     open SRCS, ">", "$aptget_base/$sourceslist" or die $!;
1201     printf SRCS "deb-src %s %s %s\n",
1202         access_cfg('mirror'),
1203         $aptsuites,
1204         access_cfg('aptget-components')
1205         or die $!;
1206
1207     ensuredir "$aptget_base/cache";
1208     ensuredir "$aptget_base/lists";
1209
1210     open CONF, ">", $aptget_configpath or die $!;
1211     print CONF <<END;
1212 Debug::NoLocking "true";
1213 APT::Get::List-Cleanup "false";
1214 #clear APT::Update::Post-Invoke-Success;
1215 Dir::Etc::SourceList "$quoted_base/$sourceslist";
1216 Dir::State::Lists "$quoted_base/lists";
1217 Dir::Etc::preferences "$quoted_base/preferences";
1218 Dir::Cache::srcpkgcache "$quoted_base/cache/srcs#$cachekey";
1219 Dir::Cache::pkgcache "$quoted_base/cache/pkgs#$cachekey";
1220 END
1221
1222     foreach my $key (qw(
1223                         Dir::Cache
1224                         Dir::State
1225                         Dir::Cache::Archives
1226                         Dir::Etc::SourceParts
1227                         Dir::Etc::preferencesparts
1228                       )) {
1229         ensuredir "$aptget_base/$key";
1230         print CONF "$key \"$quoted_base/$key\";\n" or die $!;
1231     };
1232
1233     my $oldatime = (time // die $!) - 1;
1234     foreach my $oldlist (<$aptget_base/lists/*Release>) {
1235         next unless stat_exists $oldlist;
1236         my ($mtime) = (stat _)[9];
1237         utime $oldatime, $mtime, $oldlist or die "$oldlist $!";
1238     }
1239
1240     runcmd_ordryrun_local aptget_aptget(), qw(update);
1241
1242     my @releasefiles;
1243     foreach my $oldlist (<$aptget_base/lists/*Release>) {
1244         next unless stat_exists $oldlist;
1245         my ($atime) = (stat _)[8];
1246         next if $atime == $oldatime;
1247         push @releasefiles, $oldlist;
1248     }
1249     my @inreleasefiles = grep { m#/InRelease$# } @releasefiles;
1250     @releasefiles = @inreleasefiles if @inreleasefiles;
1251     die "apt updated wrong number of Release files (@releasefiles), erk"
1252         unless @releasefiles == 1;
1253
1254     ($aptget_releasefile) = @releasefiles;
1255 }
1256
1257 sub canonicalise_suite_aptget {
1258     my ($proto,$data) = @_;
1259     aptget_prep($data);
1260
1261     my $release = parsecontrol $aptget_releasefile, "Release file", 1;
1262
1263     foreach my $name (qw(Codename Suite)) {
1264         my $val = $release->{$name};
1265         if (defined $val) {
1266             printdebug "release file $name: $val\n";
1267             $val =~ m/^$suite_re$/o or fail
1268  "Release file ($aptget_releasefile) specifies intolerable $name";
1269             cfg_apply_map(\$val, 'suite rmap',
1270                           access_cfg('aptget-suite-rmap', 'RETURN-UNDEF'));
1271             return $val
1272         }
1273     }
1274     return $isuite;
1275 }
1276
1277 sub archive_query_aptget {
1278     my ($proto,$data) = @_;
1279     aptget_prep($data);
1280
1281     ensuredir "$aptget_base/source";
1282     foreach my $old (<$aptget_base/source/*.dsc>) {
1283         unlink $old or die "$old: $!";
1284     }
1285
1286     my $showsrc = cmdoutput aptget_aptcache(), qw(showsrc), $package;
1287     return () unless $showsrc =~ m/^package:\s*\Q$package\E\s*$/mi;
1288     # avoids apt-get source failing with ambiguous error code
1289
1290     runcmd_ordryrun_local
1291         shell_cmd 'cd "$1"/source; shift', $aptget_base,
1292         aptget_aptget(), qw(--download-only --only-source source), $package;
1293
1294     my @dscs = <$aptget_base/source/*.dsc>;
1295     fail "apt-get source did not produce a .dsc" unless @dscs;
1296     fail "apt-get source produced several .dscs (@dscs)" unless @dscs==1;
1297
1298     my $pre_dsc = parsecontrol $dscs[0], $dscs[0], 1;
1299
1300     use URI::Escape;
1301     my $uri = "file://". uri_escape $dscs[0];
1302     $uri =~ s{\%2f}{/}gi;
1303     return [ (getfield $pre_dsc, 'Version'), $uri ];
1304 }
1305
1306 sub file_in_archive_aptget () { return undef; }
1307
1308 #---------- `dummyapicat' archive query method ----------
1309
1310 sub archive_query_dummycatapi { archive_query_ftpmasterapi @_; }
1311 sub canonicalise_suite_dummycatapi { canonicalise_suite_ftpmasterapi @_; }
1312
1313 sub file_in_archive_dummycatapi ($$$) {
1314     my ($proto,$data,$filename) = @_;
1315     my $mirror = access_cfg('mirror');
1316     $mirror =~ s#^file://#/# or die "$mirror ?";
1317     my @out;
1318     my @cmd = (qw(sh -ec), '
1319             cd "$1"
1320             find -name "$2" -print0 |
1321             xargs -0r sha256sum
1322         ', qw(x), $mirror, $filename);
1323     debugcmd "-|", @cmd;
1324     open FIA, "-|", @cmd or die $!;
1325     while (<FIA>) {
1326         chomp or die;
1327         printdebug "| $_\n";
1328         m/^(\w+)  (\S+)$/ or die "$_ ?";
1329         push @out, { sha256sum => $1, filename => $2 };
1330     }
1331     close FIA or die failedcmd @cmd;
1332     return \@out;
1333 }
1334
1335 #---------- `madison' archive query method ----------
1336
1337 sub archive_query_madison {
1338     return archive_query_prepend_mirror
1339         map { [ @$_[0..1] ] } madison_get_parse(@_);
1340 }
1341
1342 sub madison_get_parse {
1343     my ($proto,$data) = @_;
1344     die unless $proto eq 'madison';
1345     if (!length $data) {
1346         $data= access_cfg('madison-distro','RETURN-UNDEF');
1347         $data //= access_basedistro();
1348     }
1349     $rmad{$proto,$data,$package} ||= cmdoutput
1350         qw(rmadison -asource),"-s$isuite","-u$data",$package;
1351     my $rmad = $rmad{$proto,$data,$package};
1352
1353     my @out;
1354     foreach my $l (split /\n/, $rmad) {
1355         $l =~ m{^ \s*( [^ \t|]+ )\s* \|
1356                   \s*( [^ \t|]+ )\s* \|
1357                   \s*( [^ \t|/]+ )(?:/([^ \t|/]+))? \s* \|
1358                   \s*( [^ \t|]+ )\s* }x or die "$rmad ?";
1359         $1 eq $package or die "$rmad $package ?";
1360         my $vsn = $2;
1361         my $newsuite = $3;
1362         my $component;
1363         if (defined $4) {
1364             $component = $4;
1365         } else {
1366             $component = access_cfg('archive-query-default-component');
1367         }
1368         $5 eq 'source' or die "$rmad ?";
1369         push @out, [$vsn,pool_dsc_subpath($vsn,$component),$newsuite];
1370     }
1371     return sort { -version_compare($a->[0],$b->[0]); } @out;
1372 }
1373
1374 sub canonicalise_suite_madison {
1375     # madison canonicalises for us
1376     my @r = madison_get_parse(@_);
1377     @r or fail
1378         "unable to canonicalise suite using package $package".
1379         " which does not appear to exist in suite $isuite;".
1380         " --existing-package may help";
1381     return $r[0][2];
1382 }
1383
1384 sub file_in_archive_madison { return undef; }
1385
1386 #---------- `sshpsql' archive query method ----------
1387
1388 sub sshpsql ($$$) {
1389     my ($data,$runeinfo,$sql) = @_;
1390     if (!length $data) {
1391         $data= access_someuserhost('sshpsql').':'.
1392             access_cfg('sshpsql-dbname');
1393     }
1394     $data =~ m/:/ or badcfg "invalid sshpsql method string \`$data'";
1395     my ($userhost,$dbname) = ($`,$'); #';
1396     my @rows;
1397     my @cmd = (access_cfg_ssh, $userhost,
1398                access_runeinfo("ssh-psql $runeinfo").
1399                " export LC_MESSAGES=C; export LC_CTYPE=C;".
1400                " ".shellquote qw(psql -A), $dbname, qw(-c), $sql);
1401     debugcmd "|",@cmd;
1402     open P, "-|", @cmd or die $!;
1403     while (<P>) {
1404         chomp or die;
1405         printdebug(">|$_|\n");
1406         push @rows, $_;
1407     }
1408     $!=0; $?=0; close P or failedcmd @cmd;
1409     @rows or die;
1410     my $nrows = pop @rows;
1411     $nrows =~ s/^\((\d+) rows?\)$/$1/ or die "$nrows ?";
1412     @rows == $nrows+1 or die "$nrows ".(scalar @rows)." ?";
1413     @rows = map { [ split /\|/, $_ ] } @rows;
1414     my $ncols = scalar @{ shift @rows };
1415     die if grep { scalar @$_ != $ncols } @rows;
1416     return @rows;
1417 }
1418
1419 sub sql_injection_check {
1420     foreach (@_) { die "$_ $& ?" if m{[^-+=:_.,/0-9a-zA-Z]}; }
1421 }
1422
1423 sub archive_query_sshpsql ($$) {
1424     my ($proto,$data) = @_;
1425     sql_injection_check $isuite, $package;
1426     my @rows = sshpsql($data, "archive-query $isuite $package", <<END);
1427         SELECT source.version, component.name, files.filename, files.sha256sum
1428           FROM source
1429           JOIN src_associations ON source.id = src_associations.source
1430           JOIN suite ON suite.id = src_associations.suite
1431           JOIN dsc_files ON dsc_files.source = source.id
1432           JOIN files_archive_map ON files_archive_map.file_id = dsc_files.file
1433           JOIN component ON component.id = files_archive_map.component_id
1434           JOIN files ON files.id = dsc_files.file
1435          WHERE ( suite.suite_name='$isuite' OR suite.codename='$isuite' )
1436            AND source.source='$package'
1437            AND files.filename LIKE '%.dsc';
1438 END
1439     @rows = sort { -version_compare($a->[0],$b->[0]) } @rows;
1440     my $digester = Digest::SHA->new(256);
1441     @rows = map {
1442         my ($vsn,$component,$filename,$sha256sum) = @$_;
1443         [ $vsn, "/pool/$component/$filename",$digester,$sha256sum ];
1444     } @rows;
1445     return archive_query_prepend_mirror @rows;
1446 }
1447
1448 sub canonicalise_suite_sshpsql ($$) {
1449     my ($proto,$data) = @_;
1450     sql_injection_check $isuite;
1451     my @rows = sshpsql($data, "canonicalise-suite $isuite", <<END);
1452         SELECT suite.codename
1453           FROM suite where suite_name='$isuite' or codename='$isuite';
1454 END
1455     @rows = map { $_->[0] } @rows;
1456     fail "unknown suite $isuite" unless @rows;
1457     die "ambiguous $isuite: @rows ?" if @rows>1;
1458     return $rows[0];
1459 }
1460
1461 sub file_in_archive_sshpsql ($$$) { return undef; }
1462
1463 #---------- `dummycat' archive query method ----------
1464
1465 sub canonicalise_suite_dummycat ($$) {
1466     my ($proto,$data) = @_;
1467     my $dpath = "$data/suite.$isuite";
1468     if (!open C, "<", $dpath) {
1469         $!==ENOENT or die "$dpath: $!";
1470         printdebug "dummycat canonicalise_suite $isuite $dpath ENOENT\n";
1471         return $isuite;
1472     }
1473     $!=0; $_ = <C>;
1474     chomp or die "$dpath: $!";
1475     close C;
1476     printdebug "dummycat canonicalise_suite $isuite $dpath = $_\n";
1477     return $_;
1478 }
1479
1480 sub archive_query_dummycat ($$) {
1481     my ($proto,$data) = @_;
1482     canonicalise_suite();
1483     my $dpath = "$data/package.$csuite.$package";
1484     if (!open C, "<", $dpath) {
1485         $!==ENOENT or die "$dpath: $!";
1486         printdebug "dummycat query $csuite $package $dpath ENOENT\n";
1487         return ();
1488     }
1489     my @rows;
1490     while (<C>) {
1491         next if m/^\#/;
1492         next unless m/\S/;
1493         die unless chomp;
1494         printdebug "dummycat query $csuite $package $dpath | $_\n";
1495         my @row = split /\s+/, $_;
1496         @row==2 or die "$dpath: $_ ?";
1497         push @rows, \@row;
1498     }
1499     C->error and die "$dpath: $!";
1500     close C;
1501     return archive_query_prepend_mirror
1502         sort { -version_compare($a->[0],$b->[0]); } @rows;
1503 }
1504
1505 sub file_in_archive_dummycat () { return undef; }
1506
1507 #---------- tag format handling ----------
1508
1509 sub access_cfg_tagformats () {
1510     split /\,/, access_cfg('dgit-tag-format');
1511 }
1512
1513 sub access_cfg_tagformats_can_splitbrain () {
1514     my %y = map { $_ => 1 } access_cfg_tagformats;
1515     foreach my $needtf (qw(new maint)) {
1516         next if $y{$needtf};
1517         return 0;
1518     }
1519     return 1;
1520 }
1521
1522 sub need_tagformat ($$) {
1523     my ($fmt, $why) = @_;
1524     fail "need to use tag format $fmt ($why) but also need".
1525         " to use tag format $tagformat_want->[0] ($tagformat_want->[1])".
1526         " - no way to proceed"
1527         if $tagformat_want && $tagformat_want->[0] ne $fmt;
1528     $tagformat_want = [$fmt, $why, $tagformat_want->[2] // 0];
1529 }
1530
1531 sub select_tagformat () {
1532     # sets $tagformatfn
1533     return if $tagformatfn && !$tagformat_want;
1534     die 'bug' if $tagformatfn && $tagformat_want;
1535     # ... $tagformat_want assigned after previous select_tagformat
1536
1537     my (@supported) = grep { $_ =~ m/^(?:old|new)$/ } access_cfg_tagformats();
1538     printdebug "select_tagformat supported @supported\n";
1539
1540     $tagformat_want //= [ $supported[0], "distro access configuration", 0 ];
1541     printdebug "select_tagformat specified @$tagformat_want\n";
1542
1543     my ($fmt,$why,$override) = @$tagformat_want;
1544
1545     fail "target distro supports tag formats @supported".
1546         " but have to use $fmt ($why)"
1547         unless $override
1548             or grep { $_ eq $fmt } @supported;
1549
1550     $tagformat_want = undef;
1551     $tagformat = $fmt;
1552     $tagformatfn = ${*::}{"debiantag_$fmt"};
1553
1554     fail "trying to use unknown tag format \`$fmt' ($why) !"
1555         unless $tagformatfn;
1556 }
1557
1558 #---------- archive query entrypoints and rest of program ----------
1559
1560 sub canonicalise_suite () {
1561     return if defined $csuite;
1562     fail "cannot operate on $isuite suite" if $isuite eq 'UNRELEASED';
1563     $csuite = archive_query('canonicalise_suite');
1564     if ($isuite ne $csuite) {
1565         progress "canonical suite name for $isuite is $csuite";
1566     } else {
1567         progress "canonical suite name is $csuite";
1568     }
1569 }
1570
1571 sub get_archive_dsc () {
1572     canonicalise_suite();
1573     my @vsns = archive_query('archive_query');
1574     foreach my $vinfo (@vsns) {
1575         my ($vsn,$vsn_dscurl,$digester,$digest) = @$vinfo;
1576         $dscurl = $vsn_dscurl;
1577         $dscdata = url_get($dscurl);
1578         if (!$dscdata) {
1579             $skew_warning_vsn = $vsn if !defined $skew_warning_vsn;
1580             next;
1581         }
1582         if ($digester) {
1583             $digester->reset();
1584             $digester->add($dscdata);
1585             my $got = $digester->hexdigest();
1586             $got eq $digest or
1587                 fail "$dscurl has hash $got but".
1588                     " archive told us to expect $digest";
1589         }
1590         parse_dscdata();
1591         my $fmt = getfield $dsc, 'Format';
1592         $format_ok{$fmt} or forceable_fail [qw(unsupported-source-format)],
1593             "unsupported source format $fmt, sorry";
1594             
1595         $dsc_checked = !!$digester;
1596         printdebug "get_archive_dsc: Version ".(getfield $dsc, 'Version')."\n";
1597         return;
1598     }
1599     $dsc = undef;
1600     printdebug "get_archive_dsc: nothing in archive, returning undef\n";
1601 }
1602
1603 sub check_for_git ();
1604 sub check_for_git () {
1605     # returns 0 or 1
1606     my $how = access_cfg('git-check');
1607     if ($how eq 'ssh-cmd') {
1608         my @cmd =
1609             (access_cfg_ssh, access_gituserhost(),
1610              access_runeinfo("git-check $package").
1611              " set -e; cd ".access_cfg('git-path').";".
1612              " if test -d $package.git; then echo 1; else echo 0; fi");
1613         my $r= cmdoutput @cmd;
1614         if (defined $r and $r =~ m/^divert (\w+)$/) {
1615             my $divert=$1;
1616             my ($usedistro,) = access_distros();
1617             # NB that if we are pushing, $usedistro will be $distro/push
1618             $instead_distro= cfg("dgit-distro.$usedistro.diverts.$divert");
1619             $instead_distro =~ s{^/}{ access_basedistro()."/" }e;
1620             progress "diverting to $divert (using config for $instead_distro)";
1621             return check_for_git();
1622         }
1623         failedcmd @cmd unless defined $r and $r =~ m/^[01]$/;
1624         return $r+0;
1625     } elsif ($how eq 'url') {
1626         my $prefix = access_cfg('git-check-url','git-url');
1627         my $suffix = access_cfg('git-check-suffix','git-suffix',
1628                                 'RETURN-UNDEF') // '.git';
1629         my $url = "$prefix/$package$suffix";
1630         my @cmd = (@curl, qw(-sS -I), $url);
1631         my $result = cmdoutput @cmd;
1632         $result =~ s/^\S+ 200 .*\n\r?\n//;
1633         # curl -sS -I with https_proxy prints
1634         # HTTP/1.0 200 Connection established
1635         $result =~ m/^\S+ (404|200) /s or
1636             fail "unexpected results from git check query - ".
1637                 Dumper($prefix, $result);
1638         my $code = $1;
1639         if ($code eq '404') {
1640             return 0;
1641         } elsif ($code eq '200') {
1642             return 1;
1643         } else {
1644             die;
1645         }
1646     } elsif ($how eq 'true') {
1647         return 1;
1648     } elsif ($how eq 'false') {
1649         return 0;
1650     } else {
1651         badcfg "unknown git-check \`$how'";
1652     }
1653 }
1654
1655 sub create_remote_git_repo () {
1656     my $how = access_cfg('git-create');
1657     if ($how eq 'ssh-cmd') {
1658         runcmd_ordryrun
1659             (access_cfg_ssh, access_gituserhost(),
1660              access_runeinfo("git-create $package").
1661              "set -e; cd ".access_cfg('git-path').";".
1662              " cp -a _template $package.git");
1663     } elsif ($how eq 'true') {
1664         # nothing to do
1665     } else {
1666         badcfg "unknown git-create \`$how'";
1667     }
1668 }
1669
1670 our ($dsc_hash,$lastpush_mergeinput);
1671 our ($dsc_distro, $dsc_hint_tag, $dsc_hint_url);
1672
1673
1674 sub prep_ud () {
1675     fresh_playground 'dgit/unpack';
1676 }
1677
1678 sub mktree_in_ud_here () {
1679     playtree_setup $gitcfgs{local};
1680 }
1681
1682 sub git_write_tree () {
1683     my $tree = cmdoutput @git, qw(write-tree);
1684     $tree =~ m/^\w+$/ or die "$tree ?";
1685     return $tree;
1686 }
1687
1688 sub git_add_write_tree () {
1689     runcmd @git, qw(add -Af .);
1690     return git_write_tree();
1691 }
1692
1693 sub remove_stray_gits ($) {
1694     my ($what) = @_;
1695     my @gitscmd = qw(find -name .git -prune -print0);
1696     debugcmd "|",@gitscmd;
1697     open GITS, "-|", @gitscmd or die $!;
1698     {
1699         local $/="\0";
1700         while (<GITS>) {
1701             chomp or die;
1702             print STDERR "$us: warning: removing from $what: ",
1703                 (messagequote $_), "\n";
1704             rmtree $_;
1705         }
1706     }
1707     $!=0; $?=0; close GITS or failedcmd @gitscmd;
1708 }
1709
1710 sub mktree_in_ud_from_only_subdir ($;$) {
1711     my ($what,$raw) = @_;
1712     # changes into the subdir
1713
1714     my (@dirs) = <*/.>;
1715     die "expected one subdir but found @dirs ?" unless @dirs==1;
1716     $dirs[0] =~ m#^([^/]+)/\.$# or die;
1717     my $dir = $1;
1718     changedir $dir;
1719
1720     remove_stray_gits($what);
1721     mktree_in_ud_here();
1722     if (!$raw) {
1723         my ($format, $fopts) = get_source_format();
1724         if (madformat($format)) {
1725             rmtree '.pc';
1726         }
1727     }
1728
1729     my $tree=git_add_write_tree();
1730     return ($tree,$dir);
1731 }
1732
1733 our @files_csum_info_fields = 
1734     (['Checksums-Sha256','Digest::SHA', 'new(256)', 'sha256sum'],
1735      ['Checksums-Sha1',  'Digest::SHA', 'new(1)',   'sha1sum'],
1736      ['Files',           'Digest::MD5', 'new()',    'md5sum']);
1737
1738 sub dsc_files_info () {
1739     foreach my $csumi (@files_csum_info_fields) {
1740         my ($fname, $module, $method) = @$csumi;
1741         my $field = $dsc->{$fname};
1742         next unless defined $field;
1743         eval "use $module; 1;" or die $@;
1744         my @out;
1745         foreach (split /\n/, $field) {
1746             next unless m/\S/;
1747             m/^(\w+) (\d+) (\S+)$/ or
1748                 fail "could not parse .dsc $fname line \`$_'";
1749             my $digester = eval "$module"."->$method;" or die $@;
1750             push @out, {
1751                 Hash => $1,
1752                 Bytes => $2,
1753                 Filename => $3,
1754                 Digester => $digester,
1755             };
1756         }
1757         return @out;
1758     }
1759     fail "missing any supported Checksums-* or Files field in ".
1760         $dsc->get_option('name');
1761 }
1762
1763 sub dsc_files () {
1764     map { $_->{Filename} } dsc_files_info();
1765 }
1766
1767 sub files_compare_inputs (@) {
1768     my $inputs = \@_;
1769     my %record;
1770     my %fchecked;
1771
1772     my $showinputs = sub {
1773         return join "; ", map { $_->get_option('name') } @$inputs;
1774     };
1775
1776     foreach my $in (@$inputs) {
1777         my $expected_files;
1778         my $in_name = $in->get_option('name');
1779
1780         printdebug "files_compare_inputs $in_name\n";
1781
1782         foreach my $csumi (@files_csum_info_fields) {
1783             my ($fname) = @$csumi;
1784             printdebug "files_compare_inputs $in_name $fname\n";
1785
1786             my $field = $in->{$fname};
1787             next unless defined $field;
1788
1789             my @files;
1790             foreach (split /\n/, $field) {
1791                 next unless m/\S/;
1792
1793                 my ($info, $f) = m/^(\w+ \d+) (?:\S+ \S+ )?(\S+)$/ or
1794                     fail "could not parse $in_name $fname line \`$_'";
1795
1796                 printdebug "files_compare_inputs $in_name $fname $f\n";
1797
1798                 push @files, $f;
1799
1800                 my $re = \ $record{$f}{$fname};
1801                 if (defined $$re) {
1802                     $fchecked{$f}{$in_name} = 1;
1803                     $$re eq $info or
1804                         fail "hash or size of $f varies in $fname fields".
1805                         " (between: ".$showinputs->().")";
1806                 } else {
1807                     $$re = $info;
1808                 }
1809             }
1810             @files = sort @files;
1811             $expected_files //= \@files;
1812             "@$expected_files" eq "@files" or
1813                 fail "file list in $in_name varies between hash fields!";
1814         }
1815         $expected_files or
1816             fail "$in_name has no files list field(s)";
1817     }
1818     printdebug "files_compare_inputs ".Dumper(\%fchecked, \%record)
1819         if $debuglevel>=2;
1820
1821     grep { keys %$_ == @$inputs-1 } values %fchecked
1822         or fail "no file appears in all file lists".
1823         " (looked in: ".$showinputs->().")";
1824 }
1825
1826 sub is_orig_file_in_dsc ($$) {
1827     my ($f, $dsc_files_info) = @_;
1828     return 0 if @$dsc_files_info <= 1;
1829     # One file means no origs, and the filename doesn't have a "what
1830     # part of dsc" component.  (Consider versions ending `.orig'.)
1831     return 0 unless $f =~ m/\.$orig_f_tail_re$/o;
1832     return 1;
1833 }
1834
1835 sub is_orig_file_of_vsn ($$) {
1836     my ($f, $upstreamvsn) = @_;
1837     my $base = srcfn $upstreamvsn, '';
1838     return 0 unless $f =~ m/^\Q$base\E\.$orig_f_tail_re$/;
1839     return 1;
1840 }
1841
1842 sub changes_update_origs_from_dsc ($$$$) {
1843     my ($dsc, $changes, $upstreamvsn, $changesfile) = @_;
1844     my %changes_f;
1845     printdebug "checking origs needed ($upstreamvsn)...\n";
1846     $_ = getfield $changes, 'Files';
1847     m/^\w+ \d+ (\S+ \S+) \S+$/m or
1848         fail "cannot find section/priority from .changes Files field";
1849     my $placementinfo = $1;
1850     my %changed;
1851     printdebug "checking origs needed placement '$placementinfo'...\n";
1852     foreach my $l (split /\n/, getfield $dsc, 'Files') {
1853         $l =~ m/\S+$/ or next;
1854         my $file = $&;
1855         printdebug "origs $file | $l\n";
1856         next unless is_orig_file_of_vsn $file, $upstreamvsn;
1857         printdebug "origs $file is_orig\n";
1858         my $have = archive_query('file_in_archive', $file);
1859         if (!defined $have) {
1860             print STDERR <<END;
1861 archive does not support .orig check; hope you used --ch:--sa/-sd if needed
1862 END
1863             return;
1864         }
1865         my $found_same = 0;
1866         my @found_differ;
1867         printdebug "origs $file \$#\$have=$#$have\n";
1868         foreach my $h (@$have) {
1869             my $same = 0;
1870             my @differ;
1871             foreach my $csumi (@files_csum_info_fields) {
1872                 my ($fname, $module, $method, $archivefield) = @$csumi;
1873                 next unless defined $h->{$archivefield};
1874                 $_ = $dsc->{$fname};
1875                 next unless defined;
1876                 m/^(\w+) .* \Q$file\E$/m or
1877                     fail ".dsc $fname missing entry for $file";
1878                 if ($h->{$archivefield} eq $1) {
1879                     $same++;
1880                 } else {
1881                     push @differ,
1882  "$archivefield: $h->{$archivefield} (archive) != $1 (local .dsc)";
1883                 }
1884             }
1885             die "$file ".Dumper($h)." ?!" if $same && @differ;
1886             $found_same++
1887                 if $same;
1888             push @found_differ, "archive $h->{filename}: ".join "; ", @differ
1889                 if @differ;
1890         }
1891         printdebug "origs $file f.same=$found_same".
1892             " #f._differ=$#found_differ\n";
1893         if (@found_differ && !$found_same) {
1894             fail join "\n",
1895                 "archive contains $file with different checksum",
1896                 @found_differ;
1897         }
1898         # Now we edit the changes file to add or remove it
1899         foreach my $csumi (@files_csum_info_fields) {
1900             my ($fname, $module, $method, $archivefield) = @$csumi;
1901             next unless defined $changes->{$fname};
1902             if ($found_same) {
1903                 # in archive, delete from .changes if it's there
1904                 $changed{$file} = "removed" if
1905                     $changes->{$fname} =~ s/^.* \Q$file\E$(?:)\n//m;
1906             } elsif ($changes->{$fname} =~ m/^.* \Q$file\E$(?:)\n/m) {
1907                 # not in archive, but it's here in the .changes
1908             } else {
1909                 my $dsc_data = getfield $dsc, $fname;
1910                 $dsc_data =~ m/^(.* \Q$file\E$)\n/m or die "$dsc_data $file ?";
1911                 my $extra = $1;
1912                 $extra =~ s/ \d+ /$&$placementinfo /
1913                     or die "$fname $extra >$dsc_data< ?"
1914                     if $fname eq 'Files';
1915                 $changes->{$fname} .= "\n". $extra;
1916                 $changed{$file} = "added";
1917             }
1918         }
1919     }
1920     if (%changed) {
1921         foreach my $file (keys %changed) {
1922             progress sprintf
1923                 "edited .changes for archive .orig contents: %s %s",
1924                 $changed{$file}, $file;
1925         }
1926         my $chtmp = "$changesfile.tmp";
1927         $changes->save($chtmp);
1928         if (act_local()) {
1929             rename $chtmp,$changesfile or die "$changesfile $!";
1930         } else {
1931             progress "[new .changes left in $changesfile]";
1932         }
1933     } else {
1934         progress "$changesfile already has appropriate .orig(s) (if any)";
1935     }
1936 }
1937
1938 sub make_commit ($) {
1939     my ($file) = @_;
1940     return cmdoutput @git, qw(hash-object -w -t commit), $file;
1941 }
1942
1943 sub make_commit_text ($) {
1944     my ($text) = @_;
1945     my ($out, $in);
1946     my @cmd = (@git, qw(hash-object -w -t commit --stdin));
1947     debugcmd "|",@cmd;
1948     print Dumper($text) if $debuglevel > 1;
1949     my $child = open2($out, $in, @cmd) or die $!;
1950     my $h;
1951     eval {
1952         print $in $text or die $!;
1953         close $in or die $!;
1954         $h = <$out>;
1955         $h =~ m/^\w+$/ or die;
1956         $h = $&;
1957         printdebug "=> $h\n";
1958     };
1959     close $out;
1960     waitpid $child, 0 == $child or die "$child $!";
1961     $? and failedcmd @cmd;
1962     return $h;
1963 }
1964
1965 sub clogp_authline ($) {
1966     my ($clogp) = @_;
1967     my $author = getfield $clogp, 'Maintainer';
1968     if ($author =~ m/^[^"\@]+\,/) {
1969         # single entry Maintainer field with unquoted comma
1970         $author = ($& =~ y/,//rd).$'; # strip the comma
1971     }
1972     # git wants a single author; any remaining commas in $author
1973     # are by now preceded by @ (or ").  It seems safer to punt on
1974     # "..." for now rather than attempting to dequote or something.
1975     $author =~ s#,.*##ms unless $author =~ m/"/;
1976     my $date = cmdoutput qw(date), '+%s %z', qw(-d), getfield($clogp,'Date');
1977     my $authline = "$author $date";
1978     $authline =~ m/$git_authline_re/o or
1979         fail "unexpected commit author line format \`$authline'".
1980         " (was generated from changelog Maintainer field)";
1981     return ($1,$2,$3) if wantarray;
1982     return $authline;
1983 }
1984
1985 sub vendor_patches_distro ($$) {
1986     my ($checkdistro, $what) = @_;
1987     return unless defined $checkdistro;
1988
1989     my $series = "debian/patches/\L$checkdistro\E.series";
1990     printdebug "checking for vendor-specific $series ($what)\n";
1991
1992     if (!open SERIES, "<", $series) {
1993         die "$series $!" unless $!==ENOENT;
1994         return;
1995     }
1996     while (<SERIES>) {
1997         next unless m/\S/;
1998         next if m/^\s+\#/;
1999
2000         print STDERR <<END;
2001
2002 Unfortunately, this source package uses a feature of dpkg-source where
2003 the same source package unpacks to different source code on different
2004 distros.  dgit cannot safely operate on such packages on affected
2005 distros, because the meaning of source packages is not stable.
2006
2007 Please ask the distro/maintainer to remove the distro-specific series
2008 files and use a different technique (if necessary, uploading actually
2009 different packages, if different distros are supposed to have
2010 different code).
2011
2012 END
2013         fail "Found active distro-specific series file for".
2014             " $checkdistro ($what): $series, cannot continue";
2015     }
2016     die "$series $!" if SERIES->error;
2017     close SERIES;
2018 }
2019
2020 sub check_for_vendor_patches () {
2021     # This dpkg-source feature doesn't seem to be documented anywhere!
2022     # But it can be found in the changelog (reformatted):
2023
2024     #   commit  4fa01b70df1dc4458daee306cfa1f987b69da58c
2025     #   Author: Raphael Hertzog <hertzog@debian.org>
2026     #   Date: Sun  Oct  3  09:36:48  2010 +0200
2027
2028     #   dpkg-source: correctly create .pc/.quilt_series with alternate
2029     #   series files
2030     #   
2031     #   If you have debian/patches/ubuntu.series and you were
2032     #   unpacking the source package on ubuntu, quilt was still
2033     #   directed to debian/patches/series instead of
2034     #   debian/patches/ubuntu.series.
2035     #   
2036     #   debian/changelog                        |    3 +++
2037     #   scripts/Dpkg/Source/Package/V3/quilt.pm |    4 +++-
2038     #   2 files changed, 6 insertions(+), 1 deletion(-)
2039
2040     use Dpkg::Vendor;
2041     vendor_patches_distro($ENV{DEB_VENDOR}, "DEB_VENDOR");
2042     vendor_patches_distro(Dpkg::Vendor::get_current_vendor(),
2043                          "Dpkg::Vendor \`current vendor'");
2044     vendor_patches_distro(access_basedistro(),
2045                           "(base) distro being accessed");
2046     vendor_patches_distro(access_nomdistro(),
2047                           "(nominal) distro being accessed");
2048 }
2049
2050 sub generate_commits_from_dsc () {
2051     # See big comment in fetch_from_archive, below.
2052     # See also README.dsc-import.
2053     prep_ud();
2054     changedir $playground;
2055
2056     my @dfi = dsc_files_info();
2057     foreach my $fi (@dfi) {
2058         my $f = $fi->{Filename};
2059         die "$f ?" if $f =~ m#/|^\.|\.dsc$|\.tmp$#;
2060         my $upper_f = "$maindir/../$f";
2061
2062         printdebug "considering reusing $f: ";
2063
2064         if (link_ltarget "$upper_f,fetch", $f) {
2065             printdebug "linked (using ...,fetch).\n";
2066         } elsif ((printdebug "($!) "),
2067                  $! != ENOENT) {
2068             fail "accessing ../$f,fetch: $!";
2069         } elsif (link_ltarget $upper_f, $f) {
2070             printdebug "linked.\n";
2071         } elsif ((printdebug "($!) "),
2072                  $! != ENOENT) {
2073             fail "accessing ../$f: $!";
2074         } else {
2075             printdebug "absent.\n";
2076         }
2077
2078         my $refetched;
2079         complete_file_from_dsc('.', $fi, \$refetched)
2080             or next;
2081
2082         printdebug "considering saving $f: ";
2083
2084         if (link $f, $upper_f) {
2085             printdebug "linked.\n";
2086         } elsif ((printdebug "($!) "),
2087                  $! != EEXIST) {
2088             fail "saving ../$f: $!";
2089         } elsif (!$refetched) {
2090             printdebug "no need.\n";
2091         } elsif (link $f, "$upper_f,fetch") {
2092             printdebug "linked (using ...,fetch).\n";
2093         } elsif ((printdebug "($!) "),
2094                  $! != EEXIST) {
2095             fail "saving ../$f,fetch: $!";
2096         } else {
2097             printdebug "cannot.\n";
2098         }
2099     }
2100
2101     # We unpack and record the orig tarballs first, so that we only
2102     # need disk space for one private copy of the unpacked source.
2103     # But we can't make them into commits until we have the metadata
2104     # from the debian/changelog, so we record the tree objects now and
2105     # make them into commits later.
2106     my @tartrees;
2107     my $upstreamv = upstreamversion $dsc->{version};
2108     my $orig_f_base = srcfn $upstreamv, '';
2109
2110     foreach my $fi (@dfi) {
2111         # We actually import, and record as a commit, every tarball
2112         # (unless there is only one file, in which case there seems
2113         # little point.
2114
2115         my $f = $fi->{Filename};
2116         printdebug "import considering $f ";
2117         (printdebug "only one dfi\n"), next if @dfi == 1;
2118         (printdebug "not tar\n"), next unless $f =~ m/\.tar(\.\w+)?$/;
2119         (printdebug "signature\n"), next if $f =~ m/$orig_f_sig_re$/o;
2120         my $compr_ext = $1;
2121
2122         my ($orig_f_part) =
2123             $f =~ m/^\Q$orig_f_base\E\.([^._]+)?\.tar(?:\.\w+)?$/;
2124
2125         printdebug "Y ", (join ' ', map { $_//"(none)" }
2126                           $compr_ext, $orig_f_part
2127                          ), "\n";
2128
2129         my $input = new IO::File $f, '<' or die "$f $!";
2130         my $compr_pid;
2131         my @compr_cmd;
2132
2133         if (defined $compr_ext) {
2134             my $cname =
2135                 Dpkg::Compression::compression_guess_from_filename $f;
2136             fail "Dpkg::Compression cannot handle file $f in source package"
2137                 if defined $compr_ext && !defined $cname;
2138             my $compr_proc =
2139                 new Dpkg::Compression::Process compression => $cname;
2140             @compr_cmd = $compr_proc->get_uncompress_cmdline();
2141             my $compr_fh = new IO::Handle;
2142             my $compr_pid = open $compr_fh, "-|" // die $!;
2143             if (!$compr_pid) {
2144                 open STDIN, "<&", $input or die $!;
2145                 exec @compr_cmd;
2146                 die "dgit (child): exec $compr_cmd[0]: $!\n";
2147             }
2148             $input = $compr_fh;
2149         }
2150
2151         rmtree "_unpack-tar";
2152         mkdir "_unpack-tar" or die $!;
2153         my @tarcmd = qw(tar -x -f -
2154                         --no-same-owner --no-same-permissions
2155                         --no-acls --no-xattrs --no-selinux);
2156         my $tar_pid = fork // die $!;
2157         if (!$tar_pid) {
2158             chdir "_unpack-tar" or die $!;
2159             open STDIN, "<&", $input or die $!;
2160             exec @tarcmd;
2161             die "dgit (child): exec $tarcmd[0]: $!";
2162         }
2163         $!=0; (waitpid $tar_pid, 0) == $tar_pid or die $!;
2164         !$? or failedcmd @tarcmd;
2165
2166         close $input or
2167             (@compr_cmd ? ($?==SIGPIPE || failedcmd @compr_cmd)
2168              : die $!);
2169         # finally, we have the results in "tarball", but maybe
2170         # with the wrong permissions
2171
2172         runcmd qw(chmod -R +rwX _unpack-tar);
2173         changedir "_unpack-tar";
2174         remove_stray_gits($f);
2175         mktree_in_ud_here();
2176         
2177         my ($tree) = git_add_write_tree();
2178         my $tentries = cmdoutput @git, qw(ls-tree -z), $tree;
2179         if ($tentries =~ m/^\d+ tree (\w+)\t[^\000]+\000$/s) {
2180             $tree = $1;
2181             printdebug "one subtree $1\n";
2182         } else {
2183             printdebug "multiple subtrees\n";
2184         }
2185         changedir "..";
2186         rmtree "_unpack-tar";
2187
2188         my $ent = [ $f, $tree ];
2189         push @tartrees, {
2190             Orig => !!$orig_f_part,
2191             Sort => (!$orig_f_part         ? 2 :
2192                      $orig_f_part =~ m/-/g ? 1 :
2193                                              0),
2194             F => $f,
2195             Tree => $tree,
2196         };
2197     }
2198
2199     @tartrees = sort {
2200         # put any without "_" first (spec is not clear whether files
2201         # are always in the usual order).  Tarballs without "_" are
2202         # the main orig or the debian tarball.
2203         $a->{Sort} <=> $b->{Sort} or
2204         $a->{F}    cmp $b->{F}
2205     } @tartrees;
2206
2207     my $any_orig = grep { $_->{Orig} } @tartrees;
2208
2209     my $dscfn = "$package.dsc";
2210
2211     my $treeimporthow = 'package';
2212
2213     open D, ">", $dscfn or die "$dscfn: $!";
2214     print D $dscdata or die "$dscfn: $!";
2215     close D or die "$dscfn: $!";
2216     my @cmd = qw(dpkg-source);
2217     push @cmd, '--no-check' if $dsc_checked;
2218     if (madformat $dsc->{format}) {
2219         push @cmd, '--skip-patches';
2220         $treeimporthow = 'unpatched';
2221     }
2222     push @cmd, qw(-x --), $dscfn;
2223     runcmd @cmd;
2224
2225     my ($tree,$dir) = mktree_in_ud_from_only_subdir("source package");
2226     if (madformat $dsc->{format}) { 
2227         check_for_vendor_patches();
2228     }
2229
2230     my $dappliedtree;
2231     if (madformat $dsc->{format}) {
2232         my @pcmd = qw(dpkg-source --before-build .);
2233         runcmd shell_cmd 'exec >/dev/null', @pcmd;
2234         rmtree '.pc';
2235         $dappliedtree = git_add_write_tree();
2236     }
2237
2238     my @clogcmd = qw(dpkg-parsechangelog --format rfc822 --all);
2239     debugcmd "|",@clogcmd;
2240     open CLOGS, "-|", @clogcmd or die $!;
2241
2242     my $clogp;
2243     my $r1clogp;
2244
2245     printdebug "import clog search...\n";
2246
2247     for (;;) {
2248         my $stanzatext = do { local $/=""; <CLOGS>; };
2249         printdebug "import clogp ".Dumper($stanzatext) if $debuglevel>1;
2250         last if !defined $stanzatext;
2251
2252         my $desc = "package changelog, entry no.$.";
2253         open my $stanzafh, "<", \$stanzatext or die;
2254         my $thisstanza = parsecontrolfh $stanzafh, $desc, 1;
2255         $clogp //= $thisstanza;
2256
2257         printdebug "import clog $thisstanza->{version} $desc...\n";
2258
2259         last if !$any_orig; # we don't need $r1clogp
2260
2261         # We look for the first (most recent) changelog entry whose
2262         # version number is lower than the upstream version of this
2263         # package.  Then the last (least recent) previous changelog
2264         # entry is treated as the one which introduced this upstream
2265         # version and used for the synthetic commits for the upstream
2266         # tarballs.
2267
2268         # One might think that a more sophisticated algorithm would be
2269         # necessary.  But: we do not want to scan the whole changelog
2270         # file.  Stopping when we see an earlier version, which
2271         # necessarily then is an earlier upstream version, is the only
2272         # realistic way to do that.  Then, either the earliest
2273         # changelog entry we have seen so far is indeed the earliest
2274         # upload of this upstream version; or there are only changelog
2275         # entries relating to later upstream versions (which is not
2276         # possible unless the changelog and .dsc disagree about the
2277         # version).  Then it remains to choose between the physically
2278         # last entry in the file, and the one with the lowest version
2279         # number.  If these are not the same, we guess that the
2280         # versions were created in a non-monotic order rather than
2281         # that the changelog entries have been misordered.
2282
2283         printdebug "import clog $thisstanza->{version} vs $upstreamv...\n";
2284
2285         last if version_compare($thisstanza->{version}, $upstreamv) < 0;
2286         $r1clogp = $thisstanza;
2287
2288         printdebug "import clog $r1clogp->{version} becomes r1\n";
2289     }
2290     die $! if CLOGS->error;
2291     close CLOGS or $?==SIGPIPE or failedcmd @clogcmd;
2292
2293     $clogp or fail "package changelog has no entries!";
2294
2295     my $authline = clogp_authline $clogp;
2296     my $changes = getfield $clogp, 'Changes';
2297     $changes =~ s/^\n//; # Changes: \n
2298     my $cversion = getfield $clogp, 'Version';
2299
2300     if (@tartrees) {
2301         $r1clogp //= $clogp; # maybe there's only one entry;
2302         my $r1authline = clogp_authline $r1clogp;
2303         # Strictly, r1authline might now be wrong if it's going to be
2304         # unused because !$any_orig.  Whatever.
2305
2306         printdebug "import tartrees authline   $authline\n";
2307         printdebug "import tartrees r1authline $r1authline\n";
2308
2309         foreach my $tt (@tartrees) {
2310             printdebug "import tartree $tt->{F} $tt->{Tree}\n";
2311
2312             $tt->{Commit} = make_commit_text($tt->{Orig} ? <<END_O : <<END_T);
2313 tree $tt->{Tree}
2314 author $r1authline
2315 committer $r1authline
2316
2317 Import $tt->{F}
2318
2319 [dgit import orig $tt->{F}]
2320 END_O
2321 tree $tt->{Tree}
2322 author $authline
2323 committer $authline
2324
2325 Import $tt->{F}
2326
2327 [dgit import tarball $package $cversion $tt->{F}]
2328 END_T
2329         }
2330     }
2331
2332     printdebug "import main commit\n";
2333
2334     open C, ">../commit.tmp" or die $!;
2335     print C <<END or die $!;
2336 tree $tree
2337 END
2338     print C <<END or die $! foreach @tartrees;
2339 parent $_->{Commit}
2340 END
2341     print C <<END or die $!;
2342 author $authline
2343 committer $authline
2344
2345 $changes
2346
2347 [dgit import $treeimporthow $package $cversion]
2348 END
2349
2350     close C or die $!;
2351     my $rawimport_hash = make_commit qw(../commit.tmp);
2352
2353     if (madformat $dsc->{format}) {
2354         printdebug "import apply patches...\n";
2355
2356         # regularise the state of the working tree so that
2357         # the checkout of $rawimport_hash works nicely.
2358         my $dappliedcommit = make_commit_text(<<END);
2359 tree $dappliedtree
2360 author $authline
2361 committer $authline
2362
2363 [dgit dummy commit]
2364 END
2365         runcmd @git, qw(checkout -q -b dapplied), $dappliedcommit;
2366
2367         runcmd @git, qw(checkout -q -b unpa), $rawimport_hash;
2368
2369         # We need the answers to be reproducible
2370         my @authline = clogp_authline($clogp);
2371         local $ENV{GIT_COMMITTER_NAME} =  $authline[0];
2372         local $ENV{GIT_COMMITTER_EMAIL} = $authline[1];
2373         local $ENV{GIT_COMMITTER_DATE} =  $authline[2];
2374         local $ENV{GIT_AUTHOR_NAME} =  $authline[0];
2375         local $ENV{GIT_AUTHOR_EMAIL} = $authline[1];
2376         local $ENV{GIT_AUTHOR_DATE} =  $authline[2];
2377
2378         my $path = $ENV{PATH} or die;
2379         
2380         # we use ../../gbp-pq-output, which (given that we are in
2381         # $playground/PLAYTREE, and $playground is .git/dgit/unpack,
2382         # is .git/dgit.
2383
2384         foreach my $use_absurd (qw(0 1)) {
2385             runcmd @git, qw(checkout -q unpa);
2386             runcmd @git, qw(update-ref -d refs/heads/patch-queue/unpa);
2387             local $ENV{PATH} = $path;
2388             if ($use_absurd) {
2389                 chomp $@;
2390                 progress "warning: $@";
2391                 $path = "$absurdity:$path";
2392                 progress "$us: trying slow absurd-git-apply...";
2393                 rename "../../gbp-pq-output","../../gbp-pq-output.0"
2394                     or $!==ENOENT
2395                     or die $!;
2396             }
2397             eval {
2398                 die "forbid absurd git-apply\n" if $use_absurd
2399                     && forceing [qw(import-gitapply-no-absurd)];
2400                 die "only absurd git-apply!\n" if !$use_absurd
2401                     && forceing [qw(import-gitapply-absurd)];
2402
2403                 local $ENV{DGIT_ABSURD_DEBUG} = $debuglevel if $use_absurd;
2404                 local $ENV{PATH} = $path                    if $use_absurd;
2405
2406                 my @showcmd = (gbp_pq, qw(import));
2407                 my @realcmd = shell_cmd
2408                     'exec >/dev/null 2>>../../gbp-pq-output', @showcmd;
2409                 debugcmd "+",@realcmd;
2410                 if (system @realcmd) {
2411                     die +(shellquote @showcmd).
2412                         " failed: ".
2413                         failedcmd_waitstatus()."\n";
2414                 }
2415
2416                 my $gapplied = git_rev_parse('HEAD');
2417                 my $gappliedtree = cmdoutput @git, qw(rev-parse HEAD:);
2418                 $gappliedtree eq $dappliedtree or
2419                     fail <<END;
2420 gbp-pq import and dpkg-source disagree!
2421  gbp-pq import gave commit $gapplied
2422  gbp-pq import gave tree $gappliedtree
2423  dpkg-source --before-build gave tree $dappliedtree
2424 END
2425                 $rawimport_hash = $gapplied;
2426             };
2427             last unless $@;
2428         }
2429         if ($@) {
2430             { local $@; eval { runcmd qw(cat ../../gbp-pq-output); }; }
2431             die $@;
2432         }
2433     }
2434
2435     progress "synthesised git commit from .dsc $cversion";
2436
2437     my $rawimport_mergeinput = {
2438         Commit => $rawimport_hash,
2439         Info => "Import of source package",
2440     };
2441     my @output = ($rawimport_mergeinput);
2442
2443     if ($lastpush_mergeinput) {
2444         my $oldclogp = mergeinfo_getclogp($lastpush_mergeinput);
2445         my $oversion = getfield $oldclogp, 'Version';
2446         my $vcmp =
2447             version_compare($oversion, $cversion);
2448         if ($vcmp < 0) {
2449             @output = ($rawimport_mergeinput, $lastpush_mergeinput,
2450                 { Message => <<END, ReverseParents => 1 });
2451 Record $package ($cversion) in archive suite $csuite
2452 END
2453         } elsif ($vcmp > 0) {
2454             print STDERR <<END or die $!;
2455
2456 Version actually in archive:   $cversion (older)
2457 Last version pushed with dgit: $oversion (newer or same)
2458 $later_warning_msg
2459 END
2460             @output = $lastpush_mergeinput;
2461         } else {
2462             # Same version.  Use what's in the server git branch,
2463             # discarding our own import.  (This could happen if the
2464             # server automatically imports all packages into git.)
2465             @output = $lastpush_mergeinput;
2466         }
2467     }
2468     changedir $maindir;
2469     rmtree $playground;
2470     return @output;
2471 }
2472
2473 sub complete_file_from_dsc ($$;$) {
2474     our ($dstdir, $fi, $refetched) = @_;
2475     # Ensures that we have, in $dstdir, the file $fi, with the correct
2476     # contents.  (Downloading it from alongside $dscurl if necessary.)
2477     # If $refetched is defined, can overwrite "$dstdir/$fi->{Filename}"
2478     # and will set $$refetched=1 if it did so (or tried to).
2479
2480     my $f = $fi->{Filename};
2481     my $tf = "$dstdir/$f";
2482     my $downloaded = 0;
2483
2484     my $got;
2485     my $checkhash = sub {
2486         open F, "<", "$tf" or die "$tf: $!";
2487         $fi->{Digester}->reset();
2488         $fi->{Digester}->addfile(*F);
2489         F->error and die $!;
2490         $got = $fi->{Digester}->hexdigest();
2491         return $got eq $fi->{Hash};
2492     };
2493
2494     if (stat_exists $tf) {
2495         if ($checkhash->()) {
2496             progress "using existing $f";
2497             return 1;
2498         }
2499         if (!$refetched) {
2500             fail "file $f has hash $got but .dsc".
2501                 " demands hash $fi->{Hash} ".
2502                 "(perhaps you should delete this file?)";
2503         }
2504         progress "need to fetch correct version of $f";
2505         unlink $tf or die "$tf $!";
2506         $$refetched = 1;
2507     } else {
2508         printdebug "$tf does not exist, need to fetch\n";
2509     }
2510
2511     my $furl = $dscurl;
2512     $furl =~ s{/[^/]+$}{};
2513     $furl .= "/$f";
2514     die "$f ?" unless $f =~ m/^\Q${package}\E_/;
2515     die "$f ?" if $f =~ m#/#;
2516     runcmd_ordryrun_local @curl,qw(-f -o),$tf,'--',"$furl";
2517     return 0 if !act_local();
2518
2519     $checkhash->() or
2520         fail "file $f has hash $got but .dsc".
2521             " demands hash $fi->{Hash} ".
2522             "(got wrong file from archive!)";
2523
2524     return 1;
2525 }
2526
2527 sub ensure_we_have_orig () {
2528     my @dfi = dsc_files_info();
2529     foreach my $fi (@dfi) {
2530         my $f = $fi->{Filename};
2531         next unless is_orig_file_in_dsc($f, \@dfi);
2532         complete_file_from_dsc('..', $fi)
2533             or next;
2534     }
2535 }
2536
2537 #---------- git fetch ----------
2538
2539 sub lrfetchrefs () { return "refs/dgit-fetch/".access_basedistro(); }
2540 sub lrfetchref () { return lrfetchrefs.'/'.server_branch($csuite); }
2541
2542 # We fetch some parts of lrfetchrefs/*.  Ideally we delete these
2543 # locally fetched refs because they have unhelpful names and clutter
2544 # up gitk etc.  So we track whether we have "used up" head ref (ie,
2545 # whether we have made another local ref which refers to this object).
2546 #
2547 # (If we deleted them unconditionally, then we might end up
2548 # re-fetching the same git objects each time dgit fetch was run.)
2549 #
2550 # So, each use of lrfetchrefs needs to be accompanied by arrangements
2551 # in git_fetch_us to fetch the refs in question, and possibly a call
2552 # to lrfetchref_used.
2553
2554 our (%lrfetchrefs_f, %lrfetchrefs_d);
2555 # $lrfetchrefs_X{lrfetchrefs."/heads/whatever"} = $objid
2556
2557 sub lrfetchref_used ($) {
2558     my ($fullrefname) = @_;
2559     my $objid = $lrfetchrefs_f{$fullrefname};
2560     $lrfetchrefs_d{$fullrefname} = $objid if defined $objid;
2561 }
2562
2563 sub git_lrfetch_sane {
2564     my ($url, $supplementary, @specs) = @_;
2565     # Make a 'refs/'.lrfetchrefs.'/*' be just like on server,
2566     # at least as regards @specs.  Also leave the results in
2567     # %lrfetchrefs_f, and arrange for lrfetchref_used to be
2568     # able to clean these up.
2569     #
2570     # With $supplementary==1, @specs must not contain wildcards
2571     # and we add to our previous fetches (non-atomically).
2572
2573     # This is rather miserable:
2574     # When git fetch --prune is passed a fetchspec ending with a *,
2575     # it does a plausible thing.  If there is no * then:
2576     # - it matches subpaths too, even if the supplied refspec
2577     #   starts refs, and behaves completely madly if the source
2578     #   has refs/refs/something.  (See, for example, Debian #NNNN.)
2579     # - if there is no matching remote ref, it bombs out the whole
2580     #   fetch.
2581     # We want to fetch a fixed ref, and we don't know in advance
2582     # if it exists, so this is not suitable.
2583     #
2584     # Our workaround is to use git ls-remote.  git ls-remote has its
2585     # own qairks.  Notably, it has the absurd multi-tail-matching
2586     # behaviour: git ls-remote R refs/foo can report refs/foo AND
2587     # refs/refs/foo etc.
2588     #
2589     # Also, we want an idempotent snapshot, but we have to make two
2590     # calls to the remote: one to git ls-remote and to git fetch.  The
2591     # solution is use git ls-remote to obtain a target state, and
2592     # git fetch to try to generate it.  If we don't manage to generate
2593     # the target state, we try again.
2594
2595     printdebug "git_lrfetch_sane suppl=$supplementary specs @specs\n";
2596
2597     my $specre = join '|', map {
2598         my $x = $_;
2599         $x =~ s/\W/\\$&/g;
2600         my $wildcard = $x =~ s/\\\*$/.*/;
2601         die if $wildcard && $supplementary;
2602         "(?:refs/$x)";
2603     } @specs;
2604     printdebug "git_lrfetch_sane specre=$specre\n";
2605     my $wanted_rref = sub {
2606         local ($_) = @_;
2607         return m/^(?:$specre)$/;
2608     };
2609
2610     my $fetch_iteration = 0;
2611     FETCH_ITERATION:
2612     for (;;) {
2613         printdebug "git_lrfetch_sane iteration $fetch_iteration\n";
2614         if (++$fetch_iteration > 10) {
2615             fail "too many iterations trying to get sane fetch!";
2616         }
2617
2618         my @look = map { "refs/$_" } @specs;
2619         my @lcmd = (@git, qw(ls-remote -q --refs), $url, @look);
2620         debugcmd "|",@lcmd;
2621
2622         my %wantr;
2623         open GITLS, "-|", @lcmd or die $!;
2624         while (<GITLS>) {
2625             printdebug "=> ", $_;
2626             m/^(\w+)\s+(\S+)\n/ or die "ls-remote $_ ?";
2627             my ($objid,$rrefname) = ($1,$2);
2628             if (!$wanted_rref->($rrefname)) {
2629                 print STDERR <<END;
2630 warning: git ls-remote @look reported $rrefname; this is silly, ignoring it.
2631 END
2632                 next;
2633             }
2634             $wantr{$rrefname} = $objid;
2635         }
2636         $!=0; $?=0;
2637         close GITLS or failedcmd @lcmd;
2638
2639         # OK, now %want is exactly what we want for refs in @specs
2640         my @fspecs = map {
2641             !m/\*$/ && !exists $wantr{"refs/$_"} ? () :
2642             "+refs/$_:".lrfetchrefs."/$_";
2643         } @specs;
2644
2645         printdebug "git_lrfetch_sane fspecs @fspecs\n";
2646
2647         my @fcmd = (@git, qw(fetch -p -n -q), $url, @fspecs);
2648         runcmd_ordryrun_local @fcmd if @fspecs;
2649
2650         if (!$supplementary) {
2651             %lrfetchrefs_f = ();
2652         }
2653         my %objgot;
2654
2655         git_for_each_ref(lrfetchrefs, sub {
2656             my ($objid,$objtype,$lrefname,$reftail) = @_;
2657             $lrfetchrefs_f{$lrefname} = $objid;
2658             $objgot{$objid} = 1;
2659         });
2660
2661         if ($supplementary) {
2662             last;
2663         }
2664
2665         foreach my $lrefname (sort keys %lrfetchrefs_f) {
2666             my $rrefname = 'refs'.substr($lrefname, length lrfetchrefs);
2667             if (!exists $wantr{$rrefname}) {
2668                 if ($wanted_rref->($rrefname)) {
2669                     printdebug <<END;
2670 git-fetch @fspecs created $lrefname which git ls-remote @look didn't list.
2671 END
2672                 } else {
2673                     print STDERR <<END
2674 warning: git fetch @fspecs created $lrefname; this is silly, deleting it.
2675 END
2676                 }
2677                 runcmd_ordryrun_local @git, qw(update-ref -d), $lrefname;
2678                 delete $lrfetchrefs_f{$lrefname};
2679                 next;
2680             }
2681         }
2682         foreach my $rrefname (sort keys %wantr) {
2683             my $lrefname = lrfetchrefs.substr($rrefname, 4);
2684             my $got = $lrfetchrefs_f{$lrefname} // '<none>';
2685             my $want = $wantr{$rrefname};
2686             next if $got eq $want;
2687             if (!defined $objgot{$want}) {
2688                 print STDERR <<END;
2689 warning: git ls-remote suggests we want $lrefname
2690 warning:  and it should refer to $want
2691 warning:  but git fetch didn't fetch that object to any relevant ref.
2692 warning:  This may be due to a race with someone updating the server.
2693 warning:  Will try again...
2694 END
2695                 next FETCH_ITERATION;
2696             }
2697             printdebug <<END;
2698 git-fetch @fspecs made $lrefname=$got but want git ls-remote @look says $want
2699 END
2700             runcmd_ordryrun_local @git, qw(update-ref -m),
2701                 "dgit fetch git fetch fixup", $lrefname, $want;
2702             $lrfetchrefs_f{$lrefname} = $want;
2703         }
2704         last;
2705     }
2706
2707     if (defined $csuite) {
2708         printdebug "git_lrfetch_sane: tidying any old suite lrfetchrefs\n";
2709         git_for_each_ref("refs/dgit-fetch/$csuite", sub {
2710             my ($objid,$objtype,$lrefname,$reftail) = @_;
2711             next if $lrfetchrefs_f{$lrefname}; # $csuite eq $distro ?
2712             runcmd_ordryrun_local @git, qw(update-ref -d), $lrefname;
2713         });
2714     }
2715
2716     printdebug "git_lrfetch_sane: git fetch --no-insane emulation complete\n",
2717         Dumper(\%lrfetchrefs_f);
2718 }
2719
2720 sub git_fetch_us () {
2721     # Want to fetch only what we are going to use, unless
2722     # deliberately-not-ff, in which case we must fetch everything.
2723
2724     my @specs = deliberately_not_fast_forward ? qw(tags/*) :
2725         map { "tags/$_" }
2726         (quiltmode_splitbrain
2727          ? (map { $_->('*',access_nomdistro) }
2728             \&debiantag_new, \&debiantag_maintview)
2729          : debiantags('*',access_nomdistro));
2730     push @specs, server_branch($csuite);
2731     push @specs, $rewritemap;
2732     push @specs, qw(heads/*) if deliberately_not_fast_forward;
2733
2734     my $url = access_giturl();
2735     git_lrfetch_sane $url, 0, @specs;
2736
2737     my %here;
2738     my @tagpats = debiantags('*',access_nomdistro);
2739
2740     git_for_each_ref([map { "refs/tags/$_" } @tagpats], sub {
2741         my ($objid,$objtype,$fullrefname,$reftail) = @_;
2742         printdebug "currently $fullrefname=$objid\n";
2743         $here{$fullrefname} = $objid;
2744     });
2745     git_for_each_ref([map { lrfetchrefs."/tags/".$_ } @tagpats], sub {
2746         my ($objid,$objtype,$fullrefname,$reftail) = @_;
2747         my $lref = "refs".substr($fullrefname, length(lrfetchrefs));
2748         printdebug "offered $lref=$objid\n";
2749         if (!defined $here{$lref}) {
2750             my @upd = (@git, qw(update-ref), $lref, $objid, '');
2751             runcmd_ordryrun_local @upd;
2752             lrfetchref_used $fullrefname;
2753         } elsif ($here{$lref} eq $objid) {
2754             lrfetchref_used $fullrefname;
2755         } else {
2756             print STDERR
2757                 "Not updating $lref from $here{$lref} to $objid.\n";
2758         }
2759     });
2760 }
2761
2762 #---------- dsc and archive handling ----------
2763
2764 sub mergeinfo_getclogp ($) {
2765     # Ensures thit $mi->{Clogp} exists and returns it
2766     my ($mi) = @_;
2767     $mi->{Clogp} = commit_getclogp($mi->{Commit});
2768 }
2769
2770 sub mergeinfo_version ($) {
2771     return getfield( (mergeinfo_getclogp $_[0]), 'Version' );
2772 }
2773
2774 sub fetch_from_archive_record_1 ($) {
2775     my ($hash) = @_;
2776     runcmd @git, qw(update-ref -m), "dgit fetch $csuite",
2777             'DGIT_ARCHIVE', $hash;
2778     cmdoutput @git, qw(log -n2), $hash;
2779     # ... gives git a chance to complain if our commit is malformed
2780 }
2781
2782 sub fetch_from_archive_record_2 ($) {
2783     my ($hash) = @_;
2784     my @upd_cmd = (@git, qw(update-ref -m), 'dgit fetch', lrref(), $hash);
2785     if (act_local()) {
2786         cmdoutput @upd_cmd;
2787     } else {
2788         dryrun_report @upd_cmd;
2789     }
2790 }
2791
2792 sub parse_dsc_field_def_dsc_distro () {
2793     $dsc_distro //= cfg qw(dgit.default.old-dsc-distro
2794                            dgit.default.distro);
2795 }
2796
2797 sub parse_dsc_field ($$) {
2798     my ($dsc, $what) = @_;
2799     my $f;
2800     foreach my $field (@ourdscfield) {
2801         $f = $dsc->{$field};
2802         last if defined $f;
2803     }
2804
2805     if (!defined $f) {
2806         progress "$what: NO git hash";
2807         parse_dsc_field_def_dsc_distro();
2808     } elsif (($dsc_hash, $dsc_distro, $dsc_hint_tag, $dsc_hint_url)
2809              = $f =~ m/^(\w+)\s+($distro_re)\s+($versiontag_re)\s+(\S+)(?:\s|$)/) {
2810         progress "$what: specified git info ($dsc_distro)";
2811         $dsc_hint_tag = [ $dsc_hint_tag ];
2812     } elsif ($f =~ m/^\w+\s*$/) {
2813         $dsc_hash = $&;
2814         parse_dsc_field_def_dsc_distro();
2815         $dsc_hint_tag = [ debiantags +(getfield $dsc, 'Version'),
2816                           $dsc_distro ];
2817         progress "$what: specified git hash";
2818     } else {
2819         fail "$what: invalid Dgit info";
2820     }
2821 }
2822
2823 sub resolve_dsc_field_commit ($$) {
2824     my ($already_distro, $already_mapref) = @_;
2825
2826     return unless defined $dsc_hash;
2827
2828     my $mapref =
2829         defined $already_mapref &&
2830         ($already_distro eq $dsc_distro || !$chase_dsc_distro)
2831         ? $already_mapref : undef;
2832
2833     my $do_fetch;
2834     $do_fetch = sub {
2835         my ($what, @fetch) = @_;
2836
2837         local $idistro = $dsc_distro;
2838         my $lrf = lrfetchrefs;
2839
2840         if (!$chase_dsc_distro) {
2841             progress
2842                 "not chasing .dsc distro $dsc_distro: not fetching $what";
2843             return 0;
2844         }
2845
2846         progress
2847             ".dsc names distro $dsc_distro: fetching $what";
2848
2849         my $url = access_giturl();
2850         if (!defined $url) {
2851             defined $dsc_hint_url or fail <<END;
2852 .dsc Dgit metadata is in context of distro $dsc_distro
2853 for which we have no configured url and .dsc provides no hint
2854 END
2855             my $proto =
2856                 $dsc_hint_url =~ m#^([-+0-9a-zA-Z]+):# ? $1 :
2857                 $dsc_hint_url =~ m#^/# ? 'file' : 'bad-syntax';
2858             parse_cfg_bool "dsc-url-proto-ok", 'false',
2859                 cfg("dgit.dsc-url-proto-ok.$proto",
2860                     "dgit.default.dsc-url-proto-ok")
2861                 or fail <<END;
2862 .dsc Dgit metadata is in context of distro $dsc_distro
2863 for which we have no configured url;
2864 .dsc provides hinted url with protocol $proto which is unsafe.
2865 (can be overridden by config - consult documentation)
2866 END
2867             $url = $dsc_hint_url;
2868         }
2869
2870         git_lrfetch_sane $url, 1, @fetch;
2871
2872         return $lrf;
2873     };
2874
2875     my $rewrite_enable = do {
2876         local $idistro = $dsc_distro;
2877         access_cfg('rewrite-map-enable', 'RETURN-UNDEF');
2878     };
2879
2880     if (parse_cfg_bool 'rewrite-map-enable', 'true', $rewrite_enable) {
2881         if (!defined $mapref) {
2882             my $lrf = $do_fetch->("rewrite map", $rewritemap) or return;
2883             $mapref = $lrf.'/'.$rewritemap;
2884         }
2885         my $rewritemapdata = git_cat_file $mapref.':map';
2886         if (defined $rewritemapdata
2887             && $rewritemapdata =~ m/^$dsc_hash(?:[ \t](\w+))/m) {
2888             progress
2889                 "server's git history rewrite map contains a relevant entry!";
2890
2891             $dsc_hash = $1;
2892             if (defined $dsc_hash) {
2893                 progress "using rewritten git hash in place of .dsc value";
2894             } else {
2895                 progress "server data says .dsc hash is to be disregarded";
2896             }
2897         }
2898     }
2899
2900     if (!defined git_cat_file $dsc_hash) {
2901         my @tags = map { "tags/".$_ } @$dsc_hint_tag;
2902         my $lrf = $do_fetch->("additional commits", @tags) &&
2903             defined git_cat_file $dsc_hash
2904             or fail <<END;
2905 .dsc Dgit metadata requires commit $dsc_hash
2906 but we could not obtain that object anywhere.
2907 END
2908         foreach my $t (@tags) {
2909             my $fullrefname = $lrf.'/'.$t;
2910 #           print STDERR "CHK $t $fullrefname ".Dumper(\%lrfetchrefs_f);
2911             next unless $lrfetchrefs_f{$fullrefname};
2912             next unless is_fast_fwd "$fullrefname~0", $dsc_hash;
2913             lrfetchref_used $fullrefname;
2914         }
2915     }
2916 }
2917
2918 sub fetch_from_archive () {
2919     ensure_setup_existing_tree();
2920
2921     # Ensures that lrref() is what is actually in the archive, one way
2922     # or another, according to us - ie this client's
2923     # appropritaely-updated archive view.  Also returns the commit id.
2924     # If there is nothing in the archive, leaves lrref alone and
2925     # returns undef.  git_fetch_us must have already been called.
2926     get_archive_dsc();
2927
2928     if ($dsc) {
2929         parse_dsc_field($dsc, 'last upload to archive');
2930         resolve_dsc_field_commit access_basedistro,
2931             lrfetchrefs."/".$rewritemap
2932     } else {
2933         progress "no version available from the archive";
2934     }
2935
2936     # If the archive's .dsc has a Dgit field, there are three
2937     # relevant git commitids we need to choose between and/or merge
2938     # together:
2939     #   1. $dsc_hash: the Dgit field from the archive
2940     #   2. $lastpush_hash: the suite branch on the dgit git server
2941     #   3. $lastfetch_hash: our local tracking brach for the suite
2942     #
2943     # These may all be distinct and need not be in any fast forward
2944     # relationship:
2945     #
2946     # If the dsc was pushed to this suite, then the server suite
2947     # branch will have been updated; but it might have been pushed to
2948     # a different suite and copied by the archive.  Conversely a more
2949     # recent version may have been pushed with dgit but not appeared
2950     # in the archive (yet).
2951     #
2952     # $lastfetch_hash may be awkward because archive imports
2953     # (particularly, imports of Dgit-less .dscs) are performed only as
2954     # needed on individual clients, so different clients may perform a
2955     # different subset of them - and these imports are only made
2956     # public during push.  So $lastfetch_hash may represent a set of
2957     # imports different to a subsequent upload by a different dgit
2958     # client.
2959     #
2960     # Our approach is as follows:
2961     #
2962     # As between $dsc_hash and $lastpush_hash: if $lastpush_hash is a
2963     # descendant of $dsc_hash, then it was pushed by a dgit user who
2964     # had based their work on $dsc_hash, so we should prefer it.
2965     # Otherwise, $dsc_hash was installed into this suite in the
2966     # archive other than by a dgit push, and (necessarily) after the
2967     # last dgit push into that suite (since a dgit push would have
2968     # been descended from the dgit server git branch); thus, in that
2969     # case, we prefer the archive's version (and produce a
2970     # pseudo-merge to overwrite the dgit server git branch).
2971     #
2972     # (If there is no Dgit field in the archive's .dsc then
2973     # generate_commit_from_dsc uses the version numbers to decide
2974     # whether the suite branch or the archive is newer.  If the suite
2975     # branch is newer it ignores the archive's .dsc; otherwise it
2976     # generates an import of the .dsc, and produces a pseudo-merge to
2977     # overwrite the suite branch with the archive contents.)
2978     #
2979     # The outcome of that part of the algorithm is the `public view',
2980     # and is same for all dgit clients: it does not depend on any
2981     # unpublished history in the local tracking branch.
2982     #
2983     # As between the public view and the local tracking branch: The
2984     # local tracking branch is only updated by dgit fetch, and
2985     # whenever dgit fetch runs it includes the public view in the
2986     # local tracking branch.  Therefore if the public view is not
2987     # descended from the local tracking branch, the local tracking
2988     # branch must contain history which was imported from the archive
2989     # but never pushed; and, its tip is now out of date.  So, we make
2990     # a pseudo-merge to overwrite the old imports and stitch the old
2991     # history in.
2992     #
2993     # Finally: we do not necessarily reify the public view (as
2994     # described above).  This is so that we do not end up stacking two
2995     # pseudo-merges.  So what we actually do is figure out the inputs
2996     # to any public view pseudo-merge and put them in @mergeinputs.
2997
2998     my @mergeinputs;
2999     # $mergeinputs[]{Commit}
3000     # $mergeinputs[]{Info}
3001     # $mergeinputs[0] is the one whose tree we use
3002     # @mergeinputs is in the order we use in the actual commit)
3003     #
3004     # Also:
3005     # $mergeinputs[]{Message} is a commit message to use
3006     # $mergeinputs[]{ReverseParents} if def specifies that parent
3007     #                                list should be in opposite order
3008     # Such an entry has no Commit or Info.  It applies only when found
3009     # in the last entry.  (This ugliness is to support making
3010     # identical imports to previous dgit versions.)
3011
3012     my $lastpush_hash = git_get_ref(lrfetchref());
3013     printdebug "previous reference hash=$lastpush_hash\n";
3014     $lastpush_mergeinput = $lastpush_hash && {
3015         Commit => $lastpush_hash,
3016         Info => "dgit suite branch on dgit git server",
3017     };
3018
3019     my $lastfetch_hash = git_get_ref(lrref());
3020     printdebug "fetch_from_archive: lastfetch=$lastfetch_hash\n";
3021     my $lastfetch_mergeinput = $lastfetch_hash && {
3022         Commit => $lastfetch_hash,
3023         Info => "dgit client's archive history view",
3024     };
3025
3026     my $dsc_mergeinput = $dsc_hash && {
3027         Commit => $dsc_hash,
3028         Info => "Dgit field in .dsc from archive",
3029     };
3030
3031     my $cwd = getcwd();
3032     my $del_lrfetchrefs = sub {
3033         changedir $cwd;
3034         my $gur;
3035         printdebug "del_lrfetchrefs...\n";
3036         foreach my $fullrefname (sort keys %lrfetchrefs_d) {
3037             my $objid = $lrfetchrefs_d{$fullrefname};
3038             printdebug "del_lrfetchrefs: $objid $fullrefname\n";
3039             if (!$gur) {
3040                 $gur ||= new IO::Handle;
3041                 open $gur, "|-", qw(git update-ref --stdin) or die $!;
3042             }
3043             printf $gur "delete %s %s\n", $fullrefname, $objid;
3044         }
3045         if ($gur) {
3046             close $gur or failedcmd "git update-ref delete lrfetchrefs";
3047         }
3048     };
3049
3050     if (defined $dsc_hash) {
3051         ensure_we_have_orig();
3052         if (!$lastpush_hash || $dsc_hash eq $lastpush_hash) {
3053             @mergeinputs = $dsc_mergeinput
3054         } elsif (is_fast_fwd($dsc_hash,$lastpush_hash)) {
3055             print STDERR <<END or die $!;
3056
3057 Git commit in archive is behind the last version allegedly pushed/uploaded.
3058 Commit referred to by archive: $dsc_hash
3059 Last version pushed with dgit: $lastpush_hash
3060 $later_warning_msg
3061 END
3062             @mergeinputs = ($lastpush_mergeinput);
3063         } else {
3064             # Archive has .dsc which is not a descendant of the last dgit
3065             # push.  This can happen if the archive moves .dscs about.
3066             # Just follow its lead.
3067             if (is_fast_fwd($lastpush_hash,$dsc_hash)) {
3068                 progress "archive .dsc names newer git commit";
3069                 @mergeinputs = ($dsc_mergeinput);
3070             } else {
3071                 progress "archive .dsc names other git commit, fixing up";
3072                 @mergeinputs = ($dsc_mergeinput, $lastpush_mergeinput);
3073             }
3074         }
3075     } elsif ($dsc) {
3076         @mergeinputs = generate_commits_from_dsc();
3077         # We have just done an import.  Now, our import algorithm might
3078         # have been improved.  But even so we do not want to generate
3079         # a new different import of the same package.  So if the
3080         # version numbers are the same, just use our existing version.
3081         # If the version numbers are different, the archive has changed
3082         # (perhaps, rewound).
3083         if ($lastfetch_mergeinput &&
3084             !version_compare( (mergeinfo_version $lastfetch_mergeinput),
3085                               (mergeinfo_version $mergeinputs[0]) )) {
3086             @mergeinputs = ($lastfetch_mergeinput);
3087         }
3088     } elsif ($lastpush_hash) {
3089         # only in git, not in the archive yet
3090         @mergeinputs = ($lastpush_mergeinput);
3091         print STDERR <<END or die $!;
3092
3093 Package not found in the archive, but has allegedly been pushed using dgit.
3094 $later_warning_msg
3095 END
3096     } else {
3097         printdebug "nothing found!\n";
3098         if (defined $skew_warning_vsn) {
3099             print STDERR <<END or die $!;
3100
3101 Warning: relevant archive skew detected.
3102 Archive allegedly contains $skew_warning_vsn
3103 But we were not able to obtain any version from the archive or git.
3104
3105 END
3106         }
3107         unshift @end, $del_lrfetchrefs;
3108         return undef;
3109     }
3110
3111     if ($lastfetch_hash &&
3112         !grep {
3113             my $h = $_->{Commit};
3114             $h and is_fast_fwd($lastfetch_hash, $h);
3115             # If true, one of the existing parents of this commit
3116             # is a descendant of the $lastfetch_hash, so we'll
3117             # be ff from that automatically.
3118         } @mergeinputs
3119         ) {
3120         # Otherwise:
3121         push @mergeinputs, $lastfetch_mergeinput;
3122     }
3123
3124     printdebug "fetch mergeinfos:\n";
3125     foreach my $mi (@mergeinputs) {
3126         if ($mi->{Info}) {
3127             printdebug " commit $mi->{Commit} $mi->{Info}\n";
3128         } else {
3129             printdebug sprintf " ReverseParents=%d Message=%s",
3130                 $mi->{ReverseParents}, $mi->{Message};
3131         }
3132     }
3133
3134     my $compat_info= pop @mergeinputs
3135         if $mergeinputs[$#mergeinputs]{Message};
3136
3137     @mergeinputs = grep { defined $_->{Commit} } @mergeinputs;
3138
3139     my $hash;
3140     if (@mergeinputs > 1) {
3141         # here we go, then:
3142         my $tree_commit = $mergeinputs[0]{Commit};
3143
3144         my $tree = cmdoutput @git, qw(cat-file commit), $tree_commit;
3145         $tree =~ m/\n\n/;  $tree = $`;
3146         $tree =~ m/^tree (\w+)$/m or die "$dsc_hash tree ?";
3147         $tree = $1;
3148
3149         # We use the changelog author of the package in question the
3150         # author of this pseudo-merge.  This is (roughly) correct if
3151         # this commit is simply representing aa non-dgit upload.
3152         # (Roughly because it does not record sponsorship - but we
3153         # don't have sponsorship info because that's in the .changes,
3154         # which isn't in the archivw.)
3155         #
3156         # But, it might be that we are representing archive history
3157         # updates (including in-archive copies).  These are not really
3158         # the responsibility of the person who created the .dsc, but
3159         # there is no-one whose name we should better use.  (The
3160         # author of the .dsc-named commit is clearly worse.)
3161
3162         my $useclogp = mergeinfo_getclogp $mergeinputs[0];
3163         my $author = clogp_authline $useclogp;
3164         my $cversion = getfield $useclogp, 'Version';
3165
3166         my $mcf = ".git/dgit/mergecommit";
3167         open MC, ">", $mcf or die "$mcf $!";
3168         print MC <<END or die $!;
3169 tree $tree
3170 END
3171
3172         my @parents = grep { $_->{Commit} } @mergeinputs;
3173         @parents = reverse @parents if $compat_info->{ReverseParents};
3174         print MC <<END or die $! foreach @parents;
3175 parent $_->{Commit}
3176 END
3177
3178         print MC <<END or die $!;
3179 author $author
3180 committer $author
3181
3182 END
3183
3184         if (defined $compat_info->{Message}) {
3185             print MC $compat_info->{Message} or die $!;
3186         } else {
3187             print MC <<END or die $!;
3188 Record $package ($cversion) in archive suite $csuite
3189
3190 Record that
3191 END
3192             my $message_add_info = sub {
3193                 my ($mi) = (@_);
3194                 my $mversion = mergeinfo_version $mi;
3195                 printf MC "  %-20s %s\n", $mversion, $mi->{Info}
3196                     or die $!;
3197             };
3198
3199             $message_add_info->($mergeinputs[0]);
3200             print MC <<END or die $!;
3201 should be treated as descended from
3202 END
3203             $message_add_info->($_) foreach @mergeinputs[1..$#mergeinputs];
3204         }
3205
3206         close MC or die $!;
3207         $hash = make_commit $mcf;
3208     } else {
3209         $hash = $mergeinputs[0]{Commit};
3210     }
3211     printdebug "fetch hash=$hash\n";
3212
3213     my $chkff = sub {
3214         my ($lasth, $what) = @_;
3215         return unless $lasth;
3216         die "$lasth $hash $what ?" unless is_fast_fwd($lasth, $hash);
3217     };
3218
3219     $chkff->($lastpush_hash, 'dgit repo server tip (last push)')
3220         if $lastpush_hash;
3221     $chkff->($lastfetch_hash, 'local tracking tip (last fetch)');
3222
3223     fetch_from_archive_record_1($hash);
3224
3225     if (defined $skew_warning_vsn) {
3226         mkpath '.git/dgit';
3227         printdebug "SKEW CHECK WANT $skew_warning_vsn\n";
3228         my $gotclogp = commit_getclogp($hash);
3229         my $got_vsn = getfield $gotclogp, 'Version';
3230         printdebug "SKEW CHECK GOT $got_vsn\n";
3231         if (version_compare($got_vsn, $skew_warning_vsn) < 0) {
3232             print STDERR <<END or die $!;
3233
3234 Warning: archive skew detected.  Using the available version:
3235 Archive allegedly contains    $skew_warning_vsn
3236 We were able to obtain only   $got_vsn
3237
3238 END
3239         }
3240     }
3241
3242     if ($lastfetch_hash ne $hash) {
3243         fetch_from_archive_record_2($hash);
3244     }
3245
3246     lrfetchref_used lrfetchref();
3247
3248     check_gitattrs($hash, "fetched source tree");
3249
3250     unshift @end, $del_lrfetchrefs;
3251     return $hash;
3252 }
3253
3254 sub set_local_git_config ($$) {
3255     my ($k, $v) = @_;
3256     runcmd @git, qw(config), $k, $v;
3257 }
3258
3259 sub setup_mergechangelogs (;$) {
3260     my ($always) = @_;
3261     return unless $always || access_cfg_bool(1, 'setup-mergechangelogs');
3262
3263     my $driver = 'dpkg-mergechangelogs';
3264     my $cb = "merge.$driver";
3265     my $attrs = '.git/info/attributes';
3266     ensuredir '.git/info';
3267
3268     open NATTRS, ">", "$attrs.new" or die "$attrs.new $!";
3269     if (!open ATTRS, "<", $attrs) {
3270         $!==ENOENT or die "$attrs: $!";
3271     } else {
3272         while (<ATTRS>) {
3273             chomp;
3274             next if m{^debian/changelog\s};
3275             print NATTRS $_, "\n" or die $!;
3276         }
3277         ATTRS->error and die $!;
3278         close ATTRS;
3279     }
3280     print NATTRS "debian/changelog merge=$driver\n" or die $!;
3281     close NATTRS;
3282
3283     set_local_git_config "$cb.name", 'debian/changelog merge driver';
3284     set_local_git_config "$cb.driver", 'dpkg-mergechangelogs -m %O %A %B %A';
3285
3286     rename "$attrs.new", "$attrs" or die "$attrs: $!";
3287 }
3288
3289 sub setup_useremail (;$) {
3290     my ($always) = @_;
3291     return unless $always || access_cfg_bool(1, 'setup-useremail');
3292
3293     my $setup = sub {
3294         my ($k, $envvar) = @_;
3295         my $v = access_cfg("user-$k", 'RETURN-UNDEF') // $ENV{$envvar};
3296         return unless defined $v;
3297         set_local_git_config "user.$k", $v;
3298     };
3299
3300     $setup->('email', 'DEBEMAIL');
3301     $setup->('name', 'DEBFULLNAME');
3302 }
3303
3304 sub ensure_setup_existing_tree () {
3305     my $k = "remote.$remotename.skipdefaultupdate";
3306     my $c = git_get_config $k;
3307     return if defined $c;
3308     set_local_git_config $k, 'true';
3309 }
3310
3311 sub open_gitattrs () {
3312     my $gai = new IO::File ".git/info/attributes"
3313         or $!==ENOENT
3314         or die "open .git/info/attributes: $!";
3315     return $gai;
3316 }
3317
3318 sub is_gitattrs_setup () {
3319     my $gai = open_gitattrs();
3320     return 0 unless $gai;
3321     while (<$gai>) {
3322         return 1 if m{^\[attr\]dgit-defuse-attrs\s};
3323     }
3324     $gai->error and die $!;
3325     return 0;
3326 }    
3327
3328 sub setup_gitattrs (;$) {
3329     my ($always) = @_;
3330     return unless $always || access_cfg_bool(1, 'setup-gitattributes');
3331
3332     if (is_gitattrs_setup()) {
3333         progress <<END;
3334 [attr]dgit-defuse-attrs already found in .git/info/attributes
3335  not doing further gitattributes setup
3336 END
3337         return;
3338     }
3339     my $af = ".git/info/attributes";
3340     ensuredir '.git/info';
3341     open GAO, "> $af.new" or die $!;
3342     print GAO <<END or die $!;
3343 *       dgit-defuse-attrs
3344 [attr]dgit-defuse-attrs $negate_harmful_gitattrs
3345 # ^ see GITATTRIBUTES in dgit(7) and dgit setup-new-tree in dgit(1)
3346 END
3347     my $gai = open_gitattrs();
3348     if ($gai) {
3349         while (<$gai>) {
3350             chomp;
3351             print GAO $_, "\n" or die $!;
3352         }
3353         $gai->error and die $!;
3354     }
3355     close GAO or die $!;
3356     rename "$af.new", "$af" or die "install $af: $!";
3357 }
3358
3359 sub setup_new_tree () {
3360     setup_mergechangelogs();
3361     setup_useremail();
3362     setup_gitattrs();
3363 }
3364
3365 sub check_gitattrs ($$) {
3366     my ($treeish, $what) = @_;
3367
3368     return if is_gitattrs_setup;
3369
3370     local $/="\0";
3371     my @cmd = (@git, qw(ls-tree -lrz --), "${treeish}:");
3372     debugcmd "|",@cmd;
3373     my $gafl = new IO::File;
3374     open $gafl, "-|", @cmd or die $!;
3375     while (<$gafl>) {
3376         chomp or die;
3377         s/^\d+\s+\w+\s+\w+\s+(\d+)\t// or die;
3378         next if $1 == 0;
3379         next unless m{(?:^|/)\.gitattributes$};
3380
3381         # oh dear, found one
3382         print STDERR <<END;
3383 dgit: warning: $what contains .gitattributes
3384 dgit: .gitattributes have not been defused.  Recommended: dgit setup-new-tree.
3385 END
3386         close $gafl;
3387         return;
3388     }
3389     # tree contains no .gitattributes files
3390     $?=0; $!=0; close $gafl or failedcmd @cmd;
3391 }
3392
3393
3394 sub multisuite_suite_child ($$$) {
3395     my ($tsuite, $merginputs, $fn) = @_;
3396     # in child, sets things up, calls $fn->(), and returns undef
3397     # in parent, returns canonical suite name for $tsuite
3398     my $canonsuitefh = IO::File::new_tmpfile;
3399     my $pid = fork // die $!;
3400     if (!$pid) {
3401         forkcheck_setup();
3402         $isuite = $tsuite;
3403         $us .= " [$isuite]";
3404         $debugprefix .= " ";
3405         progress "fetching $tsuite...";
3406         canonicalise_suite();
3407         print $canonsuitefh $csuite, "\n" or die $!;
3408         close $canonsuitefh or die $!;
3409         $fn->();
3410         return undef;
3411     }
3412     waitpid $pid,0 == $pid or die $!;
3413     fail "failed to obtain $tsuite: ".waitstatusmsg() if $? && $?!=256*4;
3414     seek $canonsuitefh,0,0 or die $!;
3415     local $csuite = <$canonsuitefh>;
3416     die $! unless defined $csuite && chomp $csuite;
3417     if ($? == 256*4) {
3418         printdebug "multisuite $tsuite missing\n";
3419         return $csuite;
3420     }
3421     printdebug "multisuite $tsuite ok (canon=$csuite)\n";
3422     push @$merginputs, {
3423         Ref => lrref,
3424         Info => $csuite,
3425     };
3426     return $csuite;
3427 }
3428
3429 sub fork_for_multisuite ($) {
3430     my ($before_fetch_merge) = @_;
3431     # if nothing unusual, just returns ''
3432     #
3433     # if multisuite:
3434     # returns 0 to caller in child, to do first of the specified suites
3435     # in child, $csuite is not yet set
3436     #
3437     # returns 1 to caller in parent, to finish up anything needed after
3438     # in parent, $csuite is set to canonicalised portmanteau
3439
3440     my $org_isuite = $isuite;
3441     my @suites = split /\,/, $isuite;
3442     return '' unless @suites > 1;
3443     printdebug "fork_for_multisuite: @suites\n";
3444
3445     my @mergeinputs;
3446
3447     my $cbasesuite = multisuite_suite_child($suites[0], \@mergeinputs,
3448                                             sub { });
3449     return 0 unless defined $cbasesuite;
3450
3451     fail "package $package missing in (base suite) $cbasesuite"
3452         unless @mergeinputs;
3453
3454     my @csuites = ($cbasesuite);
3455
3456     $before_fetch_merge->();
3457
3458     foreach my $tsuite (@suites[1..$#suites]) {
3459         $tsuite =~ s/^-/$cbasesuite-/;
3460         my $csubsuite = multisuite_suite_child($tsuite, \@mergeinputs,
3461                                                sub {
3462             @end = ();
3463             fetch();
3464             exit 0;
3465         });
3466         # xxx collecte the ref here
3467
3468         $csubsuite =~ s/^\Q$cbasesuite\E-/-/;
3469         push @csuites, $csubsuite;
3470     }
3471
3472     foreach my $mi (@mergeinputs) {
3473         my $ref = git_get_ref $mi->{Ref};
3474         die "$mi->{Ref} ?" unless length $ref;
3475         $mi->{Commit} = $ref;
3476     }
3477
3478     $csuite = join ",", @csuites;
3479
3480     my $previous = git_get_ref lrref;
3481     if ($previous) {
3482         unshift @mergeinputs, {
3483             Commit => $previous,
3484             Info => "local combined tracking branch",
3485             Warning =>
3486  "archive seems to have rewound: local tracking branch is ahead!",
3487         };
3488     }
3489
3490     foreach my $ix (0..$#mergeinputs) {
3491         $mergeinputs[$ix]{Index} = $ix;
3492     }
3493
3494     @mergeinputs = sort {
3495         -version_compare(mergeinfo_version $a,
3496                          mergeinfo_version $b) # highest version first
3497             or
3498         $a->{Index} <=> $b->{Index}; # earliest in spec first
3499     } @mergeinputs;
3500
3501     my @needed;
3502
3503   NEEDED:
3504     foreach my $mi (@mergeinputs) {
3505         printdebug "multisuite merge check $mi->{Info}\n";
3506         foreach my $previous (@needed) {
3507             next unless is_fast_fwd $mi->{Commit}, $previous->{Commit};
3508             printdebug "multisuite merge un-needed $previous->{Info}\n";
3509             next NEEDED;
3510         }
3511         push @needed, $mi;
3512         printdebug "multisuite merge this-needed\n";
3513         $mi->{Character} = '+';
3514     }
3515
3516     $needed[0]{Character} = '*';
3517
3518     my $output = $needed[0]{Commit};
3519
3520     if (@needed > 1) {
3521         printdebug "multisuite merge nontrivial\n";
3522         my $tree = cmdoutput qw(git rev-parse), $needed[0]{Commit}.':';
3523
3524         my $commit = "tree $tree\n";
3525         my $msg = "Combine archive branches $csuite [dgit]\n\n".
3526             "Input branches:\n";
3527
3528         foreach my $mi (sort { $a->{Index} <=> $b->{Index} } @mergeinputs) {
3529             printdebug "multisuite merge include $mi->{Info}\n";
3530             $mi->{Character} //= ' ';
3531             $commit .= "parent $mi->{Commit}\n";
3532             $msg .= sprintf " %s  %-25s %s\n",
3533                 $mi->{Character},
3534                 (mergeinfo_version $mi),
3535                 $mi->{Info};
3536         }
3537         my $authline = clogp_authline mergeinfo_getclogp $needed[0];
3538         $msg .= "\nKey\n".
3539             " * marks the highest version branch, which choose to use\n".
3540             " + marks each branch which was not already an ancestor\n\n".
3541             "[dgit multi-suite $csuite]\n";
3542         $commit .=
3543             "author $authline\n".
3544             "committer $authline\n\n";
3545         $output = make_commit_text $commit.$msg;
3546         printdebug "multisuite merge generated $output\n";
3547     }
3548
3549     fetch_from_archive_record_1($output);
3550     fetch_from_archive_record_2($output);
3551
3552     progress "calculated combined tracking suite $csuite";
3553
3554     return 1;
3555 }
3556
3557 sub clone_set_head () {
3558     open H, "> .git/HEAD" or die $!;
3559     print H "ref: ".lref()."\n" or die $!;
3560     close H or die $!;
3561 }
3562 sub clone_finish ($) {
3563     my ($dstdir) = @_;
3564     runcmd @git, qw(reset --hard), lrref();
3565     runcmd qw(bash -ec), <<'END';
3566         set -o pipefail
3567         git ls-tree -r --name-only -z HEAD | \
3568         xargs -0r touch -h -r . --
3569 END
3570     printdone "ready for work in $dstdir";
3571 }
3572
3573 sub clone ($) {
3574     # in multisuite, returns twice!
3575     # once in parent after first suite fetched,
3576     # and then again in child after everything is finished
3577     my ($dstdir) = @_;
3578     badusage "dry run makes no sense with clone" unless act_local();
3579
3580     my $multi_fetched = fork_for_multisuite(sub {
3581         printdebug "multi clone before fetch merge\n";
3582         changedir $dstdir;
3583         record_maindir();
3584     });
3585     if ($multi_fetched) {
3586         printdebug "multi clone after fetch merge\n";
3587         clone_set_head();
3588         clone_finish($dstdir);
3589         return;
3590     }
3591     printdebug "clone main body\n";
3592
3593     canonicalise_suite();
3594     my $hasgit = check_for_git();
3595     mkdir $dstdir or fail "create \`$dstdir': $!";
3596     changedir $dstdir;
3597     runcmd @git, qw(init -q);
3598     record_maindir();
3599     setup_new_tree();
3600     clone_set_head();
3601     my $giturl = access_giturl(1);
3602     if (defined $giturl) {
3603         runcmd @git, qw(remote add), 'origin', $giturl;
3604     }
3605     if ($hasgit) {
3606         progress "fetching existing git history";
3607         git_fetch_us();
3608         runcmd_ordryrun_local @git, qw(fetch origin);
3609     } else {
3610         progress "starting new git history";
3611     }
3612     fetch_from_archive() or no_such_package;
3613     my $vcsgiturl = $dsc->{'Vcs-Git'};
3614     if (length $vcsgiturl) {
3615         $vcsgiturl =~ s/\s+-b\s+\S+//g;
3616         runcmd @git, qw(remote add vcs-git), $vcsgiturl;
3617     }
3618     clone_finish($dstdir);
3619 }
3620
3621 sub fetch () {
3622     canonicalise_suite();
3623     if (check_for_git()) {
3624         git_fetch_us();
3625     }
3626     fetch_from_archive() or no_such_package();
3627     printdone "fetched into ".lrref();
3628 }
3629
3630 sub pull () {
3631     my $multi_fetched = fork_for_multisuite(sub { });
3632     fetch() unless $multi_fetched; # parent
3633     return if $multi_fetched eq '0'; # child
3634     runcmd_ordryrun_local @git, qw(merge -m),"Merge from $csuite [dgit]",
3635         lrref();
3636     printdone "fetched to ".lrref()." and merged into HEAD";
3637 }
3638
3639 sub check_not_dirty () {
3640     foreach my $f (qw(local-options local-patch-header)) {
3641         if (stat_exists "debian/source/$f") {
3642             fail "git tree contains debian/source/$f";
3643         }
3644     }
3645
3646     return if $ignoredirty;
3647
3648     my @cmd = (@git, qw(diff --quiet HEAD));
3649     debugcmd "+",@cmd;
3650     $!=0; $?=-1; system @cmd;
3651     return if !$?;
3652     if ($?==256) {
3653         fail "working tree is dirty (does not match HEAD)";
3654     } else {
3655         failedcmd @cmd;
3656     }
3657 }
3658
3659 sub commit_admin ($) {
3660     my ($m) = @_;
3661     progress "$m";
3662     runcmd_ordryrun_local @git, qw(commit -m), $m;
3663 }
3664
3665 sub commit_quilty_patch () {
3666     my $output = cmdoutput @git, qw(status --porcelain);
3667     my %adds;
3668     foreach my $l (split /\n/, $output) {
3669         next unless $l =~ m/\S/;
3670         if ($l =~ m{^(?:\?\?| M) (.pc|debian/patches)}) {
3671             $adds{$1}++;
3672         }
3673     }
3674     delete $adds{'.pc'}; # if there wasn't one before, don't add it
3675     if (!%adds) {
3676         progress "nothing quilty to commit, ok.";
3677         return;
3678     }
3679     my @adds = map { s/[][*?\\]/\\$&/g; $_; } sort keys %adds;
3680     runcmd_ordryrun_local @git, qw(add -f), @adds;
3681     commit_admin <<END
3682 Commit Debian 3.0 (quilt) metadata
3683
3684 [dgit ($our_version) quilt-fixup]
3685 END
3686 }
3687
3688 sub get_source_format () {
3689     my %options;
3690     if (open F, "debian/source/options") {
3691         while (<F>) {
3692             next if m/^\s*\#/;
3693             next unless m/\S/;
3694             s/\s+$//; # ignore missing final newline
3695             if (m/\s*\#\s*/) {
3696                 my ($k, $v) = ($`, $'); #');
3697                 $v =~ s/^"(.*)"$/$1/;
3698                 $options{$k} = $v;
3699             } else {
3700                 $options{$_} = 1;
3701             }
3702         }
3703         F->error and die $!;
3704         close F;
3705     } else {
3706         die $! unless $!==&ENOENT;
3707     }
3708
3709     if (!open F, "debian/source/format") {
3710         die $! unless $!==&ENOENT;
3711         return '';
3712     }
3713     $_ = <F>;
3714     F->error and die $!;
3715     chomp;
3716     return ($_, \%options);
3717 }
3718
3719 sub madformat_wantfixup ($) {
3720     my ($format) = @_;
3721     return 0 unless $format eq '3.0 (quilt)';
3722     our $quilt_mode_warned;
3723     if ($quilt_mode eq 'nocheck') {
3724         progress "Not doing any fixup of \`$format' due to".
3725             " ----no-quilt-fixup or --quilt=nocheck"
3726             unless $quilt_mode_warned++;
3727         return 0;
3728     }
3729     progress "Format \`$format', need to check/update patch stack"
3730         unless $quilt_mode_warned++;
3731     return 1;
3732 }
3733
3734 sub maybe_split_brain_save ($$$) {
3735     my ($headref, $dgitview, $msg) = @_;
3736     # => message fragment "$saved" describing disposition of $dgitview
3737     return "commit id $dgitview" unless defined $split_brain_save;
3738     my @cmd = (shell_cmd 'cd "$1"; shift', $maindir,
3739                @git, qw(update-ref -m),
3740                "dgit --dgit-view-save $msg HEAD=$headref",
3741                $split_brain_save, $dgitview);
3742     runcmd @cmd;
3743     return "and left in $split_brain_save";
3744 }
3745
3746 # An "infopair" is a tuple [ $thing, $what ]
3747 # (often $thing is a commit hash; $what is a description)
3748
3749 sub infopair_cond_equal ($$) {
3750     my ($x,$y) = @_;
3751     $x->[0] eq $y->[0] or fail <<END;
3752 $x->[1] ($x->[0]) not equal to $y->[1] ($y->[0])
3753 END
3754 };
3755
3756 sub infopair_lrf_tag_lookup ($$) {
3757     my ($tagnames, $what) = @_;
3758     # $tagname may be an array ref
3759     my @tagnames = ref $tagnames ? @$tagnames : ($tagnames);
3760     printdebug "infopair_lrfetchref_tag_lookup $what @tagnames\n";
3761     foreach my $tagname (@tagnames) {
3762         my $lrefname = lrfetchrefs."/tags/$tagname";
3763         my $tagobj = $lrfetchrefs_f{$lrefname};
3764         next unless defined $tagobj;
3765         printdebug "infopair_lrfetchref_tag_lookup $tagobj $tagname $what\n";
3766         return [ git_rev_parse($tagobj), $what ];
3767     }
3768     fail @tagnames==1 ? <<END : <<END;
3769 Wanted tag $what (@tagnames) on dgit server, but not found
3770 END
3771 Wanted tag $what (one of: @tagnames) on dgit server, but not found
3772 END
3773 }
3774
3775 sub infopair_cond_ff ($$) {
3776     my ($anc,$desc) = @_;
3777     is_fast_fwd($anc->[0], $desc->[0]) or fail <<END;
3778 $anc->[1] ($anc->[0]) .. $desc->[1] ($desc->[0]) is not fast forward
3779 END
3780 };
3781
3782 sub pseudomerge_version_check ($$) {
3783     my ($clogp, $archive_hash) = @_;
3784
3785     my $arch_clogp = commit_getclogp $archive_hash;
3786     my $i_arch_v = [ (getfield $arch_clogp, 'Version'),
3787                      'version currently in archive' ];
3788     if (defined $overwrite_version) {
3789         if (length $overwrite_version) {
3790             infopair_cond_equal([ $overwrite_version,
3791                                   '--overwrite= version' ],
3792                                 $i_arch_v);
3793         } else {
3794             my $v = $i_arch_v->[0];
3795             progress "Checking package changelog for archive version $v ...";
3796             my $cd;
3797             eval {
3798                 my @xa = ("-f$v", "-t$v");
3799                 my $vclogp = parsechangelog @xa;
3800                 my $gf = sub {
3801                     my ($fn) = @_;
3802                     [ (getfield $vclogp, $fn),
3803                       "$fn field from dpkg-parsechangelog @xa" ];
3804                 };
3805                 my $cv = $gf->('Version');
3806                 infopair_cond_equal($i_arch_v, $cv);
3807                 $cd = $gf->('Distribution');
3808             };
3809             if ($@) {
3810                 $@ =~ s/^dgit: //gm;
3811                 fail "$@".
3812                     "Perhaps debian/changelog does not mention $v ?";
3813             }
3814             fail <<END if $cd->[0] =~ m/UNRELEASED/;
3815 $cd->[1] is $cd->[0]
3816 Your tree seems to based on earlier (not uploaded) $v.
3817 END
3818         }
3819     }
3820     
3821     printdebug "pseudomerge_version_check i_arch_v @$i_arch_v\n";
3822     return $i_arch_v;
3823 }
3824
3825 sub pseudomerge_make_commit ($$$$ $$) {
3826     my ($clogp, $dgitview, $archive_hash, $i_arch_v,
3827         $msg_cmd, $msg_msg) = @_;
3828     progress "Declaring that HEAD inciudes all changes in $i_arch_v->[0]...";
3829
3830     my $tree = cmdoutput qw(git rev-parse), "${dgitview}:";
3831     my $authline = clogp_authline $clogp;
3832
3833     chomp $msg_msg;
3834     $msg_cmd .=
3835         !defined $overwrite_version ? ""
3836         : !length  $overwrite_version ? " --overwrite"
3837         : " --overwrite=".$overwrite_version;
3838
3839     mkpath '.git/dgit';
3840     my $pmf = ".git/dgit/pseudomerge";
3841     open MC, ">", $pmf or die "$pmf $!";
3842     print MC <<END or die $!;
3843 tree $tree
3844 parent $dgitview
3845 parent $archive_hash
3846 author $authline
3847 committer $authline
3848
3849 $msg_msg
3850
3851 [$msg_cmd]
3852 END
3853     close MC or die $!;
3854
3855     return make_commit($pmf);
3856 }
3857
3858 sub splitbrain_pseudomerge ($$$$) {
3859     my ($clogp, $maintview, $dgitview, $archive_hash) = @_;
3860     # => $merged_dgitview
3861     printdebug "splitbrain_pseudomerge...\n";
3862     #
3863     #     We:      debian/PREVIOUS    HEAD($maintview)
3864     # expect:          o ----------------- o
3865     #                    \                   \
3866     #                     o                   o
3867     #                 a/d/PREVIOUS        $dgitview
3868     #                $archive_hash              \
3869     #  If so,                \                   \
3870     #  we do:                 `------------------ o
3871     #   this:                                   $dgitview'
3872     #
3873
3874     return $dgitview unless defined $archive_hash;
3875     return $dgitview if deliberately_not_fast_forward();
3876
3877     printdebug "splitbrain_pseudomerge...\n";
3878
3879     my $i_arch_v = pseudomerge_version_check($clogp, $archive_hash);
3880
3881     if (!defined $overwrite_version) {
3882         progress "Checking that HEAD inciudes all changes in archive...";
3883     }
3884
3885     return $dgitview if is_fast_fwd $archive_hash, $dgitview;
3886
3887     if (defined $overwrite_version) {
3888     } elsif (!eval {
3889         my $t_dep14 = debiantag_maintview $i_arch_v->[0], access_nomdistro;
3890         my $i_dep14 = infopair_lrf_tag_lookup($t_dep14, "maintainer view tag");
3891         my $t_dgit = debiantag_new $i_arch_v->[0], access_nomdistro;
3892         my $i_dgit = infopair_lrf_tag_lookup($t_dgit, "dgit view tag");
3893         my $i_archive = [ $archive_hash, "current archive contents" ];
3894
3895         printdebug "splitbrain_pseudomerge i_archive @$i_archive\n";
3896
3897         infopair_cond_equal($i_dgit, $i_archive);
3898         infopair_cond_ff($i_dep14, $i_dgit);
3899         infopair_cond_ff($i_dep14, [ $maintview, 'HEAD' ]);
3900         1;
3901     }) {
3902         print STDERR <<END;
3903 $us: check failed (maybe --overwrite is needed, consult documentation)
3904 END
3905         die "$@";
3906     }
3907
3908     my $r = pseudomerge_make_commit
3909         $clogp, $dgitview, $archive_hash, $i_arch_v,
3910         "dgit --quilt=$quilt_mode",
3911         (defined $overwrite_version ? <<END_OVERWR : <<END_MAKEFF);
3912 Declare fast forward from $i_arch_v->[0]
3913 END_OVERWR
3914 Make fast forward from $i_arch_v->[0]
3915 END_MAKEFF
3916
3917     maybe_split_brain_save $maintview, $r, "pseudomerge";
3918
3919     progress "Made pseudo-merge of $i_arch_v->[0] into dgit view.";
3920     return $r;
3921 }       
3922
3923 sub plain_overwrite_pseudomerge ($$$) {
3924     my ($clogp, $head, $archive_hash) = @_;
3925
3926     printdebug "plain_overwrite_pseudomerge...";
3927
3928     my $i_arch_v = pseudomerge_version_check($clogp, $archive_hash);
3929
3930     return $head if is_fast_fwd $archive_hash, $head;
3931
3932     my $m = "Declare fast forward from $i_arch_v->[0]";
3933
3934     my $r = pseudomerge_make_commit
3935         $clogp, $head, $archive_hash, $i_arch_v,
3936         "dgit", $m;
3937
3938     runcmd @git, qw(update-ref -m), $m, 'HEAD', $r, $head;
3939
3940     progress "Make pseudo-merge of $i_arch_v->[0] into your HEAD.";
3941     return $r;
3942 }
3943
3944 sub push_parse_changelog ($) {
3945     my ($clogpfn) = @_;
3946
3947     my $clogp = Dpkg::Control::Hash->new();
3948     $clogp->load($clogpfn) or die;
3949
3950     my $clogpackage = getfield $clogp, 'Source';
3951     $package //= $clogpackage;
3952     fail "-p specified $package but changelog specified $clogpackage"
3953         unless $package eq $clogpackage;
3954     my $cversion = getfield $clogp, 'Version';
3955
3956     if (!$we_are_initiator) {
3957         # rpush initiator can't do this because it doesn't have $isuite yet
3958         my $tag = debiantag($cversion, access_nomdistro);
3959         runcmd @git, qw(check-ref-format), $tag;
3960     }
3961
3962     my $dscfn = dscfn($cversion);
3963
3964     return ($clogp, $cversion, $dscfn);
3965 }
3966
3967 sub push_parse_dsc ($$$) {
3968     my ($dscfn,$dscfnwhat, $cversion) = @_;
3969     $dsc = parsecontrol($dscfn,$dscfnwhat);
3970     my $dversion = getfield $dsc, 'Version';
3971     my $dscpackage = getfield $dsc, 'Source';
3972     ($dscpackage eq $package && $dversion eq $cversion) or
3973         fail "$dscfn is for $dscpackage $dversion".
3974             " but debian/changelog is for $package $cversion";
3975 }
3976
3977 sub push_tagwants ($$$$) {
3978     my ($cversion, $dgithead, $maintviewhead, $tfbase) = @_;
3979     my @tagwants;
3980     push @tagwants, {
3981         TagFn => \&debiantag,
3982         Objid => $dgithead,
3983         TfSuffix => '',
3984         View => 'dgit',
3985     };
3986     if (defined $maintviewhead) {
3987         push @tagwants, {
3988             TagFn => \&debiantag_maintview,
3989             Objid => $maintviewhead,
3990             TfSuffix => '-maintview',
3991             View => 'maint',
3992         };
3993     } elsif ($dodep14tag eq 'no' ? 0
3994              : $dodep14tag eq 'want' ? access_cfg_tagformats_can_splitbrain
3995              : $dodep14tag eq 'always'
3996              ? (access_cfg_tagformats_can_splitbrain or fail <<END)
3997 --dep14tag-always (or equivalent in config) means server must support
3998  both "new" and "maint" tag formats, but config says it doesn't.
3999 END
4000             : die "$dodep14tag ?") {
4001         push @tagwants, {
4002             TagFn => \&debiantag_maintview,
4003             Objid => $dgithead,
4004             TfSuffix => '-dgit',
4005             View => 'dgit',
4006         };
4007     };
4008     foreach my $tw (@tagwants) {
4009         $tw->{Tag} = $tw->{TagFn}($cversion, access_nomdistro);
4010         $tw->{Tfn} = sub { $tfbase.$tw->{TfSuffix}.$_[0]; };
4011     }
4012     printdebug 'push_tagwants: ', Dumper(\@_, \@tagwants);
4013     return @tagwants;
4014 }
4015
4016 sub push_mktags ($$ $$ $) {
4017     my ($clogp,$dscfn,
4018         $changesfile,$changesfilewhat,
4019         $tagwants) = @_;
4020
4021     die unless $tagwants->[0]{View} eq 'dgit';
4022
4023     my $declaredistro = access_nomdistro();
4024     my $reader_giturl = do { local $access_forpush=0; access_giturl(); };
4025     $dsc->{$ourdscfield[0]} = join " ",
4026         $tagwants->[0]{Objid}, $declaredistro, $tagwants->[0]{Tag},
4027         $reader_giturl;
4028     $dsc->save("$dscfn.tmp") or die $!;
4029
4030     my $changes = parsecontrol($changesfile,$changesfilewhat);
4031     foreach my $field (qw(Source Distribution Version)) {
4032         $changes->{$field} eq $clogp->{$field} or
4033             fail "changes field $field \`$changes->{$field}'".
4034                 " does not match changelog \`$clogp->{$field}'";
4035     }
4036
4037     my $cversion = getfield $clogp, 'Version';
4038     my $clogsuite = getfield $clogp, 'Distribution';
4039
4040     # We make the git tag by hand because (a) that makes it easier
4041     # to control the "tagger" (b) we can do remote signing
4042     my $authline = clogp_authline $clogp;
4043     my $delibs = join(" ", "",@deliberatelies);
4044
4045     my $mktag = sub {
4046         my ($tw) = @_;
4047         my $tfn = $tw->{Tfn};
4048         my $head = $tw->{Objid};
4049         my $tag = $tw->{Tag};
4050
4051         open TO, '>', $tfn->('.tmp') or die $!;
4052         print TO <<END or die $!;
4053 object $head
4054 type commit
4055 tag $tag
4056 tagger $authline
4057
4058 END
4059         if ($tw->{View} eq 'dgit') {
4060             print TO <<END or die $!;
4061 $package release $cversion for $clogsuite ($csuite) [dgit]
4062 [dgit distro=$declaredistro$delibs]
4063 END
4064             foreach my $ref (sort keys %previously) {
4065                 print TO <<END or die $!;
4066 [dgit previously:$ref=$previously{$ref}]
4067 END
4068             }
4069         } elsif ($tw->{View} eq 'maint') {
4070             print TO <<END or die $!;
4071 $package release $cversion for $clogsuite ($csuite)
4072 (maintainer view tag generated by dgit --quilt=$quilt_mode)
4073 END
4074         } else {
4075             die Dumper($tw)."?";
4076         }
4077
4078         close TO or die $!;
4079
4080         my $tagobjfn = $tfn->('.tmp');
4081         if ($sign) {
4082             if (!defined $keyid) {
4083                 $keyid = access_cfg('keyid','RETURN-UNDEF');
4084             }
4085             if (!defined $keyid) {
4086                 $keyid = getfield $clogp, 'Maintainer';
4087             }
4088             unlink $tfn->('.tmp.asc') or $!==&ENOENT or die $!;
4089             my @sign_cmd = (@gpg, qw(--detach-sign --armor));
4090             push @sign_cmd, qw(-u),$keyid if defined $keyid;
4091             push @sign_cmd, $tfn->('.tmp');
4092             runcmd_ordryrun @sign_cmd;
4093             if (act_scary()) {
4094                 $tagobjfn = $tfn->('.signed.tmp');
4095                 runcmd shell_cmd "exec >$tagobjfn", qw(cat --),
4096                     $tfn->('.tmp'), $tfn->('.tmp.asc');
4097             }
4098         }
4099         return $tagobjfn;
4100     };
4101
4102     my @r = map { $mktag->($_); } @$tagwants;
4103     return @r;
4104 }
4105
4106 sub sign_changes ($) {
4107     my ($changesfile) = @_;
4108     if ($sign) {
4109         my @debsign_cmd = @debsign;
4110         push @debsign_cmd, "-k$keyid" if defined $keyid;
4111         push @debsign_cmd, "-p$gpg[0]" if $gpg[0] ne 'gpg';
4112         push @debsign_cmd, $changesfile;
4113         runcmd_ordryrun @debsign_cmd;
4114     }
4115 }
4116
4117 sub dopush () {
4118     printdebug "actually entering push\n";
4119
4120     supplementary_message(<<'END');
4121 Push failed, while checking state of the archive.
4122 You can retry the push, after fixing the problem, if you like.
4123 END
4124     if (check_for_git()) {
4125         git_fetch_us();
4126     }
4127     my $archive_hash = fetch_from_archive();
4128     if (!$archive_hash) {
4129         $new_package or
4130             fail "package appears to be new in this suite;".
4131                 " if this is intentional, use --new";
4132     }
4133
4134     supplementary_message(<<'END');
4135 Push failed, while preparing your push.
4136 You can retry the push, after fixing the problem, if you like.
4137 END
4138
4139     need_tagformat 'new', "quilt mode $quilt_mode"
4140         if quiltmode_splitbrain;
4141
4142     prep_ud();
4143
4144     access_giturl(); # check that success is vaguely likely
4145     rpush_handle_protovsn_bothends() if $we_are_initiator;
4146     select_tagformat();
4147
4148     my $clogpfn = ".git/dgit/changelog.822.tmp";
4149     runcmd shell_cmd "exec >$clogpfn", qw(dpkg-parsechangelog);
4150
4151     responder_send_file('parsed-changelog', $clogpfn);
4152
4153     my ($clogp, $cversion, $dscfn) =
4154         push_parse_changelog("$clogpfn");
4155
4156     my $dscpath = "$buildproductsdir/$dscfn";
4157     stat_exists $dscpath or
4158         fail "looked for .dsc $dscpath, but $!;".
4159             " maybe you forgot to build";
4160
4161     responder_send_file('dsc', $dscpath);
4162
4163     push_parse_dsc($dscpath, $dscfn, $cversion);
4164
4165     my $format = getfield $dsc, 'Format';
4166     printdebug "format $format\n";
4167
4168     my $actualhead = git_rev_parse('HEAD');
4169     my $dgithead = $actualhead;
4170     my $maintviewhead = undef;
4171
4172     my $upstreamversion = upstreamversion $clogp->{Version};
4173
4174     if (madformat_wantfixup($format)) {
4175         # user might have not used dgit build, so maybe do this now:
4176         if (quiltmode_splitbrain()) {
4177             changedir $playground;
4178             quilt_make_fake_dsc($upstreamversion);
4179             my $cachekey;
4180             ($dgithead, $cachekey) =
4181                 quilt_check_splitbrain_cache($actualhead, $upstreamversion);
4182             $dgithead or fail
4183  "--quilt=$quilt_mode but no cached dgit view:
4184  perhaps tree changed since dgit build[-source] ?";
4185             $split_brain = 1;
4186             $dgithead = splitbrain_pseudomerge($clogp,
4187                                                $actualhead, $dgithead,
4188                                                $archive_hash);
4189             $maintviewhead = $actualhead;
4190             changedir $maindir;
4191             prep_ud(); # so _only_subdir() works, below
4192         } else {
4193             commit_quilty_patch();
4194         }
4195     }
4196
4197     if (defined $overwrite_version && !defined $maintviewhead) {
4198         $dgithead = plain_overwrite_pseudomerge($clogp,
4199                                                 $dgithead,
4200                                                 $archive_hash);
4201     }
4202
4203     check_not_dirty();
4204
4205     my $forceflag = '';
4206     if ($archive_hash) {
4207         if (is_fast_fwd($archive_hash, $dgithead)) {
4208             # ok
4209         } elsif (deliberately_not_fast_forward) {
4210             $forceflag = '+';
4211         } else {
4212             fail "dgit push: HEAD is not a descendant".
4213                 " of the archive's version.\n".
4214                 "To overwrite the archive's contents,".
4215                 " pass --overwrite[=VERSION].\n".
4216                 "To rewind history, if permitted by the archive,".
4217                 " use --deliberately-not-fast-forward.";
4218         }
4219     }
4220
4221     changedir $playground;
4222     progress "checking that $dscfn corresponds to HEAD";
4223     runcmd qw(dpkg-source -x --),
4224         $dscpath =~ m#^/# ? $dscpath : "$maindir/$dscpath";
4225     my ($tree,$dir) = mktree_in_ud_from_only_subdir("source package");
4226     check_for_vendor_patches() if madformat($dsc->{format});
4227     changedir $maindir;
4228     my @diffcmd = (@git, qw(diff --quiet), $tree, $dgithead);
4229     debugcmd "+",@diffcmd;
4230     $!=0; $?=-1;
4231     my $r = system @diffcmd;
4232     if ($r) {
4233         if ($r==256) {
4234             my $diffs = cmdoutput @git, qw(diff --stat), $tree, $dgithead;
4235             fail <<END
4236 HEAD specifies a different tree to $dscfn:
4237 $diffs
4238 Perhaps you forgot to build.  Or perhaps there is a problem with your
4239  source tree (see dgit(7) for some hints).  To see a full diff, run
4240    git diff $tree HEAD
4241 END
4242         } else {
4243             failedcmd @diffcmd;
4244         }
4245     }
4246     if (!$changesfile) {
4247         my $pat = changespat $cversion;
4248         my @cs = glob "$buildproductsdir/$pat";
4249         fail "failed to find unique changes file".
4250             " (looked for $pat in $buildproductsdir);".
4251             " perhaps you need to use dgit -C"
4252             unless @cs==1;
4253         ($changesfile) = @cs;
4254     } else {
4255         $changesfile = "$buildproductsdir/$changesfile";
4256     }
4257
4258     # Check that changes and .dsc agree enough
4259     $changesfile =~ m{[^/]*$};
4260     my $changes = parsecontrol($changesfile,$&);
4261     files_compare_inputs($dsc, $changes)
4262         unless forceing [qw(dsc-changes-mismatch)];
4263
4264     # Perhaps adjust .dsc to contain right set of origs
4265     changes_update_origs_from_dsc($dsc, $changes, $upstreamversion,
4266                                   $changesfile)
4267         unless forceing [qw(changes-origs-exactly)];
4268
4269     # Checks complete, we're going to try and go ahead:
4270
4271     responder_send_file('changes',$changesfile);
4272     responder_send_command("param head $dgithead");
4273     responder_send_command("param csuite $csuite");
4274     responder_send_command("param isuite $isuite");
4275     responder_send_command("param tagformat $tagformat");
4276     if (defined $maintviewhead) {
4277         die unless ($protovsn//4) >= 4;
4278         responder_send_command("param maint-view $maintviewhead");
4279     }
4280
4281     # Perhaps send buildinfo(s) for signing
4282     my $changes_files = getfield $changes, 'Files';
4283     my @buildinfos = ($changes_files =~ m/ .* (\S+\.buildinfo)$/mg);
4284     foreach my $bi (@buildinfos) {
4285         responder_send_command("param buildinfo-filename $bi");
4286         responder_send_file('buildinfo', "$buildproductsdir/$bi");
4287     }
4288
4289     if (deliberately_not_fast_forward) {
4290         git_for_each_ref(lrfetchrefs, sub {
4291             my ($objid,$objtype,$lrfetchrefname,$reftail) = @_;
4292             my $rrefname= substr($lrfetchrefname, length(lrfetchrefs) + 1);
4293             responder_send_command("previously $rrefname=$objid");
4294             $previously{$rrefname} = $objid;
4295         });
4296     }
4297
4298     my @tagwants = push_tagwants($cversion, $dgithead, $maintviewhead,
4299                                  ".git/dgit/tag");
4300     my @tagobjfns;
4301
4302     supplementary_message(<<'END');
4303 Push failed, while signing the tag.
4304 You can retry the push, after fixing the problem, if you like.
4305 END
4306     # If we manage to sign but fail to record it anywhere, it's fine.
4307     if ($we_are_responder) {
4308         @tagobjfns = map { $_->{Tfn}('.signed-tmp') } @tagwants;
4309         responder_receive_files('signed-tag', @tagobjfns);
4310     } else {
4311         @tagobjfns = push_mktags($clogp,$dscpath,
4312                               $changesfile,$changesfile,
4313                               \@tagwants);
4314     }
4315     supplementary_message(<<'END');
4316 Push failed, *after* signing the tag.
4317 If you want to try again, you should use a new version number.
4318 END
4319
4320     pairwise { $a->{TagObjFn} = $b } @tagwants, @tagobjfns;
4321
4322     foreach my $tw (@tagwants) {
4323         my $tag = $tw->{Tag};
4324         my $tagobjfn = $tw->{TagObjFn};
4325         my $tag_obj_hash =
4326             cmdoutput @git, qw(hash-object -w -t tag), $tagobjfn;
4327         runcmd_ordryrun @git, qw(verify-tag), $tag_obj_hash;
4328         runcmd_ordryrun_local
4329             @git, qw(update-ref), "refs/tags/$tag", $tag_obj_hash;
4330     }
4331
4332     supplementary_message(<<'END');
4333 Push failed, while updating the remote git repository - see messages above.
4334 If you want to try again, you should use a new version number.
4335 END
4336     if (!check_for_git()) {
4337         create_remote_git_repo();
4338     }
4339
4340     my @pushrefs = $forceflag.$dgithead.":".rrref();
4341     foreach my $tw (@tagwants) {
4342         push @pushrefs, $forceflag."refs/tags/$tw->{Tag}";
4343     }
4344
4345     runcmd_ordryrun @git,
4346         qw(-c push.followTags=false push), access_giturl(), @pushrefs;
4347     runcmd_ordryrun @git, qw(update-ref -m), 'dgit push', lrref(), $dgithead;
4348
4349     supplementary_message(<<'END');
4350 Push failed, while obtaining signatures on the .changes and .dsc.
4351 If it was just that the signature failed, you may try again by using
4352 debsign by hand to sign the changes
4353    $changesfile
4354 and then dput to complete the upload.
4355 If you need to change the package, you must use a new version number.
4356 END
4357     if ($we_are_responder) {
4358         my $dryrunsuffix = act_local() ? "" : ".tmp";
4359         my @rfiles = ($dscpath, $changesfile);
4360         push @rfiles, map { "$buildproductsdir/$_" } @buildinfos;
4361         responder_receive_files('signed-dsc-changes',
4362                                 map { "$_$dryrunsuffix" } @rfiles);
4363     } else {
4364         if (act_local()) {
4365             rename "$dscpath.tmp",$dscpath or die "$dscfn $!";
4366         } else {
4367             progress "[new .dsc left in $dscpath.tmp]";
4368         }
4369         sign_changes $changesfile;
4370     }
4371
4372     supplementary_message(<<END);
4373 Push failed, while uploading package(s) to the archive server.
4374 You can retry the upload of exactly these same files with dput of:
4375   $changesfile
4376 If that .changes file is broken, you will need to use a new version
4377 number for your next attempt at the upload.
4378 END
4379     my $host = access_cfg('upload-host','RETURN-UNDEF');
4380     my @hostarg = defined($host) ? ($host,) : ();
4381</