chiark / gitweb /
dgit: Implement test_source_only_changes
[dgit.git] / dgit
1 #!/usr/bin/perl -w
2 # dgit
3 # Integration between git and Debian-style archives
4 #
5 # Copyright (C)2013-2016 Ian Jackson
6 #
7 # This program is free software: you can redistribute it and/or modify
8 # it under the terms of the GNU General Public License as published by
9 # the Free Software Foundation, either version 3 of the License, or
10 # (at your option) any later version.
11 #
12 # This program is distributed in the hope that it will be useful,
13 # but WITHOUT ANY WARRANTY; without even the implied warranty of
14 # MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
15 # GNU General Public License for more details.
16 #
17 # You should have received a copy of the GNU General Public License
18 # along with this program.  If not, see <http://www.gnu.org/licenses/>.
19
20 use strict;
21
22 use Debian::Dgit qw(:DEFAULT :playground);
23 setup_sigwarn();
24
25 use IO::Handle;
26 use Data::Dumper;
27 use LWP::UserAgent;
28 use Dpkg::Control::Hash;
29 use File::Path;
30 use File::Temp qw(tempdir);
31 use File::Basename;
32 use Dpkg::Version;
33 use Dpkg::Compression;
34 use Dpkg::Compression::Process;
35 use POSIX;
36 use IPC::Open2;
37 use Digest::SHA;
38 use Digest::MD5;
39 use List::MoreUtils qw(pairwise);
40 use Text::Glob qw(match_glob);
41 use Fcntl qw(:DEFAULT :flock);
42 use Carp;
43
44 use Debian::Dgit;
45
46 our $our_version = 'UNRELEASED'; ###substituted###
47 our $absurdity = undef; ###substituted###
48
49 our @rpushprotovsn_support = qw(4 3 2); # 4 is new tag format
50 our $protovsn;
51
52 our $cmd;
53 our $subcommand;
54 our $isuite;
55 our $idistro;
56 our $package;
57 our @ropts;
58
59 our $sign = 1;
60 our $dryrun_level = 0;
61 our $changesfile;
62 our $buildproductsdir = '..';
63 our $new_package = 0;
64 our $ignoredirty = 0;
65 our $rmonerror = 1;
66 our @deliberatelies;
67 our %previously;
68 our $existing_package = 'dpkg';
69 our $cleanmode;
70 our $changes_since_version;
71 our $rmchanges;
72 our $overwrite_version; # undef: not specified; '': check changelog
73 our $quilt_mode;
74 our $quilt_modes_re = 'linear|smash|auto|nofix|nocheck|gbp|dpm|unapplied';
75 our $dodep14tag;
76 our $split_brain_save;
77 our $we_are_responder;
78 our $we_are_initiator;
79 our $initiator_tempdir;
80 our $patches_applied_dirtily = 00;
81 our $tagformat_want;
82 our $tagformat;
83 our $tagformatfn;
84 our $chase_dsc_distro=1;
85
86 our %forceopts = map { $_=>0 }
87     qw(unrepresentable unsupported-source-format
88        dsc-changes-mismatch changes-origs-exactly
89        import-gitapply-absurd
90        import-gitapply-no-absurd
91        import-dsc-with-dgit-field);
92
93 our %format_ok = map { $_=>1 } ("1.0","3.0 (native)","3.0 (quilt)");
94
95 our $suite_re = '[-+.0-9a-z]+';
96 our $cleanmode_re = 'dpkg-source(?:-d)?|git|git-ff|check|none';
97 our $orig_f_comp_re = 'orig(?:-[-0-9a-z]+)?';
98 our $orig_f_sig_re = '\\.(?:asc|gpg|pgp)';
99 our $orig_f_tail_re = "$orig_f_comp_re\\.tar(?:\\.\\w+)?(?:$orig_f_sig_re)?";
100
101 our $git_authline_re = '^([^<>]+) \<(\S+)\> (\d+ [-+]\d+)$';
102 our $splitbraincache = 'dgit-intern/quilt-cache';
103 our $rewritemap = 'dgit-rewrite/map';
104
105 our @dpkg_source_ignores = qw(-i(?:^|/)\.git(?:/|$) -I.git);
106
107 our (@git) = qw(git);
108 our (@dget) = qw(dget);
109 our (@curl) = (qw(curl --proto-redir), '-all,http,https', qw(-L));
110 our (@dput) = qw(dput);
111 our (@debsign) = qw(debsign);
112 our (@gpg) = qw(gpg);
113 our (@sbuild) = qw(sbuild);
114 our (@ssh) = 'ssh';
115 our (@dgit) = qw(dgit);
116 our (@aptget) = qw(apt-get);
117 our (@aptcache) = qw(apt-cache);
118 our (@dpkgbuildpackage) = (qw(dpkg-buildpackage), @dpkg_source_ignores);
119 our (@dpkgsource) = (qw(dpkg-source), @dpkg_source_ignores);
120 our (@dpkggenchanges) = qw(dpkg-genchanges);
121 our (@mergechanges) = qw(mergechanges -f);
122 our (@gbp_build) = ('');
123 our (@gbp_pq) = ('gbp pq');
124 our (@changesopts) = ('');
125
126 our %opts_opt_map = ('dget' => \@dget, # accept for compatibility
127                      'curl' => \@curl,
128                      'dput' => \@dput,
129                      'debsign' => \@debsign,
130                      'gpg' => \@gpg,
131                      'sbuild' => \@sbuild,
132                      'ssh' => \@ssh,
133                      'dgit' => \@dgit,
134                      'git' => \@git,
135                      'apt-get' => \@aptget,
136                      'apt-cache' => \@aptcache,
137                      'dpkg-source' => \@dpkgsource,
138                      'dpkg-buildpackage' => \@dpkgbuildpackage,
139                      'dpkg-genchanges' => \@dpkggenchanges,
140                      'gbp-build' => \@gbp_build,
141                      'gbp-pq' => \@gbp_pq,
142                      'ch' => \@changesopts,
143                      'mergechanges' => \@mergechanges);
144
145 our %opts_opt_cmdonly = ('gpg' => 1, 'git' => 1);
146 our %opts_cfg_insertpos = map {
147     $_,
148     scalar @{ $opts_opt_map{$_} }
149 } keys %opts_opt_map;
150
151 sub parseopts_late_defaults();
152 sub setup_gitattrs(;$);
153 sub check_gitattrs($$);
154
155 our $keyid;
156
157 autoflush STDOUT 1;
158
159 our $supplementary_message = '';
160 our $need_split_build_invocation = 0;
161 our $split_brain = 0;
162
163 END {
164     local ($@, $?);
165     return unless forkcheck_mainprocess();
166     print STDERR "! $_\n" foreach $supplementary_message =~ m/^.+$/mg;
167 }
168
169 our $remotename = 'dgit';
170 our @ourdscfield = qw(Dgit Vcs-Dgit-Master);
171 our $csuite;
172 our $instead_distro;
173
174 if (!defined $absurdity) {
175     $absurdity = $0;
176     $absurdity =~ s{/[^/]+$}{/absurd} or die;
177 }
178
179 sub debiantag ($$) {
180     my ($v,$distro) = @_;
181     return $tagformatfn->($v, $distro);
182 }
183
184 sub debiantag_maintview ($$) { 
185     my ($v,$distro) = @_;
186     return "$distro/".dep14_version_mangle $v;
187 }
188
189 sub madformat ($) { $_[0] eq '3.0 (quilt)' }
190
191 sub lbranch () { return "$branchprefix/$csuite"; }
192 my $lbranch_re = '^refs/heads/'.$branchprefix.'/([^/.]+)$';
193 sub lref () { return "refs/heads/".lbranch(); }
194 sub lrref () { return "refs/remotes/$remotename/".server_branch($csuite); }
195 sub rrref () { return server_ref($csuite); }
196
197 sub stripepoch ($) {
198     my ($vsn) = @_;
199     $vsn =~ s/^\d+\://;
200     return $vsn;
201 }
202
203 sub srcfn ($$) {
204     my ($vsn,$sfx) = @_;
205     return "${package}_".(stripepoch $vsn).$sfx
206 }
207
208 sub dscfn ($) {
209     my ($vsn) = @_;
210     return srcfn($vsn,".dsc");
211 }
212
213 sub changespat ($;$) {
214     my ($vsn, $arch) = @_;
215     return "${package}_".(stripepoch $vsn)."_".($arch//'*').".changes";
216 }
217
218 sub upstreamversion ($) {
219     my ($vsn) = @_;
220     $vsn =~ s/-[^-]+$//;
221     return $vsn;
222 }
223
224 our $us = 'dgit';
225 initdebug('');
226
227 our @end;
228 END { 
229     local ($?);
230     return unless forkcheck_mainprocess();
231     foreach my $f (@end) {
232         eval { $f->(); };
233         print STDERR "$us: cleanup: $@" if length $@;
234     }
235 };
236
237 sub badcfg { print STDERR "$us: invalid configuration: @_\n"; exit 12; }
238
239 sub forceable_fail ($$) {
240     my ($forceoptsl, $msg) = @_;
241     fail $msg unless grep { $forceopts{$_} } @$forceoptsl;
242     print STDERR "warning: overriding problem due to --force:\n". $msg;
243 }
244
245 sub forceing ($) {
246     my ($forceoptsl) = @_;
247     my @got = grep { $forceopts{$_} } @$forceoptsl;
248     return 0 unless @got;
249     print STDERR
250  "warning: skipping checks or functionality due to --force-$got[0]\n";
251 }
252
253 sub no_such_package () {
254     print STDERR "$us: package $package does not exist in suite $isuite\n";
255     exit 4;
256 }
257
258 sub deliberately ($) {
259     my ($enquiry) = @_;
260     return !!grep { $_ eq "--deliberately-$enquiry" } @deliberatelies;
261 }
262
263 sub deliberately_not_fast_forward () {
264     foreach (qw(not-fast-forward fresh-repo)) {
265         return 1 if deliberately($_) || deliberately("TEST-dgit-only-$_");
266     }
267 }
268
269 sub quiltmode_splitbrain () {
270     $quilt_mode =~ m/gbp|dpm|unapplied/;
271 }
272
273 sub opts_opt_multi_cmd {
274     my @cmd;
275     push @cmd, split /\s+/, shift @_;
276     push @cmd, @_;
277     @cmd;
278 }
279
280 sub gbp_pq {
281     return opts_opt_multi_cmd @gbp_pq;
282 }
283
284 sub dgit_privdir () {
285     our $dgit_privdir_made //= ensure_a_playground 'dgit';
286 }
287
288 #---------- remote protocol support, common ----------
289
290 # remote push initiator/responder protocol:
291 #  $ dgit remote-push-build-host <n-rargs> <rargs>... <push-args>...
292 #  where <rargs> is <push-host-dir> <supported-proto-vsn>,... ...
293 #  < dgit-remote-push-ready <actual-proto-vsn>
294 #
295 # occasionally:
296 #
297 #  > progress NBYTES
298 #  [NBYTES message]
299 #
300 #  > supplementary-message NBYTES          # $protovsn >= 3
301 #  [NBYTES message]
302 #
303 # main sequence:
304 #
305 #  > file parsed-changelog
306 #  [indicates that output of dpkg-parsechangelog follows]
307 #  > data-block NBYTES
308 #  > [NBYTES bytes of data (no newline)]
309 #  [maybe some more blocks]
310 #  > data-end
311 #
312 #  > file dsc
313 #  [etc]
314 #
315 #  > file changes
316 #  [etc]
317 #
318 #  > param head DGIT-VIEW-HEAD
319 #  > param csuite SUITE
320 #  > param tagformat old|new
321 #  > param maint-view MAINT-VIEW-HEAD
322 #
323 #  > param buildinfo-filename P_V_X.buildinfo   # zero or more times
324 #  > file buildinfo                             # for buildinfos to sign
325 #
326 #  > previously REFNAME=OBJNAME       # if --deliberately-not-fast-forward
327 #                                     # goes into tag, for replay prevention
328 #
329 #  > want signed-tag
330 #  [indicates that signed tag is wanted]
331 #  < data-block NBYTES
332 #  < [NBYTES bytes of data (no newline)]
333 #  [maybe some more blocks]
334 #  < data-end
335 #  < files-end
336 #
337 #  > want signed-dsc-changes
338 #  < data-block NBYTES    [transfer of signed dsc]
339 #  [etc]
340 #  < data-block NBYTES    [transfer of signed changes]
341 #  [etc]
342 #  < data-block NBYTES    [transfer of each signed buildinfo
343 #  [etc]                   same number and order as "file buildinfo"]
344 #  ...
345 #  < files-end
346 #
347 #  > complete
348
349 our $i_child_pid;
350
351 sub i_child_report () {
352     # Sees if our child has died, and reap it if so.  Returns a string
353     # describing how it died if it failed, or undef otherwise.
354     return undef unless $i_child_pid;
355     my $got = waitpid $i_child_pid, WNOHANG;
356     return undef if $got <= 0;
357     die unless $got == $i_child_pid;
358     $i_child_pid = undef;
359     return undef unless $?;
360     return "build host child ".waitstatusmsg();
361 }
362
363 sub badproto ($$) {
364     my ($fh, $m) = @_;
365     fail "connection lost: $!" if $fh->error;
366     fail "protocol violation; $m not expected";
367 }
368
369 sub badproto_badread ($$) {
370     my ($fh, $wh) = @_;
371     fail "connection lost: $!" if $!;
372     my $report = i_child_report();
373     fail $report if defined $report;
374     badproto $fh, "eof (reading $wh)";
375 }
376
377 sub protocol_expect (&$) {
378     my ($match, $fh) = @_;
379     local $_;
380     $_ = <$fh>;
381     defined && chomp or badproto_badread $fh, "protocol message";
382     if (wantarray) {
383         my @r = &$match;
384         return @r if @r;
385     } else {
386         my $r = &$match;
387         return $r if $r;
388     }
389     badproto $fh, "\`$_'";
390 }
391
392 sub protocol_send_file ($$) {
393     my ($fh, $ourfn) = @_;
394     open PF, "<", $ourfn or die "$ourfn: $!";
395     for (;;) {
396         my $d;
397         my $got = read PF, $d, 65536;
398         die "$ourfn: $!" unless defined $got;
399         last if !$got;
400         print $fh "data-block ".length($d)."\n" or die $!;
401         print $fh $d or die $!;
402     }
403     PF->error and die "$ourfn $!";
404     print $fh "data-end\n" or die $!;
405     close PF;
406 }
407
408 sub protocol_read_bytes ($$) {
409     my ($fh, $nbytes) = @_;
410     $nbytes =~ m/^[1-9]\d{0,5}$|^0$/ or badproto \*RO, "bad byte count";
411     my $d;
412     my $got = read $fh, $d, $nbytes;
413     $got==$nbytes or badproto_badread $fh, "data block";
414     return $d;
415 }
416
417 sub protocol_receive_file ($$) {
418     my ($fh, $ourfn) = @_;
419     printdebug "() $ourfn\n";
420     open PF, ">", $ourfn or die "$ourfn: $!";
421     for (;;) {
422         my ($y,$l) = protocol_expect {
423             m/^data-block (.*)$/ ? (1,$1) :
424             m/^data-end$/ ? (0,) :
425             ();
426         } $fh;
427         last unless $y;
428         my $d = protocol_read_bytes $fh, $l;
429         print PF $d or die $!;
430     }
431     close PF or die $!;
432 }
433
434 #---------- remote protocol support, responder ----------
435
436 sub responder_send_command ($) {
437     my ($command) = @_;
438     return unless $we_are_responder;
439     # called even without $we_are_responder
440     printdebug ">> $command\n";
441     print PO $command, "\n" or die $!;
442 }    
443
444 sub responder_send_file ($$) {
445     my ($keyword, $ourfn) = @_;
446     return unless $we_are_responder;
447     printdebug "]] $keyword $ourfn\n";
448     responder_send_command "file $keyword";
449     protocol_send_file \*PO, $ourfn;
450 }
451
452 sub responder_receive_files ($@) {
453     my ($keyword, @ourfns) = @_;
454     die unless $we_are_responder;
455     printdebug "[[ $keyword @ourfns\n";
456     responder_send_command "want $keyword";
457     foreach my $fn (@ourfns) {
458         protocol_receive_file \*PI, $fn;
459     }
460     printdebug "[[\$\n";
461     protocol_expect { m/^files-end$/ } \*PI;
462 }
463
464 #---------- remote protocol support, initiator ----------
465
466 sub initiator_expect (&) {
467     my ($match) = @_;
468     protocol_expect { &$match } \*RO;
469 }
470
471 #---------- end remote code ----------
472
473 sub progress {
474     if ($we_are_responder) {
475         my $m = join '', @_;
476         responder_send_command "progress ".length($m) or die $!;
477         print PO $m or die $!;
478     } else {
479         print @_, "\n";
480     }
481 }
482
483 our $ua;
484
485 sub url_get {
486     if (!$ua) {
487         $ua = LWP::UserAgent->new();
488         $ua->env_proxy;
489     }
490     my $what = $_[$#_];
491     progress "downloading $what...";
492     my $r = $ua->get(@_) or die $!;
493     return undef if $r->code == 404;
494     $r->is_success or fail "failed to fetch $what: ".$r->status_line;
495     return $r->decoded_content(charset => 'none');
496 }
497
498 our ($dscdata,$dscurl,$dsc,$dsc_checked,$skew_warning_vsn);
499
500 sub act_local () { return $dryrun_level <= 1; }
501 sub act_scary () { return !$dryrun_level; }
502
503 sub printdone {
504     if (!$dryrun_level) {
505         progress "$us ok: @_";
506     } else {
507         progress "would be ok: @_ (but dry run only)";
508     }
509 }
510
511 sub dryrun_report {
512     printcmd(\*STDERR,$debugprefix."#",@_);
513 }
514
515 sub runcmd_ordryrun {
516     if (act_scary()) {
517         runcmd @_;
518     } else {
519         dryrun_report @_;
520     }
521 }
522
523 sub runcmd_ordryrun_local {
524     if (act_local()) {
525         runcmd @_;
526     } else {
527         dryrun_report @_;
528     }
529 }
530
531 sub shell_cmd {
532     my ($first_shell, @cmd) = @_;
533     return qw(sh -ec), $first_shell.'; exec "$@"', 'x', @cmd;
534 }
535
536 our $helpmsg = <<END;
537 main usages:
538   dgit [dgit-opts] clone [dgit-opts] package [suite] [./dir|/dir]
539   dgit [dgit-opts] fetch|pull [dgit-opts] [suite]
540   dgit [dgit-opts] build [dpkg-buildpackage-opts]
541   dgit [dgit-opts] sbuild [sbuild-opts]
542   dgit [dgit-opts] push [dgit-opts] [suite]
543   dgit [dgit-opts] rpush build-host:build-dir ...
544 important dgit options:
545   -k<keyid>           sign tag and package with <keyid> instead of default
546   --dry-run -n        do not change anything, but go through the motions
547   --damp-run -L       like --dry-run but make local changes, without signing
548   --new -N            allow introducing a new package
549   --debug -D          increase debug level
550   -c<name>=<value>    set git config option (used directly by dgit too)
551 END
552
553 our $later_warning_msg = <<END;
554 Perhaps the upload is stuck in incoming.  Using the version from git.
555 END
556
557 sub badusage {
558     print STDERR "$us: @_\n", $helpmsg or die $!;
559     exit 8;
560 }
561
562 sub nextarg {
563     @ARGV or badusage "too few arguments";
564     return scalar shift @ARGV;
565 }
566
567 sub pre_help () {
568     not_necessarily_a_tree();
569 }
570 sub cmd_help () {
571     print $helpmsg or die $!;
572     exit 0;
573 }
574
575 our $td = $ENV{DGIT_TEST_DUMMY_DIR} || "DGIT_TEST_DUMMY_DIR-unset";
576
577 our %defcfg = ('dgit.default.distro' => 'debian',
578                'dgit.default.default-suite' => 'unstable',
579                'dgit.default.old-dsc-distro' => 'debian',
580                'dgit-suite.*-security.distro' => 'debian-security',
581                'dgit.default.username' => '',
582                'dgit.default.archive-query-default-component' => 'main',
583                'dgit.default.ssh' => 'ssh',
584                'dgit.default.archive-query' => 'madison:',
585                'dgit.default.sshpsql-dbname' => 'service=projectb',
586                'dgit.default.aptget-components' => 'main',
587                'dgit.default.dgit-tag-format' => 'new,old,maint',
588                'dgit.dsc-url-proto-ok.http'    => 'true',
589                'dgit.dsc-url-proto-ok.https'   => 'true',
590                'dgit.dsc-url-proto-ok.git'     => 'true',
591                'dgit.default.dsc-url-proto-ok' => 'false',
592                # old means "repo server accepts pushes with old dgit tags"
593                # new means "repo server accepts pushes with new dgit tags"
594                # maint means "repo server accepts split brain pushes"
595                # hist means "repo server may have old pushes without new tag"
596                #   ("hist" is implied by "old")
597                'dgit-distro.debian.archive-query' => 'ftpmasterapi:',
598                'dgit-distro.debian.git-check' => 'url',
599                'dgit-distro.debian.git-check-suffix' => '/info/refs',
600                'dgit-distro.debian.new-private-pushers' => 't',
601                'dgit-distro.debian/push.git-url' => '',
602                'dgit-distro.debian/push.git-host' => 'push.dgit.debian.org',
603                'dgit-distro.debian/push.git-user-force' => 'dgit',
604                'dgit-distro.debian/push.git-proto' => 'git+ssh://',
605                'dgit-distro.debian/push.git-path' => '/dgit/debian/repos',
606                'dgit-distro.debian/push.git-create' => 'true',
607                'dgit-distro.debian/push.git-check' => 'ssh-cmd',
608  'dgit-distro.debian.archive-query-url', 'https://api.ftp-master.debian.org/',
609 # 'dgit-distro.debian.archive-query-tls-key',
610 #    '/etc/ssl/certs/%HOST%.pem:/etc/dgit/%HOST%.pem',
611 # ^ this does not work because curl is broken nowadays
612 # Fixing #790093 properly will involve providing providing the key
613 # in some pacagke and maybe updating these paths.
614 #
615 # 'dgit-distro.debian.archive-query-tls-curl-args',
616 #   '--ca-path=/etc/ssl/ca-debian',
617 # ^ this is a workaround but works (only) on DSA-administered machines
618                'dgit-distro.debian.git-url' => 'https://git.dgit.debian.org',
619                'dgit-distro.debian.git-url-suffix' => '',
620                'dgit-distro.debian.upload-host' => 'ftp-master', # for dput
621                'dgit-distro.debian.mirror' => 'http://ftp.debian.org/debian/',
622  'dgit-distro.debian-security.archive-query' => 'aptget:',
623  'dgit-distro.debian-security.mirror' => 'http://security.debian.org/debian-security/',
624  'dgit-distro.debian-security.aptget-suite-map' => 's#-security$#/updates#',
625  'dgit-distro.debian-security.aptget-suite-rmap' => 's#$#-security#',
626  'dgit-distro.debian-security.nominal-distro' => 'debian',
627  'dgit-distro.debian.backports-quirk' => '(squeeze)-backports*',
628  'dgit-distro.debian-backports.mirror' => 'http://backports.debian.org/debian-backports/',
629                'dgit-distro.ubuntu.git-check' => 'false',
630  'dgit-distro.ubuntu.mirror' => 'http://archive.ubuntu.com/ubuntu',
631                'dgit-distro.test-dummy.ssh' => "$td/ssh",
632                'dgit-distro.test-dummy.username' => "alice",
633                'dgit-distro.test-dummy.git-check' => "ssh-cmd",
634                'dgit-distro.test-dummy.git-create' => "ssh-cmd",
635                'dgit-distro.test-dummy.git-url' => "$td/git",
636                'dgit-distro.test-dummy.git-host' => "git",
637                'dgit-distro.test-dummy.git-path' => "$td/git",
638                'dgit-distro.test-dummy.archive-query' => "dummycatapi:",
639                'dgit-distro.test-dummy.archive-query-url' => "file://$td/aq/",
640                'dgit-distro.test-dummy.mirror' => "file://$td/mirror/",
641                'dgit-distro.test-dummy.upload-host' => 'test-dummy',
642                );
643
644 our %gitcfgs;
645 our @gitcfgsources = qw(cmdline local global system);
646 our $invoked_in_git_tree = 1;
647
648 sub git_slurp_config () {
649     # This algoritm is a bit subtle, but this is needed so that for
650     # options which we want to be single-valued, we allow the
651     # different config sources to override properly.  See #835858.
652     foreach my $src (@gitcfgsources) {
653         next if $src eq 'cmdline';
654         # we do this ourselves since git doesn't handle it
655
656         $gitcfgs{$src} = git_slurp_config_src $src;
657     }
658 }
659
660 sub git_get_config ($) {
661     my ($c) = @_;
662     foreach my $src (@gitcfgsources) {
663         my $l = $gitcfgs{$src}{$c};
664         confess "internal error ($l $c)" if $l && !ref $l;
665         printdebug"C $c ".(defined $l ?
666                            join " ", map { messagequote "'$_'" } @$l :
667                            "undef")."\n"
668             if $debuglevel >= 4;
669         $l or next;
670         @$l==1 or badcfg "multiple values for $c".
671             " (in $src git config)" if @$l > 1;
672         return $l->[0];
673     }
674     return undef;
675 }
676
677 sub cfg {
678     foreach my $c (@_) {
679         return undef if $c =~ /RETURN-UNDEF/;
680         printdebug "C? $c\n" if $debuglevel >= 5;
681         my $v = git_get_config($c);
682         return $v if defined $v;
683         my $dv = $defcfg{$c};
684         if (defined $dv) {
685             printdebug "CD $c $dv\n" if $debuglevel >= 4;
686             return $dv;
687         }
688     }
689     badcfg "need value for one of: @_\n".
690         "$us: distro or suite appears not to be (properly) supported";
691 }
692
693 sub not_necessarily_a_tree () {
694     # needs to be called from pre_*
695     @gitcfgsources = grep { $_ ne 'local' } @gitcfgsources;
696     $invoked_in_git_tree = 0;
697 }
698
699 sub access_basedistro__noalias () {
700     if (defined $idistro) {
701         return $idistro;
702     } else {    
703         my $def = cfg("dgit-suite.$isuite.distro", 'RETURN-UNDEF');
704         return $def if defined $def;
705         foreach my $src (@gitcfgsources, 'internal') {
706             my $kl = $src eq 'internal' ? \%defcfg : $gitcfgs{$src};
707             next unless $kl;
708             foreach my $k (keys %$kl) {
709                 next unless $k =~ m#^dgit-suite\.(.*)\.distro$#;
710                 my $dpat = $1;
711                 next unless match_glob $dpat, $isuite;
712                 return $kl->{$k};
713             }
714         }
715         return cfg("dgit.default.distro");
716     }
717 }
718
719 sub access_basedistro () {
720     my $noalias = access_basedistro__noalias();
721     my $canon = cfg("dgit-distro.$noalias.alias-canon",'RETURN-UNDEF');
722     return $canon // $noalias;
723 }
724
725 sub access_nomdistro () {
726     my $base = access_basedistro();
727     my $r = cfg("dgit-distro.$base.nominal-distro",'RETURN-UNDEF') // $base;
728     $r =~ m/^$distro_re$/ or badcfg
729  "bad syntax for (nominal) distro \`$r' (does not match /^$distro_re$/)";
730     return $r;
731 }
732
733 sub access_quirk () {
734     # returns (quirk name, distro to use instead or undef, quirk-specific info)
735     my $basedistro = access_basedistro();
736     my $backports_quirk = cfg("dgit-distro.$basedistro.backports-quirk",
737                               'RETURN-UNDEF');
738     if (defined $backports_quirk) {
739         my $re = $backports_quirk;
740         $re =~ s/[^-0-9a-z_\%*()]/\\$&/ig;
741         $re =~ s/\*/.*/g;
742         $re =~ s/\%/([-0-9a-z_]+)/
743             or $re =~ m/[()]/ or badcfg "backports-quirk needs \% or ( )";
744         if ($isuite =~ m/^$re$/) {
745             return ('backports',"$basedistro-backports",$1);
746         }
747     }
748     return ('none',undef);
749 }
750
751 our $access_forpush;
752
753 sub parse_cfg_bool ($$$) {
754     my ($what,$def,$v) = @_;
755     $v //= $def;
756     return
757         $v =~ m/^[ty1]/ ? 1 :
758         $v =~ m/^[fn0]/ ? 0 :
759         badcfg "$what needs t (true, y, 1) or f (false, n, 0) not \`$v'";
760 }       
761
762 sub access_forpush_config () {
763     my $d = access_basedistro();
764
765     return 1 if
766         $new_package &&
767         parse_cfg_bool('new-private-pushers', 0,
768                        cfg("dgit-distro.$d.new-private-pushers",
769                            'RETURN-UNDEF'));
770
771     my $v = cfg("dgit-distro.$d.readonly", 'RETURN-UNDEF');
772     $v //= 'a';
773     return
774         $v =~ m/^[ty1]/ ? 0 : # force readonly,    forpush = 0
775         $v =~ m/^[fn0]/ ? 1 : # force nonreadonly, forpush = 1
776         $v =~ m/^[a]/  ? '' : # auto,              forpush = ''
777         badcfg "readonly needs t (true, y, 1) or f (false, n, 0) or a (auto)";
778 }
779
780 sub access_forpush () {
781     $access_forpush //= access_forpush_config();
782     return $access_forpush;
783 }
784
785 sub pushing () {
786     die "$access_forpush ?" if ($access_forpush // 1) ne 1;
787     badcfg "pushing but distro is configured readonly"
788         if access_forpush_config() eq '0';
789     $access_forpush = 1;
790     $supplementary_message = <<'END' unless $we_are_responder;
791 Push failed, before we got started.
792 You can retry the push, after fixing the problem, if you like.
793 END
794     parseopts_late_defaults();
795 }
796
797 sub notpushing () {
798     parseopts_late_defaults();
799 }
800
801 sub supplementary_message ($) {
802     my ($msg) = @_;
803     if (!$we_are_responder) {
804         $supplementary_message = $msg;
805         return;
806     } elsif ($protovsn >= 3) {
807         responder_send_command "supplementary-message ".length($msg)
808             or die $!;
809         print PO $msg or die $!;
810     }
811 }
812
813 sub access_distros () {
814     # Returns list of distros to try, in order
815     #
816     # We want to try:
817     #    0. `instead of' distro name(s) we have been pointed to
818     #    1. the access_quirk distro, if any
819     #    2a. the user's specified distro, or failing that  } basedistro
820     #    2b. the distro calculated from the suite          }
821     my @l = access_basedistro();
822
823     my (undef,$quirkdistro) = access_quirk();
824     unshift @l, $quirkdistro;
825     unshift @l, $instead_distro;
826     @l = grep { defined } @l;
827
828     push @l, access_nomdistro();
829
830     if (access_forpush()) {
831         @l = map { ("$_/push", $_) } @l;
832     }
833     @l;
834 }
835
836 sub access_cfg_cfgs (@) {
837     my (@keys) = @_;
838     my @cfgs;
839     # The nesting of these loops determines the search order.  We put
840     # the key loop on the outside so that we search all the distros
841     # for each key, before going on to the next key.  That means that
842     # if access_cfg is called with a more specific, and then a less
843     # specific, key, an earlier distro can override the less specific
844     # without necessarily overriding any more specific keys.  (If the
845     # distro wants to override the more specific keys it can simply do
846     # so; whereas if we did the loop the other way around, it would be
847     # impossible to for an earlier distro to override a less specific
848     # key but not the more specific ones without restating the unknown
849     # values of the more specific keys.
850     my @realkeys;
851     my @rundef;
852     # We have to deal with RETURN-UNDEF specially, so that we don't
853     # terminate the search prematurely.
854     foreach (@keys) {
855         if (m/RETURN-UNDEF/) { push @rundef, $_; last; }
856         push @realkeys, $_
857     }
858     foreach my $d (access_distros()) {
859         push @cfgs, map { "dgit-distro.$d.$_" } @realkeys;
860     }
861     push @cfgs, map { "dgit.default.$_" } @realkeys;
862     push @cfgs, @rundef;
863     return @cfgs;
864 }
865
866 sub access_cfg (@) {
867     my (@keys) = @_;
868     my (@cfgs) = access_cfg_cfgs(@keys);
869     my $value = cfg(@cfgs);
870     return $value;
871 }
872
873 sub access_cfg_bool ($$) {
874     my ($def, @keys) = @_;
875     parse_cfg_bool($keys[0], $def, access_cfg(@keys, 'RETURN-UNDEF'));
876 }
877
878 sub string_to_ssh ($) {
879     my ($spec) = @_;
880     if ($spec =~ m/\s/) {
881         return qw(sh -ec), 'exec '.$spec.' "$@"', 'x';
882     } else {
883         return ($spec);
884     }
885 }
886
887 sub access_cfg_ssh () {
888     my $gitssh = access_cfg('ssh', 'RETURN-UNDEF');
889     if (!defined $gitssh) {
890         return @ssh;
891     } else {
892         return string_to_ssh $gitssh;
893     }
894 }
895
896 sub access_runeinfo ($) {
897     my ($info) = @_;
898     return ": dgit ".access_basedistro()." $info ;";
899 }
900
901 sub access_someuserhost ($) {
902     my ($some) = @_;
903     my $user = access_cfg("$some-user-force", 'RETURN-UNDEF');
904     defined($user) && length($user) or
905         $user = access_cfg("$some-user",'username');
906     my $host = access_cfg("$some-host");
907     return length($user) ? "$user\@$host" : $host;
908 }
909
910 sub access_gituserhost () {
911     return access_someuserhost('git');
912 }
913
914 sub access_giturl (;$) {
915     my ($optional) = @_;
916     my $url = access_cfg('git-url','RETURN-UNDEF');
917     my $suffix;
918     if (!length $url) {
919         my $proto = access_cfg('git-proto', 'RETURN-UNDEF');
920         return undef unless defined $proto;
921         $url =
922             $proto.
923             access_gituserhost().
924             access_cfg('git-path');
925     } else {
926         $suffix = access_cfg('git-url-suffix','RETURN-UNDEF');
927     }
928     $suffix //= '.git';
929     return "$url/$package$suffix";
930 }              
931
932 sub parsecontrolfh ($$;$) {
933     my ($fh, $desc, $allowsigned) = @_;
934     our $dpkgcontrolhash_noissigned;
935     my $c;
936     for (;;) {
937         my %opts = ('name' => $desc);
938         $opts{allow_pgp}= $allowsigned || !$dpkgcontrolhash_noissigned;
939         $c = Dpkg::Control::Hash->new(%opts);
940         $c->parse($fh,$desc) or die "parsing of $desc failed";
941         last if $allowsigned;
942         last if $dpkgcontrolhash_noissigned;
943         my $issigned= $c->get_option('is_pgp_signed');
944         if (!defined $issigned) {
945             $dpkgcontrolhash_noissigned= 1;
946             seek $fh, 0,0 or die "seek $desc: $!";
947         } elsif ($issigned) {
948             fail "control file $desc is (already) PGP-signed. ".
949                 " Note that dgit push needs to modify the .dsc and then".
950                 " do the signature itself";
951         } else {
952             last;
953         }
954     }
955     return $c;
956 }
957
958 sub parsecontrol {
959     my ($file, $desc, $allowsigned) = @_;
960     my $fh = new IO::Handle;
961     open $fh, '<', $file or die "$file: $!";
962     my $c = parsecontrolfh($fh,$desc,$allowsigned);
963     $fh->error and die $!;
964     close $fh;
965     return $c;
966 }
967
968 sub getfield ($$) {
969     my ($dctrl,$field) = @_;
970     my $v = $dctrl->{$field};
971     return $v if defined $v;
972     fail "missing field $field in ".$dctrl->get_option('name');
973 }
974
975 sub parsechangelog {
976     my $c = Dpkg::Control::Hash->new(name => 'parsed changelog');
977     my $p = new IO::Handle;
978     my @cmd = (qw(dpkg-parsechangelog), @_);
979     open $p, '-|', @cmd or die $!;
980     $c->parse($p);
981     $?=0; $!=0; close $p or failedcmd @cmd;
982     return $c;
983 }
984
985 sub commit_getclogp ($) {
986     # Returns the parsed changelog hashref for a particular commit
987     my ($objid) = @_;
988     our %commit_getclogp_memo;
989     my $memo = $commit_getclogp_memo{$objid};
990     return $memo if $memo;
991
992     my $mclog = dgit_privdir()."clog";
993     runcmd shell_cmd "exec >$mclog", @git, qw(cat-file blob),
994         "$objid:debian/changelog";
995     $commit_getclogp_memo{$objid} = parsechangelog("-l$mclog");
996 }
997
998 sub parse_dscdata () {
999     my $dscfh = new IO::File \$dscdata, '<' or die $!;
1000     printdebug Dumper($dscdata) if $debuglevel>1;
1001     $dsc = parsecontrolfh($dscfh,$dscurl,1);
1002     printdebug Dumper($dsc) if $debuglevel>1;
1003 }
1004
1005 our %rmad;
1006
1007 sub archive_query ($;@) {
1008     my ($method) = shift @_;
1009     fail "this operation does not support multiple comma-separated suites"
1010         if $isuite =~ m/,/;
1011     my $query = access_cfg('archive-query','RETURN-UNDEF');
1012     $query =~ s/^(\w+):// or badcfg "invalid archive-query method \`$query'";
1013     my $proto = $1;
1014     my $data = $'; #';
1015     { no strict qw(refs); &{"${method}_${proto}"}($proto,$data,@_); }
1016 }
1017
1018 sub archive_query_prepend_mirror {
1019     my $m = access_cfg('mirror');
1020     return map { [ $_->[0], $m.$_->[1], @$_[2..$#$_] ] } @_;
1021 }
1022
1023 sub pool_dsc_subpath ($$) {
1024     my ($vsn,$component) = @_; # $package is implict arg
1025     my $prefix = substr($package, 0, $package =~ m/^l/ ? 4 : 1);
1026     return "/pool/$component/$prefix/$package/".dscfn($vsn);
1027 }
1028
1029 sub cfg_apply_map ($$$) {
1030     my ($varref, $what, $mapspec) = @_;
1031     return unless $mapspec;
1032
1033     printdebug "config $what EVAL{ $mapspec; }\n";
1034     $_ = $$varref;
1035     eval "package Dgit::Config; $mapspec;";
1036     die $@ if $@;
1037     $$varref = $_;
1038 }
1039
1040 #---------- `ftpmasterapi' archive query method (nascent) ----------
1041
1042 sub archive_api_query_cmd ($) {
1043     my ($subpath) = @_;
1044     my @cmd = (@curl, qw(-sS));
1045     my $url = access_cfg('archive-query-url');
1046     if ($url =~ m#^https://([-.0-9a-z]+)/#) {
1047         my $host = $1;
1048         my $keys = access_cfg('archive-query-tls-key','RETURN-UNDEF') //'';
1049         foreach my $key (split /\:/, $keys) {
1050             $key =~ s/\%HOST\%/$host/g;
1051             if (!stat $key) {
1052                 fail "for $url: stat $key: $!" unless $!==ENOENT;
1053                 next;
1054             }
1055             fail "config requested specific TLS key but do not know".
1056                 " how to get curl to use exactly that EE key ($key)";
1057 #           push @cmd, "--cacert", $key, "--capath", "/dev/enoent";
1058 #           # Sadly the above line does not work because of changes
1059 #           # to gnutls.   The real fix for #790093 may involve
1060 #           # new curl options.
1061             last;
1062         }
1063         # Fixing #790093 properly will involve providing a value
1064         # for this on clients.
1065         my $kargs = access_cfg('archive-query-tls-curl-ca-args','RETURN-UNDEF');
1066         push @cmd, split / /, $kargs if defined $kargs;
1067     }
1068     push @cmd, $url.$subpath;
1069     return @cmd;
1070 }
1071
1072 sub api_query ($$;$) {
1073     use JSON;
1074     my ($data, $subpath, $ok404) = @_;
1075     badcfg "ftpmasterapi archive query method takes no data part"
1076         if length $data;
1077     my @cmd = archive_api_query_cmd($subpath);
1078     my $url = $cmd[$#cmd];
1079     push @cmd, qw(-w %{http_code});
1080     my $json = cmdoutput @cmd;
1081     unless ($json =~ s/\d+\d+\d$//) {
1082         failedcmd_report_cmd undef, @cmd;
1083         fail "curl failed to print 3-digit HTTP code";
1084     }
1085     my $code = $&;
1086     return undef if $code eq '404' && $ok404;
1087     fail "fetch of $url gave HTTP code $code"
1088         unless $url =~ m#^file://# or $code =~ m/^2/;
1089     return decode_json($json);
1090 }
1091
1092 sub canonicalise_suite_ftpmasterapi {
1093     my ($proto,$data) = @_;
1094     my $suites = api_query($data, 'suites');
1095     my @matched;
1096     foreach my $entry (@$suites) {
1097         next unless grep { 
1098             my $v = $entry->{$_};
1099             defined $v && $v eq $isuite;
1100         } qw(codename name);
1101         push @matched, $entry;
1102     }
1103     fail "unknown suite $isuite" unless @matched;
1104     my $cn;
1105     eval {
1106         @matched==1 or die "multiple matches for suite $isuite\n";
1107         $cn = "$matched[0]{codename}";
1108         defined $cn or die "suite $isuite info has no codename\n";
1109         $cn =~ m/^$suite_re$/ or die "suite $isuite maps to bad codename\n";
1110     };
1111     die "bad ftpmaster api response: $@\n".Dumper(\@matched)
1112         if length $@;
1113     return $cn;
1114 }
1115
1116 sub archive_query_ftpmasterapi {
1117     my ($proto,$data) = @_;
1118     my $info = api_query($data, "dsc_in_suite/$isuite/$package");
1119     my @rows;
1120     my $digester = Digest::SHA->new(256);
1121     foreach my $entry (@$info) {
1122         eval {
1123             my $vsn = "$entry->{version}";
1124             my ($ok,$msg) = version_check $vsn;
1125             die "bad version: $msg\n" unless $ok;
1126             my $component = "$entry->{component}";
1127             $component =~ m/^$component_re$/ or die "bad component";
1128             my $filename = "$entry->{filename}";
1129             $filename && $filename !~ m#[^-+:._~0-9a-zA-Z/]|^[/.]|/[/.]#
1130                 or die "bad filename";
1131             my $sha256sum = "$entry->{sha256sum}";
1132             $sha256sum =~ m/^[0-9a-f]+$/ or die "bad sha256sum";
1133             push @rows, [ $vsn, "/pool/$component/$filename",
1134                           $digester, $sha256sum ];
1135         };
1136         die "bad ftpmaster api response: $@\n".Dumper($entry)
1137             if length $@;
1138     }
1139     @rows = sort { -version_compare($a->[0],$b->[0]) } @rows;
1140     return archive_query_prepend_mirror @rows;
1141 }
1142
1143 sub file_in_archive_ftpmasterapi {
1144     my ($proto,$data,$filename) = @_;
1145     my $pat = $filename;
1146     $pat =~ s/_/\\_/g;
1147     $pat = "%/$pat";
1148     $pat =~ s#[^-+_.0-9a-z/]# sprintf '%%%02x', ord $& #ge;
1149     my $info = api_query($data, "file_in_archive/$pat", 1);
1150 }
1151
1152 #---------- `aptget' archive query method ----------
1153
1154 our $aptget_base;
1155 our $aptget_releasefile;
1156 our $aptget_configpath;
1157
1158 sub aptget_aptget   () { return @aptget,   qw(-c), $aptget_configpath; }
1159 sub aptget_aptcache () { return @aptcache, qw(-c), $aptget_configpath; }
1160
1161 sub aptget_cache_clean {
1162     runcmd_ordryrun_local qw(sh -ec),
1163         'cd "$1"; find -atime +30 -type f -print0 | xargs -0r rm --',
1164         'x', $aptget_base;
1165 }
1166
1167 sub aptget_lock_acquire () {
1168     my $lockfile = "$aptget_base/lock";
1169     open APTGET_LOCK, '>', $lockfile or die "open $lockfile: $!";
1170     flock APTGET_LOCK, LOCK_EX or die "lock $lockfile: $!";
1171 }
1172
1173 sub aptget_prep ($) {
1174     my ($data) = @_;
1175     return if defined $aptget_base;
1176
1177     badcfg "aptget archive query method takes no data part"
1178         if length $data;
1179
1180     my $cache = $ENV{XDG_CACHE_DIR} // "$ENV{HOME}/.cache";
1181
1182     ensuredir $cache;
1183     ensuredir "$cache/dgit";
1184     my $cachekey =
1185         access_cfg('aptget-cachekey','RETURN-UNDEF')
1186         // access_nomdistro();
1187
1188     $aptget_base = "$cache/dgit/aptget";
1189     ensuredir $aptget_base;
1190
1191     my $quoted_base = $aptget_base;
1192     die "$quoted_base contains bad chars, cannot continue"
1193         if $quoted_base =~ m/["\\]/; # apt.conf(5) says no escaping :-/
1194
1195     ensuredir $aptget_base;
1196
1197     aptget_lock_acquire();
1198
1199     aptget_cache_clean();
1200
1201     $aptget_configpath = "$aptget_base/apt.conf#$cachekey";
1202     my $sourceslist = "source.list#$cachekey";
1203
1204     my $aptsuites = $isuite;
1205     cfg_apply_map(\$aptsuites, 'suite map',
1206                   access_cfg('aptget-suite-map', 'RETURN-UNDEF'));
1207
1208     open SRCS, ">", "$aptget_base/$sourceslist" or die $!;
1209     printf SRCS "deb-src %s %s %s\n",
1210         access_cfg('mirror'),
1211         $aptsuites,
1212         access_cfg('aptget-components')
1213         or die $!;
1214
1215     ensuredir "$aptget_base/cache";
1216     ensuredir "$aptget_base/lists";
1217
1218     open CONF, ">", $aptget_configpath or die $!;
1219     print CONF <<END;
1220 Debug::NoLocking "true";
1221 APT::Get::List-Cleanup "false";
1222 #clear APT::Update::Post-Invoke-Success;
1223 Dir::Etc::SourceList "$quoted_base/$sourceslist";
1224 Dir::State::Lists "$quoted_base/lists";
1225 Dir::Etc::preferences "$quoted_base/preferences";
1226 Dir::Cache::srcpkgcache "$quoted_base/cache/srcs#$cachekey";
1227 Dir::Cache::pkgcache "$quoted_base/cache/pkgs#$cachekey";
1228 END
1229
1230     foreach my $key (qw(
1231                         Dir::Cache
1232                         Dir::State
1233                         Dir::Cache::Archives
1234                         Dir::Etc::SourceParts
1235                         Dir::Etc::preferencesparts
1236                       )) {
1237         ensuredir "$aptget_base/$key";
1238         print CONF "$key \"$quoted_base/$key\";\n" or die $!;
1239     };
1240
1241     my $oldatime = (time // die $!) - 1;
1242     foreach my $oldlist (<$aptget_base/lists/*Release>) {
1243         next unless stat_exists $oldlist;
1244         my ($mtime) = (stat _)[9];
1245         utime $oldatime, $mtime, $oldlist or die "$oldlist $!";
1246     }
1247
1248     runcmd_ordryrun_local aptget_aptget(), qw(update);
1249
1250     my @releasefiles;
1251     foreach my $oldlist (<$aptget_base/lists/*Release>) {
1252         next unless stat_exists $oldlist;
1253         my ($atime) = (stat _)[8];
1254         next if $atime == $oldatime;
1255         push @releasefiles, $oldlist;
1256     }
1257     my @inreleasefiles = grep { m#/InRelease$# } @releasefiles;
1258     @releasefiles = @inreleasefiles if @inreleasefiles;
1259     die "apt updated wrong number of Release files (@releasefiles), erk"
1260         unless @releasefiles == 1;
1261
1262     ($aptget_releasefile) = @releasefiles;
1263 }
1264
1265 sub canonicalise_suite_aptget {
1266     my ($proto,$data) = @_;
1267     aptget_prep($data);
1268
1269     my $release = parsecontrol $aptget_releasefile, "Release file", 1;
1270
1271     foreach my $name (qw(Codename Suite)) {
1272         my $val = $release->{$name};
1273         if (defined $val) {
1274             printdebug "release file $name: $val\n";
1275             $val =~ m/^$suite_re$/o or fail
1276  "Release file ($aptget_releasefile) specifies intolerable $name";
1277             cfg_apply_map(\$val, 'suite rmap',
1278                           access_cfg('aptget-suite-rmap', 'RETURN-UNDEF'));
1279             return $val
1280         }
1281     }
1282     return $isuite;
1283 }
1284
1285 sub archive_query_aptget {
1286     my ($proto,$data) = @_;
1287     aptget_prep($data);
1288
1289     ensuredir "$aptget_base/source";
1290     foreach my $old (<$aptget_base/source/*.dsc>) {
1291         unlink $old or die "$old: $!";
1292     }
1293
1294     my $showsrc = cmdoutput aptget_aptcache(), qw(showsrc), $package;
1295     return () unless $showsrc =~ m/^package:\s*\Q$package\E\s*$/mi;
1296     # avoids apt-get source failing with ambiguous error code
1297
1298     runcmd_ordryrun_local
1299         shell_cmd 'cd "$1"/source; shift', $aptget_base,
1300         aptget_aptget(), qw(--download-only --only-source source), $package;
1301
1302     my @dscs = <$aptget_base/source/*.dsc>;
1303     fail "apt-get source did not produce a .dsc" unless @dscs;
1304     fail "apt-get source produced several .dscs (@dscs)" unless @dscs==1;
1305
1306     my $pre_dsc = parsecontrol $dscs[0], $dscs[0], 1;
1307
1308     use URI::Escape;
1309     my $uri = "file://". uri_escape $dscs[0];
1310     $uri =~ s{\%2f}{/}gi;
1311     return [ (getfield $pre_dsc, 'Version'), $uri ];
1312 }
1313
1314 sub file_in_archive_aptget () { return undef; }
1315
1316 #---------- `dummyapicat' archive query method ----------
1317
1318 sub archive_query_dummycatapi { archive_query_ftpmasterapi @_; }
1319 sub canonicalise_suite_dummycatapi { canonicalise_suite_ftpmasterapi @_; }
1320
1321 sub file_in_archive_dummycatapi ($$$) {
1322     my ($proto,$data,$filename) = @_;
1323     my $mirror = access_cfg('mirror');
1324     $mirror =~ s#^file://#/# or die "$mirror ?";
1325     my @out;
1326     my @cmd = (qw(sh -ec), '
1327             cd "$1"
1328             find -name "$2" -print0 |
1329             xargs -0r sha256sum
1330         ', qw(x), $mirror, $filename);
1331     debugcmd "-|", @cmd;
1332     open FIA, "-|", @cmd or die $!;
1333     while (<FIA>) {
1334         chomp or die;
1335         printdebug "| $_\n";
1336         m/^(\w+)  (\S+)$/ or die "$_ ?";
1337         push @out, { sha256sum => $1, filename => $2 };
1338     }
1339     close FIA or die failedcmd @cmd;
1340     return \@out;
1341 }
1342
1343 #---------- `madison' archive query method ----------
1344
1345 sub archive_query_madison {
1346     return archive_query_prepend_mirror
1347         map { [ @$_[0..1] ] } madison_get_parse(@_);
1348 }
1349
1350 sub madison_get_parse {
1351     my ($proto,$data) = @_;
1352     die unless $proto eq 'madison';
1353     if (!length $data) {
1354         $data= access_cfg('madison-distro','RETURN-UNDEF');
1355         $data //= access_basedistro();
1356     }
1357     $rmad{$proto,$data,$package} ||= cmdoutput
1358         qw(rmadison -asource),"-s$isuite","-u$data",$package;
1359     my $rmad = $rmad{$proto,$data,$package};
1360
1361     my @out;
1362     foreach my $l (split /\n/, $rmad) {
1363         $l =~ m{^ \s*( [^ \t|]+ )\s* \|
1364                   \s*( [^ \t|]+ )\s* \|
1365                   \s*( [^ \t|/]+ )(?:/([^ \t|/]+))? \s* \|
1366                   \s*( [^ \t|]+ )\s* }x or die "$rmad ?";
1367         $1 eq $package or die "$rmad $package ?";
1368         my $vsn = $2;
1369         my $newsuite = $3;
1370         my $component;
1371         if (defined $4) {
1372             $component = $4;
1373         } else {
1374             $component = access_cfg('archive-query-default-component');
1375         }
1376         $5 eq 'source' or die "$rmad ?";
1377         push @out, [$vsn,pool_dsc_subpath($vsn,$component),$newsuite];
1378     }
1379     return sort { -version_compare($a->[0],$b->[0]); } @out;
1380 }
1381
1382 sub canonicalise_suite_madison {
1383     # madison canonicalises for us
1384     my @r = madison_get_parse(@_);
1385     @r or fail
1386         "unable to canonicalise suite using package $package".
1387         " which does not appear to exist in suite $isuite;".
1388         " --existing-package may help";
1389     return $r[0][2];
1390 }
1391
1392 sub file_in_archive_madison { return undef; }
1393
1394 #---------- `sshpsql' archive query method ----------
1395
1396 sub sshpsql ($$$) {
1397     my ($data,$runeinfo,$sql) = @_;
1398     if (!length $data) {
1399         $data= access_someuserhost('sshpsql').':'.
1400             access_cfg('sshpsql-dbname');
1401     }
1402     $data =~ m/:/ or badcfg "invalid sshpsql method string \`$data'";
1403     my ($userhost,$dbname) = ($`,$'); #';
1404     my @rows;
1405     my @cmd = (access_cfg_ssh, $userhost,
1406                access_runeinfo("ssh-psql $runeinfo").
1407                " export LC_MESSAGES=C; export LC_CTYPE=C;".
1408                " ".shellquote qw(psql -A), $dbname, qw(-c), $sql);
1409     debugcmd "|",@cmd;
1410     open P, "-|", @cmd or die $!;
1411     while (<P>) {
1412         chomp or die;
1413         printdebug(">|$_|\n");
1414         push @rows, $_;
1415     }
1416     $!=0; $?=0; close P or failedcmd @cmd;
1417     @rows or die;
1418     my $nrows = pop @rows;
1419     $nrows =~ s/^\((\d+) rows?\)$/$1/ or die "$nrows ?";
1420     @rows == $nrows+1 or die "$nrows ".(scalar @rows)." ?";
1421     @rows = map { [ split /\|/, $_ ] } @rows;
1422     my $ncols = scalar @{ shift @rows };
1423     die if grep { scalar @$_ != $ncols } @rows;
1424     return @rows;
1425 }
1426
1427 sub sql_injection_check {
1428     foreach (@_) { die "$_ $& ?" if m{[^-+=:_.,/0-9a-zA-Z]}; }
1429 }
1430
1431 sub archive_query_sshpsql ($$) {
1432     my ($proto,$data) = @_;
1433     sql_injection_check $isuite, $package;
1434     my @rows = sshpsql($data, "archive-query $isuite $package", <<END);
1435         SELECT source.version, component.name, files.filename, files.sha256sum
1436           FROM source
1437           JOIN src_associations ON source.id = src_associations.source
1438           JOIN suite ON suite.id = src_associations.suite
1439           JOIN dsc_files ON dsc_files.source = source.id
1440           JOIN files_archive_map ON files_archive_map.file_id = dsc_files.file
1441           JOIN component ON component.id = files_archive_map.component_id
1442           JOIN files ON files.id = dsc_files.file
1443          WHERE ( suite.suite_name='$isuite' OR suite.codename='$isuite' )
1444            AND source.source='$package'
1445            AND files.filename LIKE '%.dsc';
1446 END
1447     @rows = sort { -version_compare($a->[0],$b->[0]) } @rows;
1448     my $digester = Digest::SHA->new(256);
1449     @rows = map {
1450         my ($vsn,$component,$filename,$sha256sum) = @$_;
1451         [ $vsn, "/pool/$component/$filename",$digester,$sha256sum ];
1452     } @rows;
1453     return archive_query_prepend_mirror @rows;
1454 }
1455
1456 sub canonicalise_suite_sshpsql ($$) {
1457     my ($proto,$data) = @_;
1458     sql_injection_check $isuite;
1459     my @rows = sshpsql($data, "canonicalise-suite $isuite", <<END);
1460         SELECT suite.codename
1461           FROM suite where suite_name='$isuite' or codename='$isuite';
1462 END
1463     @rows = map { $_->[0] } @rows;
1464     fail "unknown suite $isuite" unless @rows;
1465     die "ambiguous $isuite: @rows ?" if @rows>1;
1466     return $rows[0];
1467 }
1468
1469 sub file_in_archive_sshpsql ($$$) { return undef; }
1470
1471 #---------- `dummycat' archive query method ----------
1472
1473 sub canonicalise_suite_dummycat ($$) {
1474     my ($proto,$data) = @_;
1475     my $dpath = "$data/suite.$isuite";
1476     if (!open C, "<", $dpath) {
1477         $!==ENOENT or die "$dpath: $!";
1478         printdebug "dummycat canonicalise_suite $isuite $dpath ENOENT\n";
1479         return $isuite;
1480     }
1481     $!=0; $_ = <C>;
1482     chomp or die "$dpath: $!";
1483     close C;
1484     printdebug "dummycat canonicalise_suite $isuite $dpath = $_\n";
1485     return $_;
1486 }
1487
1488 sub archive_query_dummycat ($$) {
1489     my ($proto,$data) = @_;
1490     canonicalise_suite();
1491     my $dpath = "$data/package.$csuite.$package";
1492     if (!open C, "<", $dpath) {
1493         $!==ENOENT or die "$dpath: $!";
1494         printdebug "dummycat query $csuite $package $dpath ENOENT\n";
1495         return ();
1496     }
1497     my @rows;
1498     while (<C>) {
1499         next if m/^\#/;
1500         next unless m/\S/;
1501         die unless chomp;
1502         printdebug "dummycat query $csuite $package $dpath | $_\n";
1503         my @row = split /\s+/, $_;
1504         @row==2 or die "$dpath: $_ ?";
1505         push @rows, \@row;
1506     }
1507     C->error and die "$dpath: $!";
1508     close C;
1509     return archive_query_prepend_mirror
1510         sort { -version_compare($a->[0],$b->[0]); } @rows;
1511 }
1512
1513 sub file_in_archive_dummycat () { return undef; }
1514
1515 #---------- tag format handling ----------
1516
1517 sub access_cfg_tagformats () {
1518     split /\,/, access_cfg('dgit-tag-format');
1519 }
1520
1521 sub access_cfg_tagformats_can_splitbrain () {
1522     my %y = map { $_ => 1 } access_cfg_tagformats;
1523     foreach my $needtf (qw(new maint)) {
1524         next if $y{$needtf};
1525         return 0;
1526     }
1527     return 1;
1528 }
1529
1530 sub need_tagformat ($$) {
1531     my ($fmt, $why) = @_;
1532     fail "need to use tag format $fmt ($why) but also need".
1533         " to use tag format $tagformat_want->[0] ($tagformat_want->[1])".
1534         " - no way to proceed"
1535         if $tagformat_want && $tagformat_want->[0] ne $fmt;
1536     $tagformat_want = [$fmt, $why, $tagformat_want->[2] // 0];
1537 }
1538
1539 sub select_tagformat () {
1540     # sets $tagformatfn
1541     return if $tagformatfn && !$tagformat_want;
1542     die 'bug' if $tagformatfn && $tagformat_want;
1543     # ... $tagformat_want assigned after previous select_tagformat
1544
1545     my (@supported) = grep { $_ =~ m/^(?:old|new)$/ } access_cfg_tagformats();
1546     printdebug "select_tagformat supported @supported\n";
1547
1548     $tagformat_want //= [ $supported[0], "distro access configuration", 0 ];
1549     printdebug "select_tagformat specified @$tagformat_want\n";
1550
1551     my ($fmt,$why,$override) = @$tagformat_want;
1552
1553     fail "target distro supports tag formats @supported".
1554         " but have to use $fmt ($why)"
1555         unless $override
1556             or grep { $_ eq $fmt } @supported;
1557
1558     $tagformat_want = undef;
1559     $tagformat = $fmt;
1560     $tagformatfn = ${*::}{"debiantag_$fmt"};
1561
1562     fail "trying to use unknown tag format \`$fmt' ($why) !"
1563         unless $tagformatfn;
1564 }
1565
1566 #---------- archive query entrypoints and rest of program ----------
1567
1568 sub canonicalise_suite () {
1569     return if defined $csuite;
1570     fail "cannot operate on $isuite suite" if $isuite eq 'UNRELEASED';
1571     $csuite = archive_query('canonicalise_suite');
1572     if ($isuite ne $csuite) {
1573         progress "canonical suite name for $isuite is $csuite";
1574     } else {
1575         progress "canonical suite name is $csuite";
1576     }
1577 }
1578
1579 sub get_archive_dsc () {
1580     canonicalise_suite();
1581     my @vsns = archive_query('archive_query');
1582     foreach my $vinfo (@vsns) {
1583         my ($vsn,$vsn_dscurl,$digester,$digest) = @$vinfo;
1584         $dscurl = $vsn_dscurl;
1585         $dscdata = url_get($dscurl);
1586         if (!$dscdata) {
1587             $skew_warning_vsn = $vsn if !defined $skew_warning_vsn;
1588             next;
1589         }
1590         if ($digester) {
1591             $digester->reset();
1592             $digester->add($dscdata);
1593             my $got = $digester->hexdigest();
1594             $got eq $digest or
1595                 fail "$dscurl has hash $got but".
1596                     " archive told us to expect $digest";
1597         }
1598         parse_dscdata();
1599         my $fmt = getfield $dsc, 'Format';
1600         $format_ok{$fmt} or forceable_fail [qw(unsupported-source-format)],
1601             "unsupported source format $fmt, sorry";
1602             
1603         $dsc_checked = !!$digester;
1604         printdebug "get_archive_dsc: Version ".(getfield $dsc, 'Version')."\n";
1605         return;
1606     }
1607     $dsc = undef;
1608     printdebug "get_archive_dsc: nothing in archive, returning undef\n";
1609 }
1610
1611 sub check_for_git ();
1612 sub check_for_git () {
1613     # returns 0 or 1
1614     my $how = access_cfg('git-check');
1615     if ($how eq 'ssh-cmd') {
1616         my @cmd =
1617             (access_cfg_ssh, access_gituserhost(),
1618              access_runeinfo("git-check $package").
1619              " set -e; cd ".access_cfg('git-path').";".
1620              " if test -d $package.git; then echo 1; else echo 0; fi");
1621         my $r= cmdoutput @cmd;
1622         if (defined $r and $r =~ m/^divert (\w+)$/) {
1623             my $divert=$1;
1624             my ($usedistro,) = access_distros();
1625             # NB that if we are pushing, $usedistro will be $distro/push
1626             $instead_distro= cfg("dgit-distro.$usedistro.diverts.$divert");
1627             $instead_distro =~ s{^/}{ access_basedistro()."/" }e;
1628             progress "diverting to $divert (using config for $instead_distro)";
1629             return check_for_git();
1630         }
1631         failedcmd @cmd unless defined $r and $r =~ m/^[01]$/;
1632         return $r+0;
1633     } elsif ($how eq 'url') {
1634         my $prefix = access_cfg('git-check-url','git-url');
1635         my $suffix = access_cfg('git-check-suffix','git-suffix',
1636                                 'RETURN-UNDEF') // '.git';
1637         my $url = "$prefix/$package$suffix";
1638         my @cmd = (@curl, qw(-sS -I), $url);
1639         my $result = cmdoutput @cmd;
1640         $result =~ s/^\S+ 200 .*\n\r?\n//;
1641         # curl -sS -I with https_proxy prints
1642         # HTTP/1.0 200 Connection established
1643         $result =~ m/^\S+ (404|200) /s or
1644             fail "unexpected results from git check query - ".
1645                 Dumper($prefix, $result);
1646         my $code = $1;
1647         if ($code eq '404') {
1648             return 0;
1649         } elsif ($code eq '200') {
1650             return 1;
1651         } else {
1652             die;
1653         }
1654     } elsif ($how eq 'true') {
1655         return 1;
1656     } elsif ($how eq 'false') {
1657         return 0;
1658     } else {
1659         badcfg "unknown git-check \`$how'";
1660     }
1661 }
1662
1663 sub create_remote_git_repo () {
1664     my $how = access_cfg('git-create');
1665     if ($how eq 'ssh-cmd') {
1666         runcmd_ordryrun
1667             (access_cfg_ssh, access_gituserhost(),
1668              access_runeinfo("git-create $package").
1669              "set -e; cd ".access_cfg('git-path').";".
1670              " cp -a _template $package.git");
1671     } elsif ($how eq 'true') {
1672         # nothing to do
1673     } else {
1674         badcfg "unknown git-create \`$how'";
1675     }
1676 }
1677
1678 our ($dsc_hash,$lastpush_mergeinput);
1679 our ($dsc_distro, $dsc_hint_tag, $dsc_hint_url);
1680
1681
1682 sub prep_ud () {
1683     dgit_privdir(); # ensures that $dgit_privdir_made is based on $maindir
1684     fresh_playground 'dgit/unpack';
1685 }
1686
1687 sub mktree_in_ud_here () {
1688     playtree_setup $gitcfgs{local};
1689 }
1690
1691 sub git_write_tree () {
1692     my $tree = cmdoutput @git, qw(write-tree);
1693     $tree =~ m/^\w+$/ or die "$tree ?";
1694     return $tree;
1695 }
1696
1697 sub git_add_write_tree () {
1698     runcmd @git, qw(add -Af .);
1699     return git_write_tree();
1700 }
1701
1702 sub remove_stray_gits ($) {
1703     my ($what) = @_;
1704     my @gitscmd = qw(find -name .git -prune -print0);
1705     debugcmd "|",@gitscmd;
1706     open GITS, "-|", @gitscmd or die $!;
1707     {
1708         local $/="\0";
1709         while (<GITS>) {
1710             chomp or die;
1711             print STDERR "$us: warning: removing from $what: ",
1712                 (messagequote $_), "\n";
1713             rmtree $_;
1714         }
1715     }
1716     $!=0; $?=0; close GITS or failedcmd @gitscmd;
1717 }
1718
1719 sub mktree_in_ud_from_only_subdir ($;$) {
1720     my ($what,$raw) = @_;
1721     # changes into the subdir
1722
1723     my (@dirs) = <*/.>;
1724     die "expected one subdir but found @dirs ?" unless @dirs==1;
1725     $dirs[0] =~ m#^([^/]+)/\.$# or die;
1726     my $dir = $1;
1727     changedir $dir;
1728
1729     remove_stray_gits($what);
1730     mktree_in_ud_here();
1731     if (!$raw) {
1732         my ($format, $fopts) = get_source_format();
1733         if (madformat($format)) {
1734             rmtree '.pc';
1735         }
1736     }
1737
1738     my $tree=git_add_write_tree();
1739     return ($tree,$dir);
1740 }
1741
1742 our @files_csum_info_fields = 
1743     (['Checksums-Sha256','Digest::SHA', 'new(256)', 'sha256sum'],
1744      ['Checksums-Sha1',  'Digest::SHA', 'new(1)',   'sha1sum'],
1745      ['Files',           'Digest::MD5', 'new()',    'md5sum']);
1746
1747 sub dsc_files_info () {
1748     foreach my $csumi (@files_csum_info_fields) {
1749         my ($fname, $module, $method) = @$csumi;
1750         my $field = $dsc->{$fname};
1751         next unless defined $field;
1752         eval "use $module; 1;" or die $@;
1753         my @out;
1754         foreach (split /\n/, $field) {
1755             next unless m/\S/;
1756             m/^(\w+) (\d+) (\S+)$/ or
1757                 fail "could not parse .dsc $fname line \`$_'";
1758             my $digester = eval "$module"."->$method;" or die $@;
1759             push @out, {
1760                 Hash => $1,
1761                 Bytes => $2,
1762                 Filename => $3,
1763                 Digester => $digester,
1764             };
1765         }
1766         return @out;
1767     }
1768     fail "missing any supported Checksums-* or Files field in ".
1769         $dsc->get_option('name');
1770 }
1771
1772 sub dsc_files () {
1773     map { $_->{Filename} } dsc_files_info();
1774 }
1775
1776 sub files_compare_inputs (@) {
1777     my $inputs = \@_;
1778     my %record;
1779     my %fchecked;
1780
1781     my $showinputs = sub {
1782         return join "; ", map { $_->get_option('name') } @$inputs;
1783     };
1784
1785     foreach my $in (@$inputs) {
1786         my $expected_files;
1787         my $in_name = $in->get_option('name');
1788
1789         printdebug "files_compare_inputs $in_name\n";
1790
1791         foreach my $csumi (@files_csum_info_fields) {
1792             my ($fname) = @$csumi;
1793             printdebug "files_compare_inputs $in_name $fname\n";
1794
1795             my $field = $in->{$fname};
1796             next unless defined $field;
1797
1798             my @files;
1799             foreach (split /\n/, $field) {
1800                 next unless m/\S/;
1801
1802                 my ($info, $f) = m/^(\w+ \d+) (?:\S+ \S+ )?(\S+)$/ or
1803                     fail "could not parse $in_name $fname line \`$_'";
1804
1805                 printdebug "files_compare_inputs $in_name $fname $f\n";
1806
1807                 push @files, $f;
1808
1809                 my $re = \ $record{$f}{$fname};
1810                 if (defined $$re) {
1811                     $fchecked{$f}{$in_name} = 1;
1812                     $$re eq $info or
1813                         fail "hash or size of $f varies in $fname fields".
1814                         " (between: ".$showinputs->().")";
1815                 } else {
1816                     $$re = $info;
1817                 }
1818             }
1819             @files = sort @files;
1820             $expected_files //= \@files;
1821             "@$expected_files" eq "@files" or
1822                 fail "file list in $in_name varies between hash fields!";
1823         }
1824         $expected_files or
1825             fail "$in_name has no files list field(s)";
1826     }
1827     printdebug "files_compare_inputs ".Dumper(\%fchecked, \%record)
1828         if $debuglevel>=2;
1829
1830     grep { keys %$_ == @$inputs-1 } values %fchecked
1831         or fail "no file appears in all file lists".
1832         " (looked in: ".$showinputs->().")";
1833 }
1834
1835 sub is_orig_file_in_dsc ($$) {
1836     my ($f, $dsc_files_info) = @_;
1837     return 0 if @$dsc_files_info <= 1;
1838     # One file means no origs, and the filename doesn't have a "what
1839     # part of dsc" component.  (Consider versions ending `.orig'.)
1840     return 0 unless $f =~ m/\.$orig_f_tail_re$/o;
1841     return 1;
1842 }
1843
1844 sub is_orig_file_of_vsn ($$) {
1845     my ($f, $upstreamvsn) = @_;
1846     my $base = srcfn $upstreamvsn, '';
1847     return 0 unless $f =~ m/^\Q$base\E\.$orig_f_tail_re$/;
1848     return 1;
1849 }
1850
1851 # This function determines whether a .changes file is source-only from
1852 # the point of view of dak.  Thus, it permits *_source.buildinfo
1853 # files.
1854 #
1855 # It does not, however, permit any other buildinfo files.  After a
1856 # source-only upload, the buildds will try to upload files like
1857 # foo_1.2.3_amd64.buildinfo.  If the package maintainer included files
1858 # named like this in their (otherwise) source-only upload, the uploads
1859 # of the buildd can be rejected by dak.  Fixing the resultant
1860 # situation can require manual intervention.  So we block such
1861 # .buildinfo files when the user tells us to perform a source-only
1862 # upload (such as when using the push-source subcommand with the -C
1863 # option, which calls this function).
1864 #
1865 # Note, though, that when dgit is told to prepare a source-only
1866 # upload, such as when subcommands like build-source and push-source
1867 # without -C are used, dgit has a more restrictive notion of
1868 # source-only .changes than dak: such uploads will never include
1869 # *_source.buildinfo files.  This is because there is no use for such
1870 # files when using a tool like dgit to produce the source package, as
1871 # dgit ensures the source is identical to git HEAD.
1872 sub test_source_only_changes ($) {
1873     my ($changes) = @_;
1874     foreach my $l (split /\n/, getfield $changes, 'Files') {
1875         $l =~ m/\S+$/ or next;
1876         # \.tar\.[a-z0-9]+ covers orig.tar and the tarballs in native packages
1877         unless ($& =~ m/(?:\.dsc|\.diff\.gz|\.tar\.[a-z0-9]+|_source\.buildinfo)$/) {
1878             print "purportedly source-only changes polluted by $&\n";
1879             return 0;
1880         }
1881     }
1882     return 1;
1883 }
1884
1885 sub changes_update_origs_from_dsc ($$$$) {
1886     my ($dsc, $changes, $upstreamvsn, $changesfile) = @_;
1887     my %changes_f;
1888     printdebug "checking origs needed ($upstreamvsn)...\n";
1889     $_ = getfield $changes, 'Files';
1890     m/^\w+ \d+ (\S+ \S+) \S+$/m or
1891         fail "cannot find section/priority from .changes Files field";
1892     my $placementinfo = $1;
1893     my %changed;
1894     printdebug "checking origs needed placement '$placementinfo'...\n";
1895     foreach my $l (split /\n/, getfield $dsc, 'Files') {
1896         $l =~ m/\S+$/ or next;
1897         my $file = $&;
1898         printdebug "origs $file | $l\n";
1899         next unless is_orig_file_of_vsn $file, $upstreamvsn;
1900         printdebug "origs $file is_orig\n";
1901         my $have = archive_query('file_in_archive', $file);
1902         if (!defined $have) {
1903             print STDERR <<END;
1904 archive does not support .orig check; hope you used --ch:--sa/-sd if needed
1905 END
1906             return;
1907         }
1908         my $found_same = 0;
1909         my @found_differ;
1910         printdebug "origs $file \$#\$have=$#$have\n";
1911         foreach my $h (@$have) {
1912             my $same = 0;
1913             my @differ;
1914             foreach my $csumi (@files_csum_info_fields) {
1915                 my ($fname, $module, $method, $archivefield) = @$csumi;
1916                 next unless defined $h->{$archivefield};
1917                 $_ = $dsc->{$fname};
1918                 next unless defined;
1919                 m/^(\w+) .* \Q$file\E$/m or
1920                     fail ".dsc $fname missing entry for $file";
1921                 if ($h->{$archivefield} eq $1) {
1922                     $same++;
1923                 } else {
1924                     push @differ,
1925  "$archivefield: $h->{$archivefield} (archive) != $1 (local .dsc)";
1926                 }
1927             }
1928             die "$file ".Dumper($h)." ?!" if $same && @differ;
1929             $found_same++
1930                 if $same;
1931             push @found_differ, "archive $h->{filename}: ".join "; ", @differ
1932                 if @differ;
1933         }
1934         printdebug "origs $file f.same=$found_same".
1935             " #f._differ=$#found_differ\n";
1936         if (@found_differ && !$found_same) {
1937             fail join "\n",
1938                 "archive contains $file with different checksum",
1939                 @found_differ;
1940         }
1941         # Now we edit the changes file to add or remove it
1942         foreach my $csumi (@files_csum_info_fields) {
1943             my ($fname, $module, $method, $archivefield) = @$csumi;
1944             next unless defined $changes->{$fname};
1945             if ($found_same) {
1946                 # in archive, delete from .changes if it's there
1947                 $changed{$file} = "removed" if
1948                     $changes->{$fname} =~ s/^.* \Q$file\E$(?:)\n//m;
1949             } elsif ($changes->{$fname} =~ m/^.* \Q$file\E$(?:)\n/m) {
1950                 # not in archive, but it's here in the .changes
1951             } else {
1952                 my $dsc_data = getfield $dsc, $fname;
1953                 $dsc_data =~ m/^(.* \Q$file\E$)\n/m or die "$dsc_data $file ?";
1954                 my $extra = $1;
1955                 $extra =~ s/ \d+ /$&$placementinfo /
1956                     or die "$fname $extra >$dsc_data< ?"
1957                     if $fname eq 'Files';
1958                 $changes->{$fname} .= "\n". $extra;
1959                 $changed{$file} = "added";
1960             }
1961         }
1962     }
1963     if (%changed) {
1964         foreach my $file (keys %changed) {
1965             progress sprintf
1966                 "edited .changes for archive .orig contents: %s %s",
1967                 $changed{$file}, $file;
1968         }
1969         my $chtmp = "$changesfile.tmp";
1970         $changes->save($chtmp);
1971         if (act_local()) {
1972             rename $chtmp,$changesfile or die "$changesfile $!";
1973         } else {
1974             progress "[new .changes left in $changesfile]";
1975         }
1976     } else {
1977         progress "$changesfile already has appropriate .orig(s) (if any)";
1978     }
1979 }
1980
1981 sub make_commit ($) {
1982     my ($file) = @_;
1983     return cmdoutput @git, qw(hash-object -w -t commit), $file;
1984 }
1985
1986 sub make_commit_text ($) {
1987     my ($text) = @_;
1988     my ($out, $in);
1989     my @cmd = (@git, qw(hash-object -w -t commit --stdin));
1990     debugcmd "|",@cmd;
1991     print Dumper($text) if $debuglevel > 1;
1992     my $child = open2($out, $in, @cmd) or die $!;
1993     my $h;
1994     eval {
1995         print $in $text or die $!;
1996         close $in or die $!;
1997         $h = <$out>;
1998         $h =~ m/^\w+$/ or die;
1999         $h = $&;
2000         printdebug "=> $h\n";
2001     };
2002     close $out;
2003     waitpid $child, 0 == $child or die "$child $!";
2004     $? and failedcmd @cmd;
2005     return $h;
2006 }
2007
2008 sub clogp_authline ($) {
2009     my ($clogp) = @_;
2010     my $author = getfield $clogp, 'Maintainer';
2011     if ($author =~ m/^[^"\@]+\,/) {
2012         # single entry Maintainer field with unquoted comma
2013         $author = ($& =~ y/,//rd).$'; # strip the comma
2014     }
2015     # git wants a single author; any remaining commas in $author
2016     # are by now preceded by @ (or ").  It seems safer to punt on
2017     # "..." for now rather than attempting to dequote or something.
2018     $author =~ s#,.*##ms unless $author =~ m/"/;
2019     my $date = cmdoutput qw(date), '+%s %z', qw(-d), getfield($clogp,'Date');
2020     my $authline = "$author $date";
2021     $authline =~ m/$git_authline_re/o or
2022         fail "unexpected commit author line format \`$authline'".
2023         " (was generated from changelog Maintainer field)";
2024     return ($1,$2,$3) if wantarray;
2025     return $authline;
2026 }
2027
2028 sub vendor_patches_distro ($$) {
2029     my ($checkdistro, $what) = @_;
2030     return unless defined $checkdistro;
2031
2032     my $series = "debian/patches/\L$checkdistro\E.series";
2033     printdebug "checking for vendor-specific $series ($what)\n";
2034
2035     if (!open SERIES, "<", $series) {
2036         die "$series $!" unless $!==ENOENT;
2037         return;
2038     }
2039     while (<SERIES>) {
2040         next unless m/\S/;
2041         next if m/^\s+\#/;
2042
2043         print STDERR <<END;
2044
2045 Unfortunately, this source package uses a feature of dpkg-source where
2046 the same source package unpacks to different source code on different
2047 distros.  dgit cannot safely operate on such packages on affected
2048 distros, because the meaning of source packages is not stable.
2049
2050 Please ask the distro/maintainer to remove the distro-specific series
2051 files and use a different technique (if necessary, uploading actually
2052 different packages, if different distros are supposed to have
2053 different code).
2054
2055 END
2056         fail "Found active distro-specific series file for".
2057             " $checkdistro ($what): $series, cannot continue";
2058     }
2059     die "$series $!" if SERIES->error;
2060     close SERIES;
2061 }
2062
2063 sub check_for_vendor_patches () {
2064     # This dpkg-source feature doesn't seem to be documented anywhere!
2065     # But it can be found in the changelog (reformatted):
2066
2067     #   commit  4fa01b70df1dc4458daee306cfa1f987b69da58c
2068     #   Author: Raphael Hertzog <hertzog@debian.org>
2069     #   Date: Sun  Oct  3  09:36:48  2010 +0200
2070
2071     #   dpkg-source: correctly create .pc/.quilt_series with alternate
2072     #   series files
2073     #   
2074     #   If you have debian/patches/ubuntu.series and you were
2075     #   unpacking the source package on ubuntu, quilt was still
2076     #   directed to debian/patches/series instead of
2077     #   debian/patches/ubuntu.series.
2078     #   
2079     #   debian/changelog                        |    3 +++
2080     #   scripts/Dpkg/Source/Package/V3/quilt.pm |    4 +++-
2081     #   2 files changed, 6 insertions(+), 1 deletion(-)
2082
2083     use Dpkg::Vendor;
2084     vendor_patches_distro($ENV{DEB_VENDOR}, "DEB_VENDOR");
2085     vendor_patches_distro(Dpkg::Vendor::get_current_vendor(),
2086                          "Dpkg::Vendor \`current vendor'");
2087     vendor_patches_distro(access_basedistro(),
2088                           "(base) distro being accessed");
2089     vendor_patches_distro(access_nomdistro(),
2090                           "(nominal) distro being accessed");
2091 }
2092
2093 sub generate_commits_from_dsc () {
2094     # See big comment in fetch_from_archive, below.
2095     # See also README.dsc-import.
2096     prep_ud();
2097     changedir $playground;
2098
2099     my @dfi = dsc_files_info();
2100     foreach my $fi (@dfi) {
2101         my $f = $fi->{Filename};
2102         die "$f ?" if $f =~ m#/|^\.|\.dsc$|\.tmp$#;
2103         my $upper_f = "$maindir/../$f";
2104
2105         printdebug "considering reusing $f: ";
2106
2107         if (link_ltarget "$upper_f,fetch", $f) {
2108             printdebug "linked (using ...,fetch).\n";
2109         } elsif ((printdebug "($!) "),
2110                  $! != ENOENT) {
2111             fail "accessing ../$f,fetch: $!";
2112         } elsif (link_ltarget $upper_f, $f) {
2113             printdebug "linked.\n";
2114         } elsif ((printdebug "($!) "),
2115                  $! != ENOENT) {
2116             fail "accessing ../$f: $!";
2117         } else {
2118             printdebug "absent.\n";
2119         }
2120
2121         my $refetched;
2122         complete_file_from_dsc('.', $fi, \$refetched)
2123             or next;
2124
2125         printdebug "considering saving $f: ";
2126
2127         if (link $f, $upper_f) {
2128             printdebug "linked.\n";
2129         } elsif ((printdebug "($!) "),
2130                  $! != EEXIST) {
2131             fail "saving ../$f: $!";
2132         } elsif (!$refetched) {
2133             printdebug "no need.\n";
2134         } elsif (link $f, "$upper_f,fetch") {
2135             printdebug "linked (using ...,fetch).\n";
2136         } elsif ((printdebug "($!) "),
2137                  $! != EEXIST) {
2138             fail "saving ../$f,fetch: $!";
2139         } else {
2140             printdebug "cannot.\n";
2141         }
2142     }
2143
2144     # We unpack and record the orig tarballs first, so that we only
2145     # need disk space for one private copy of the unpacked source.
2146     # But we can't make them into commits until we have the metadata
2147     # from the debian/changelog, so we record the tree objects now and
2148     # make them into commits later.
2149     my @tartrees;
2150     my $upstreamv = upstreamversion $dsc->{version};
2151     my $orig_f_base = srcfn $upstreamv, '';
2152
2153     foreach my $fi (@dfi) {
2154         # We actually import, and record as a commit, every tarball
2155         # (unless there is only one file, in which case there seems
2156         # little point.
2157
2158         my $f = $fi->{Filename};
2159         printdebug "import considering $f ";
2160         (printdebug "only one dfi\n"), next if @dfi == 1;
2161         (printdebug "not tar\n"), next unless $f =~ m/\.tar(\.\w+)?$/;
2162         (printdebug "signature\n"), next if $f =~ m/$orig_f_sig_re$/o;
2163         my $compr_ext = $1;
2164
2165         my ($orig_f_part) =
2166             $f =~ m/^\Q$orig_f_base\E\.([^._]+)?\.tar(?:\.\w+)?$/;
2167
2168         printdebug "Y ", (join ' ', map { $_//"(none)" }
2169                           $compr_ext, $orig_f_part
2170                          ), "\n";
2171
2172         my $input = new IO::File $f, '<' or die "$f $!";
2173         my $compr_pid;
2174         my @compr_cmd;
2175
2176         if (defined $compr_ext) {
2177             my $cname =
2178                 Dpkg::Compression::compression_guess_from_filename $f;
2179             fail "Dpkg::Compression cannot handle file $f in source package"
2180                 if defined $compr_ext && !defined $cname;
2181             my $compr_proc =
2182                 new Dpkg::Compression::Process compression => $cname;
2183             @compr_cmd = $compr_proc->get_uncompress_cmdline();
2184             my $compr_fh = new IO::Handle;
2185             my $compr_pid = open $compr_fh, "-|" // die $!;
2186             if (!$compr_pid) {
2187                 open STDIN, "<&", $input or die $!;
2188                 exec @compr_cmd;
2189                 die "dgit (child): exec $compr_cmd[0]: $!\n";
2190             }
2191             $input = $compr_fh;
2192         }
2193
2194         rmtree "_unpack-tar";
2195         mkdir "_unpack-tar" or die $!;
2196         my @tarcmd = qw(tar -x -f -
2197                         --no-same-owner --no-same-permissions
2198                         --no-acls --no-xattrs --no-selinux);
2199         my $tar_pid = fork // die $!;
2200         if (!$tar_pid) {
2201             chdir "_unpack-tar" or die $!;
2202             open STDIN, "<&", $input or die $!;
2203             exec @tarcmd;
2204             die "dgit (child): exec $tarcmd[0]: $!";
2205         }
2206         $!=0; (waitpid $tar_pid, 0) == $tar_pid or die $!;
2207         !$? or failedcmd @tarcmd;
2208
2209         close $input or
2210             (@compr_cmd ? ($?==SIGPIPE || failedcmd @compr_cmd)
2211              : die $!);
2212         # finally, we have the results in "tarball", but maybe
2213         # with the wrong permissions
2214
2215         runcmd qw(chmod -R +rwX _unpack-tar);
2216         changedir "_unpack-tar";
2217         remove_stray_gits($f);
2218         mktree_in_ud_here();
2219         
2220         my ($tree) = git_add_write_tree();
2221         my $tentries = cmdoutput @git, qw(ls-tree -z), $tree;
2222         if ($tentries =~ m/^\d+ tree (\w+)\t[^\000]+\000$/s) {
2223             $tree = $1;
2224             printdebug "one subtree $1\n";
2225         } else {
2226             printdebug "multiple subtrees\n";
2227         }
2228         changedir "..";
2229         rmtree "_unpack-tar";
2230
2231         my $ent = [ $f, $tree ];
2232         push @tartrees, {
2233             Orig => !!$orig_f_part,
2234             Sort => (!$orig_f_part         ? 2 :
2235                      $orig_f_part =~ m/-/g ? 1 :
2236                                              0),
2237             F => $f,
2238             Tree => $tree,
2239         };
2240     }
2241
2242     @tartrees = sort {
2243         # put any without "_" first (spec is not clear whether files
2244         # are always in the usual order).  Tarballs without "_" are
2245         # the main orig or the debian tarball.
2246         $a->{Sort} <=> $b->{Sort} or
2247         $a->{F}    cmp $b->{F}
2248     } @tartrees;
2249
2250     my $any_orig = grep { $_->{Orig} } @tartrees;
2251
2252     my $dscfn = "$package.dsc";
2253
2254     my $treeimporthow = 'package';
2255
2256     open D, ">", $dscfn or die "$dscfn: $!";
2257     print D $dscdata or die "$dscfn: $!";
2258     close D or die "$dscfn: $!";
2259     my @cmd = qw(dpkg-source);
2260     push @cmd, '--no-check' if $dsc_checked;
2261     if (madformat $dsc->{format}) {
2262         push @cmd, '--skip-patches';
2263         $treeimporthow = 'unpatched';
2264     }
2265     push @cmd, qw(-x --), $dscfn;
2266     runcmd @cmd;
2267
2268     my ($tree,$dir) = mktree_in_ud_from_only_subdir("source package");
2269     if (madformat $dsc->{format}) { 
2270         check_for_vendor_patches();
2271     }
2272
2273     my $dappliedtree;
2274     if (madformat $dsc->{format}) {
2275         my @pcmd = qw(dpkg-source --before-build .);
2276         runcmd shell_cmd 'exec >/dev/null', @pcmd;
2277         rmtree '.pc';
2278         $dappliedtree = git_add_write_tree();
2279     }
2280
2281     my @clogcmd = qw(dpkg-parsechangelog --format rfc822 --all);
2282     debugcmd "|",@clogcmd;
2283     open CLOGS, "-|", @clogcmd or die $!;
2284
2285     my $clogp;
2286     my $r1clogp;
2287
2288     printdebug "import clog search...\n";
2289
2290     for (;;) {
2291         my $stanzatext = do { local $/=""; <CLOGS>; };
2292         printdebug "import clogp ".Dumper($stanzatext) if $debuglevel>1;
2293         last if !defined $stanzatext;
2294
2295         my $desc = "package changelog, entry no.$.";
2296         open my $stanzafh, "<", \$stanzatext or die;
2297         my $thisstanza = parsecontrolfh $stanzafh, $desc, 1;
2298         $clogp //= $thisstanza;
2299
2300         printdebug "import clog $thisstanza->{version} $desc...\n";
2301
2302         last if !$any_orig; # we don't need $r1clogp
2303
2304         # We look for the first (most recent) changelog entry whose
2305         # version number is lower than the upstream version of this
2306         # package.  Then the last (least recent) previous changelog
2307         # entry is treated as the one which introduced this upstream
2308         # version and used for the synthetic commits for the upstream
2309         # tarballs.
2310
2311         # One might think that a more sophisticated algorithm would be
2312         # necessary.  But: we do not want to scan the whole changelog
2313         # file.  Stopping when we see an earlier version, which
2314         # necessarily then is an earlier upstream version, is the only
2315         # realistic way to do that.  Then, either the earliest
2316         # changelog entry we have seen so far is indeed the earliest
2317         # upload of this upstream version; or there are only changelog
2318         # entries relating to later upstream versions (which is not
2319         # possible unless the changelog and .dsc disagree about the
2320         # version).  Then it remains to choose between the physically
2321         # last entry in the file, and the one with the lowest version
2322         # number.  If these are not the same, we guess that the
2323         # versions were created in a non-monotic order rather than
2324         # that the changelog entries have been misordered.
2325
2326         printdebug "import clog $thisstanza->{version} vs $upstreamv...\n";
2327
2328         last if version_compare($thisstanza->{version}, $upstreamv) < 0;
2329         $r1clogp = $thisstanza;
2330
2331         printdebug "import clog $r1clogp->{version} becomes r1\n";
2332     }
2333     die $! if CLOGS->error;
2334     close CLOGS or $?==SIGPIPE or failedcmd @clogcmd;
2335
2336     $clogp or fail "package changelog has no entries!";
2337
2338     my $authline = clogp_authline $clogp;
2339     my $changes = getfield $clogp, 'Changes';
2340     $changes =~ s/^\n//; # Changes: \n
2341     my $cversion = getfield $clogp, 'Version';
2342
2343     if (@tartrees) {
2344         $r1clogp //= $clogp; # maybe there's only one entry;
2345         my $r1authline = clogp_authline $r1clogp;
2346         # Strictly, r1authline might now be wrong if it's going to be
2347         # unused because !$any_orig.  Whatever.
2348
2349         printdebug "import tartrees authline   $authline\n";
2350         printdebug "import tartrees r1authline $r1authline\n";
2351
2352         foreach my $tt (@tartrees) {
2353             printdebug "import tartree $tt->{F} $tt->{Tree}\n";
2354
2355             $tt->{Commit} = make_commit_text($tt->{Orig} ? <<END_O : <<END_T);
2356 tree $tt->{Tree}
2357 author $r1authline
2358 committer $r1authline
2359
2360 Import $tt->{F}
2361
2362 [dgit import orig $tt->{F}]
2363 END_O
2364 tree $tt->{Tree}
2365 author $authline
2366 committer $authline
2367
2368 Import $tt->{F}
2369
2370 [dgit import tarball $package $cversion $tt->{F}]
2371 END_T
2372         }
2373     }
2374
2375     printdebug "import main commit\n";
2376
2377     open C, ">../commit.tmp" or die $!;
2378     print C <<END or die $!;
2379 tree $tree
2380 END
2381     print C <<END or die $! foreach @tartrees;
2382 parent $_->{Commit}
2383 END
2384     print C <<END or die $!;
2385 author $authline
2386 committer $authline
2387
2388 $changes
2389
2390 [dgit import $treeimporthow $package $cversion]
2391 END
2392
2393     close C or die $!;
2394     my $rawimport_hash = make_commit qw(../commit.tmp);
2395
2396     if (madformat $dsc->{format}) {
2397         printdebug "import apply patches...\n";
2398
2399         # regularise the state of the working tree so that
2400         # the checkout of $rawimport_hash works nicely.
2401         my $dappliedcommit = make_commit_text(<<END);
2402 tree $dappliedtree
2403 author $authline
2404 committer $authline
2405
2406 [dgit dummy commit]
2407 END
2408         runcmd @git, qw(checkout -q -b dapplied), $dappliedcommit;
2409
2410         runcmd @git, qw(checkout -q -b unpa), $rawimport_hash;
2411
2412         # We need the answers to be reproducible
2413         my @authline = clogp_authline($clogp);
2414         local $ENV{GIT_COMMITTER_NAME} =  $authline[0];
2415         local $ENV{GIT_COMMITTER_EMAIL} = $authline[1];
2416         local $ENV{GIT_COMMITTER_DATE} =  $authline[2];
2417         local $ENV{GIT_AUTHOR_NAME} =  $authline[0];
2418         local $ENV{GIT_AUTHOR_EMAIL} = $authline[1];
2419         local $ENV{GIT_AUTHOR_DATE} =  $authline[2];
2420
2421         my $path = $ENV{PATH} or die;
2422
2423         # we use ../../gbp-pq-output, which (given that we are in
2424         # $playground/PLAYTREE, and $playground is .git/dgit/unpack,
2425         # is .git/dgit.
2426
2427         foreach my $use_absurd (qw(0 1)) {
2428             runcmd @git, qw(checkout -q unpa);
2429             runcmd @git, qw(update-ref -d refs/heads/patch-queue/unpa);
2430             local $ENV{PATH} = $path;
2431             if ($use_absurd) {
2432                 chomp $@;
2433                 progress "warning: $@";
2434                 $path = "$absurdity:$path";
2435                 progress "$us: trying slow absurd-git-apply...";
2436                 rename "../../gbp-pq-output","../../gbp-pq-output.0"
2437                     or $!==ENOENT
2438                     or die $!;
2439             }
2440             eval {
2441                 die "forbid absurd git-apply\n" if $use_absurd
2442                     && forceing [qw(import-gitapply-no-absurd)];
2443                 die "only absurd git-apply!\n" if !$use_absurd
2444                     && forceing [qw(import-gitapply-absurd)];
2445
2446                 local $ENV{DGIT_ABSURD_DEBUG} = $debuglevel if $use_absurd;
2447                 local $ENV{PATH} = $path                    if $use_absurd;
2448
2449                 my @showcmd = (gbp_pq, qw(import));
2450                 my @realcmd = shell_cmd
2451                     'exec >/dev/null 2>>../../gbp-pq-output', @showcmd;
2452                 debugcmd "+",@realcmd;
2453                 if (system @realcmd) {
2454                     die +(shellquote @showcmd).
2455                         " failed: ".
2456                         failedcmd_waitstatus()."\n";
2457                 }
2458
2459                 my $gapplied = git_rev_parse('HEAD');
2460                 my $gappliedtree = cmdoutput @git, qw(rev-parse HEAD:);
2461                 $gappliedtree eq $dappliedtree or
2462                     fail <<END;
2463 gbp-pq import and dpkg-source disagree!
2464  gbp-pq import gave commit $gapplied
2465  gbp-pq import gave tree $gappliedtree
2466  dpkg-source --before-build gave tree $dappliedtree
2467 END
2468                 $rawimport_hash = $gapplied;
2469             };
2470             last unless $@;
2471         }
2472         if ($@) {
2473             { local $@; eval { runcmd qw(cat ../../gbp-pq-output); }; }
2474             die $@;
2475         }
2476     }
2477
2478     progress "synthesised git commit from .dsc $cversion";
2479
2480     my $rawimport_mergeinput = {
2481         Commit => $rawimport_hash,
2482         Info => "Import of source package",
2483     };
2484     my @output = ($rawimport_mergeinput);
2485
2486     if ($lastpush_mergeinput) {
2487         my $oldclogp = mergeinfo_getclogp($lastpush_mergeinput);
2488         my $oversion = getfield $oldclogp, 'Version';
2489         my $vcmp =
2490             version_compare($oversion, $cversion);
2491         if ($vcmp < 0) {
2492             @output = ($rawimport_mergeinput, $lastpush_mergeinput,
2493                 { Message => <<END, ReverseParents => 1 });
2494 Record $package ($cversion) in archive suite $csuite
2495 END
2496         } elsif ($vcmp > 0) {
2497             print STDERR <<END or die $!;
2498
2499 Version actually in archive:   $cversion (older)
2500 Last version pushed with dgit: $oversion (newer or same)
2501 $later_warning_msg
2502 END
2503             @output = $lastpush_mergeinput;
2504         } else {
2505             # Same version.  Use what's in the server git branch,
2506             # discarding our own import.  (This could happen if the
2507             # server automatically imports all packages into git.)
2508             @output = $lastpush_mergeinput;
2509         }
2510     }
2511     changedir $maindir;
2512     rmtree $playground;
2513     return @output;
2514 }
2515
2516 sub complete_file_from_dsc ($$;$) {
2517     our ($dstdir, $fi, $refetched) = @_;
2518     # Ensures that we have, in $dstdir, the file $fi, with the correct
2519     # contents.  (Downloading it from alongside $dscurl if necessary.)
2520     # If $refetched is defined, can overwrite "$dstdir/$fi->{Filename}"
2521     # and will set $$refetched=1 if it did so (or tried to).
2522
2523     my $f = $fi->{Filename};
2524     my $tf = "$dstdir/$f";
2525     my $downloaded = 0;
2526
2527     my $got;
2528     my $checkhash = sub {
2529         open F, "<", "$tf" or die "$tf: $!";
2530         $fi->{Digester}->reset();
2531         $fi->{Digester}->addfile(*F);
2532         F->error and die $!;
2533         $got = $fi->{Digester}->hexdigest();
2534         return $got eq $fi->{Hash};
2535     };
2536
2537     if (stat_exists $tf) {
2538         if ($checkhash->()) {
2539             progress "using existing $f";
2540             return 1;
2541         }
2542         if (!$refetched) {
2543             fail "file $f has hash $got but .dsc".
2544                 " demands hash $fi->{Hash} ".
2545                 "(perhaps you should delete this file?)";
2546         }
2547         progress "need to fetch correct version of $f";
2548         unlink $tf or die "$tf $!";
2549         $$refetched = 1;
2550     } else {
2551         printdebug "$tf does not exist, need to fetch\n";
2552     }
2553
2554     my $furl = $dscurl;
2555     $furl =~ s{/[^/]+$}{};
2556     $furl .= "/$f";
2557     die "$f ?" unless $f =~ m/^\Q${package}\E_/;
2558     die "$f ?" if $f =~ m#/#;
2559     runcmd_ordryrun_local @curl,qw(-f -o),$tf,'--',"$furl";
2560     return 0 if !act_local();
2561
2562     $checkhash->() or
2563         fail "file $f has hash $got but .dsc".
2564             " demands hash $fi->{Hash} ".
2565             "(got wrong file from archive!)";
2566
2567     return 1;
2568 }
2569
2570 sub ensure_we_have_orig () {
2571     my @dfi = dsc_files_info();
2572     foreach my $fi (@dfi) {
2573         my $f = $fi->{Filename};
2574         next unless is_orig_file_in_dsc($f, \@dfi);
2575         complete_file_from_dsc('..', $fi)
2576             or next;
2577     }
2578 }
2579
2580 #---------- git fetch ----------
2581
2582 sub lrfetchrefs () { return "refs/dgit-fetch/".access_basedistro(); }
2583 sub lrfetchref () { return lrfetchrefs.'/'.server_branch($csuite); }
2584
2585 # We fetch some parts of lrfetchrefs/*.  Ideally we delete these
2586 # locally fetched refs because they have unhelpful names and clutter
2587 # up gitk etc.  So we track whether we have "used up" head ref (ie,
2588 # whether we have made another local ref which refers to this object).
2589 #
2590 # (If we deleted them unconditionally, then we might end up
2591 # re-fetching the same git objects each time dgit fetch was run.)
2592 #
2593 # So, each use of lrfetchrefs needs to be accompanied by arrangements
2594 # in git_fetch_us to fetch the refs in question, and possibly a call
2595 # to lrfetchref_used.
2596
2597 our (%lrfetchrefs_f, %lrfetchrefs_d);
2598 # $lrfetchrefs_X{lrfetchrefs."/heads/whatever"} = $objid
2599
2600 sub lrfetchref_used ($) {
2601     my ($fullrefname) = @_;
2602     my $objid = $lrfetchrefs_f{$fullrefname};
2603     $lrfetchrefs_d{$fullrefname} = $objid if defined $objid;
2604 }
2605
2606 sub git_lrfetch_sane {
2607     my ($url, $supplementary, @specs) = @_;
2608     # Make a 'refs/'.lrfetchrefs.'/*' be just like on server,
2609     # at least as regards @specs.  Also leave the results in
2610     # %lrfetchrefs_f, and arrange for lrfetchref_used to be
2611     # able to clean these up.
2612     #
2613     # With $supplementary==1, @specs must not contain wildcards
2614     # and we add to our previous fetches (non-atomically).
2615
2616     # This is rather miserable:
2617     # When git fetch --prune is passed a fetchspec ending with a *,
2618     # it does a plausible thing.  If there is no * then:
2619     # - it matches subpaths too, even if the supplied refspec
2620     #   starts refs, and behaves completely madly if the source
2621     #   has refs/refs/something.  (See, for example, Debian #NNNN.)
2622     # - if there is no matching remote ref, it bombs out the whole
2623     #   fetch.
2624     # We want to fetch a fixed ref, and we don't know in advance
2625     # if it exists, so this is not suitable.
2626     #
2627     # Our workaround is to use git ls-remote.  git ls-remote has its
2628     # own qairks.  Notably, it has the absurd multi-tail-matching
2629     # behaviour: git ls-remote R refs/foo can report refs/foo AND
2630     # refs/refs/foo etc.
2631     #
2632     # Also, we want an idempotent snapshot, but we have to make two
2633     # calls to the remote: one to git ls-remote and to git fetch.  The
2634     # solution is use git ls-remote to obtain a target state, and
2635     # git fetch to try to generate it.  If we don't manage to generate
2636     # the target state, we try again.
2637
2638     printdebug "git_lrfetch_sane suppl=$supplementary specs @specs\n";
2639
2640     my $specre = join '|', map {
2641         my $x = $_;
2642         $x =~ s/\W/\\$&/g;
2643         my $wildcard = $x =~ s/\\\*$/.*/;
2644         die if $wildcard && $supplementary;
2645         "(?:refs/$x)";
2646     } @specs;
2647     printdebug "git_lrfetch_sane specre=$specre\n";
2648     my $wanted_rref = sub {
2649         local ($_) = @_;
2650         return m/^(?:$specre)$/;
2651     };
2652
2653     my $fetch_iteration = 0;
2654     FETCH_ITERATION:
2655     for (;;) {
2656         printdebug "git_lrfetch_sane iteration $fetch_iteration\n";
2657         if (++$fetch_iteration > 10) {
2658             fail "too many iterations trying to get sane fetch!";
2659         }
2660
2661         my @look = map { "refs/$_" } @specs;
2662         my @lcmd = (@git, qw(ls-remote -q --refs), $url, @look);
2663         debugcmd "|",@lcmd;
2664
2665         my %wantr;
2666         open GITLS, "-|", @lcmd or die $!;
2667         while (<GITLS>) {
2668             printdebug "=> ", $_;
2669             m/^(\w+)\s+(\S+)\n/ or die "ls-remote $_ ?";
2670             my ($objid,$rrefname) = ($1,$2);
2671             if (!$wanted_rref->($rrefname)) {
2672                 print STDERR <<END;
2673 warning: git ls-remote @look reported $rrefname; this is silly, ignoring it.
2674 END
2675                 next;
2676             }
2677             $wantr{$rrefname} = $objid;
2678         }
2679         $!=0; $?=0;
2680         close GITLS or failedcmd @lcmd;
2681
2682         # OK, now %want is exactly what we want for refs in @specs
2683         my @fspecs = map {
2684             !m/\*$/ && !exists $wantr{"refs/$_"} ? () :
2685             "+refs/$_:".lrfetchrefs."/$_";
2686         } @specs;
2687
2688         printdebug "git_lrfetch_sane fspecs @fspecs\n";
2689
2690         my @fcmd = (@git, qw(fetch -p -n -q), $url, @fspecs);
2691         runcmd_ordryrun_local @fcmd if @fspecs;
2692
2693         if (!$supplementary) {
2694             %lrfetchrefs_f = ();
2695         }
2696         my %objgot;
2697
2698         git_for_each_ref(lrfetchrefs, sub {
2699             my ($objid,$objtype,$lrefname,$reftail) = @_;
2700             $lrfetchrefs_f{$lrefname} = $objid;
2701             $objgot{$objid} = 1;
2702         });
2703
2704         if ($supplementary) {
2705             last;
2706         }
2707
2708         foreach my $lrefname (sort keys %lrfetchrefs_f) {
2709             my $rrefname = 'refs'.substr($lrefname, length lrfetchrefs);
2710             if (!exists $wantr{$rrefname}) {
2711                 if ($wanted_rref->($rrefname)) {
2712                     printdebug <<END;
2713 git-fetch @fspecs created $lrefname which git ls-remote @look didn't list.
2714 END
2715                 } else {
2716                     print STDERR <<END
2717 warning: git fetch @fspecs created $lrefname; this is silly, deleting it.
2718 END
2719                 }
2720                 runcmd_ordryrun_local @git, qw(update-ref -d), $lrefname;
2721                 delete $lrfetchrefs_f{$lrefname};
2722                 next;
2723             }
2724         }
2725         foreach my $rrefname (sort keys %wantr) {
2726             my $lrefname = lrfetchrefs.substr($rrefname, 4);
2727             my $got = $lrfetchrefs_f{$lrefname} // '<none>';
2728             my $want = $wantr{$rrefname};
2729             next if $got eq $want;
2730             if (!defined $objgot{$want}) {
2731                 print STDERR <<END;
2732 warning: git ls-remote suggests we want $lrefname
2733 warning:  and it should refer to $want
2734 warning:  but git fetch didn't fetch that object to any relevant ref.
2735 warning:  This may be due to a race with someone updating the server.
2736 warning:  Will try again...
2737 END
2738                 next FETCH_ITERATION;
2739             }
2740             printdebug <<END;
2741 git-fetch @fspecs made $lrefname=$got but want git ls-remote @look says $want
2742 END
2743             runcmd_ordryrun_local @git, qw(update-ref -m),
2744                 "dgit fetch git fetch fixup", $lrefname, $want;
2745             $lrfetchrefs_f{$lrefname} = $want;
2746         }
2747         last;
2748     }
2749
2750     if (defined $csuite) {
2751         printdebug "git_lrfetch_sane: tidying any old suite lrfetchrefs\n";
2752         git_for_each_ref("refs/dgit-fetch/$csuite", sub {
2753             my ($objid,$objtype,$lrefname,$reftail) = @_;
2754             next if $lrfetchrefs_f{$lrefname}; # $csuite eq $distro ?
2755             runcmd_ordryrun_local @git, qw(update-ref -d), $lrefname;
2756         });
2757     }
2758
2759     printdebug "git_lrfetch_sane: git fetch --no-insane emulation complete\n",
2760         Dumper(\%lrfetchrefs_f);
2761 }
2762
2763 sub git_fetch_us () {
2764     # Want to fetch only what we are going to use, unless
2765     # deliberately-not-ff, in which case we must fetch everything.
2766
2767     my @specs = deliberately_not_fast_forward ? qw(tags/*) :
2768         map { "tags/$_" }
2769         (quiltmode_splitbrain
2770          ? (map { $_->('*',access_nomdistro) }
2771             \&debiantag_new, \&debiantag_maintview)
2772          : debiantags('*',access_nomdistro));
2773     push @specs, server_branch($csuite);
2774     push @specs, $rewritemap;
2775     push @specs, qw(heads/*) if deliberately_not_fast_forward;
2776
2777     my $url = access_giturl();
2778     git_lrfetch_sane $url, 0, @specs;
2779
2780     my %here;
2781     my @tagpats = debiantags('*',access_nomdistro);
2782
2783     git_for_each_ref([map { "refs/tags/$_" } @tagpats], sub {
2784         my ($objid,$objtype,$fullrefname,$reftail) = @_;
2785         printdebug "currently $fullrefname=$objid\n";
2786         $here{$fullrefname} = $objid;
2787     });
2788     git_for_each_ref([map { lrfetchrefs."/tags/".$_ } @tagpats], sub {
2789         my ($objid,$objtype,$fullrefname,$reftail) = @_;
2790         my $lref = "refs".substr($fullrefname, length(lrfetchrefs));
2791         printdebug "offered $lref=$objid\n";
2792         if (!defined $here{$lref}) {
2793             my @upd = (@git, qw(update-ref), $lref, $objid, '');
2794             runcmd_ordryrun_local @upd;
2795             lrfetchref_used $fullrefname;
2796         } elsif ($here{$lref} eq $objid) {
2797             lrfetchref_used $fullrefname;
2798         } else {
2799             print STDERR
2800                 "Not updating $lref from $here{$lref} to $objid.\n";
2801         }
2802     });
2803 }
2804
2805 #---------- dsc and archive handling ----------
2806
2807 sub mergeinfo_getclogp ($) {
2808     # Ensures thit $mi->{Clogp} exists and returns it
2809     my ($mi) = @_;
2810     $mi->{Clogp} = commit_getclogp($mi->{Commit});
2811 }
2812
2813 sub mergeinfo_version ($) {
2814     return getfield( (mergeinfo_getclogp $_[0]), 'Version' );
2815 }
2816
2817 sub fetch_from_archive_record_1 ($) {
2818     my ($hash) = @_;
2819     runcmd @git, qw(update-ref -m), "dgit fetch $csuite",
2820             'DGIT_ARCHIVE', $hash;
2821     cmdoutput @git, qw(log -n2), $hash;
2822     # ... gives git a chance to complain if our commit is malformed
2823 }
2824
2825 sub fetch_from_archive_record_2 ($) {
2826     my ($hash) = @_;
2827     my @upd_cmd = (@git, qw(update-ref -m), 'dgit fetch', lrref(), $hash);
2828     if (act_local()) {
2829         cmdoutput @upd_cmd;
2830     } else {
2831         dryrun_report @upd_cmd;
2832     }
2833 }
2834
2835 sub parse_dsc_field_def_dsc_distro () {
2836     $dsc_distro //= cfg qw(dgit.default.old-dsc-distro
2837                            dgit.default.distro);
2838 }
2839
2840 sub parse_dsc_field ($$) {
2841     my ($dsc, $what) = @_;
2842     my $f;
2843     foreach my $field (@ourdscfield) {
2844         $f = $dsc->{$field};
2845         last if defined $f;
2846     }
2847
2848     if (!defined $f) {
2849         progress "$what: NO git hash";
2850         parse_dsc_field_def_dsc_distro();
2851     } elsif (($dsc_hash, $dsc_distro, $dsc_hint_tag, $dsc_hint_url)
2852              = $f =~ m/^(\w+)\s+($distro_re)\s+($versiontag_re)\s+(\S+)(?:\s|$)/) {
2853         progress "$what: specified git info ($dsc_distro)";
2854         $dsc_hint_tag = [ $dsc_hint_tag ];
2855     } elsif ($f =~ m/^\w+\s*$/) {
2856         $dsc_hash = $&;
2857         parse_dsc_field_def_dsc_distro();
2858         $dsc_hint_tag = [ debiantags +(getfield $dsc, 'Version'),
2859                           $dsc_distro ];
2860         progress "$what: specified git hash";
2861     } else {
2862         fail "$what: invalid Dgit info";
2863     }
2864 }
2865
2866 sub resolve_dsc_field_commit ($$) {
2867     my ($already_distro, $already_mapref) = @_;
2868
2869     return unless defined $dsc_hash;
2870
2871     my $mapref =
2872         defined $already_mapref &&
2873         ($already_distro eq $dsc_distro || !$chase_dsc_distro)
2874         ? $already_mapref : undef;
2875
2876     my $do_fetch;
2877     $do_fetch = sub {
2878         my ($what, @fetch) = @_;
2879
2880         local $idistro = $dsc_distro;
2881         my $lrf = lrfetchrefs;
2882
2883         if (!$chase_dsc_distro) {
2884             progress
2885                 "not chasing .dsc distro $dsc_distro: not fetching $what";
2886             return 0;
2887         }
2888
2889         progress
2890             ".dsc names distro $dsc_distro: fetching $what";
2891
2892         my $url = access_giturl();
2893         if (!defined $url) {
2894             defined $dsc_hint_url or fail <<END;
2895 .dsc Dgit metadata is in context of distro $dsc_distro
2896 for which we have no configured url and .dsc provides no hint
2897 END
2898             my $proto =
2899                 $dsc_hint_url =~ m#^([-+0-9a-zA-Z]+):# ? $1 :
2900                 $dsc_hint_url =~ m#^/# ? 'file' : 'bad-syntax';
2901             parse_cfg_bool "dsc-url-proto-ok", 'false',
2902                 cfg("dgit.dsc-url-proto-ok.$proto",
2903                     "dgit.default.dsc-url-proto-ok")
2904                 or fail <<END;
2905 .dsc Dgit metadata is in context of distro $dsc_distro
2906 for which we have no configured url;
2907 .dsc provides hinted url with protocol $proto which is unsafe.
2908 (can be overridden by config - consult documentation)
2909 END
2910             $url = $dsc_hint_url;
2911         }
2912
2913         git_lrfetch_sane $url, 1, @fetch;
2914
2915         return $lrf;
2916     };
2917
2918     my $rewrite_enable = do {
2919         local $idistro = $dsc_distro;
2920         access_cfg('rewrite-map-enable', 'RETURN-UNDEF');
2921     };
2922
2923     if (parse_cfg_bool 'rewrite-map-enable', 'true', $rewrite_enable) {
2924         if (!defined $mapref) {
2925             my $lrf = $do_fetch->("rewrite map", $rewritemap) or return;
2926             $mapref = $lrf.'/'.$rewritemap;
2927         }
2928         my $rewritemapdata = git_cat_file $mapref.':map';
2929         if (defined $rewritemapdata
2930             && $rewritemapdata =~ m/^$dsc_hash(?:[ \t](\w+))/m) {
2931             progress
2932                 "server's git history rewrite map contains a relevant entry!";
2933
2934             $dsc_hash = $1;
2935             if (defined $dsc_hash) {
2936                 progress "using rewritten git hash in place of .dsc value";
2937             } else {
2938                 progress "server data says .dsc hash is to be disregarded";
2939             }
2940         }
2941     }
2942
2943     if (!defined git_cat_file $dsc_hash) {
2944         my @tags = map { "tags/".$_ } @$dsc_hint_tag;
2945         my $lrf = $do_fetch->("additional commits", @tags) &&
2946             defined git_cat_file $dsc_hash
2947             or fail <<END;
2948 .dsc Dgit metadata requires commit $dsc_hash
2949 but we could not obtain that object anywhere.
2950 END
2951         foreach my $t (@tags) {
2952             my $fullrefname = $lrf.'/'.$t;
2953 #           print STDERR "CHK $t $fullrefname ".Dumper(\%lrfetchrefs_f);
2954             next unless $lrfetchrefs_f{$fullrefname};
2955             next unless is_fast_fwd "$fullrefname~0", $dsc_hash;
2956             lrfetchref_used $fullrefname;
2957         }
2958     }
2959 }
2960
2961 sub fetch_from_archive () {
2962     ensure_setup_existing_tree();
2963
2964     # Ensures that lrref() is what is actually in the archive, one way
2965     # or another, according to us - ie this client's
2966     # appropritaely-updated archive view.  Also returns the commit id.
2967     # If there is nothing in the archive, leaves lrref alone and
2968     # returns undef.  git_fetch_us must have already been called.
2969     get_archive_dsc();
2970
2971     if ($dsc) {
2972         parse_dsc_field($dsc, 'last upload to archive');
2973         resolve_dsc_field_commit access_basedistro,
2974             lrfetchrefs."/".$rewritemap
2975     } else {
2976         progress "no version available from the archive";
2977     }
2978
2979     # If the archive's .dsc has a Dgit field, there are three
2980     # relevant git commitids we need to choose between and/or merge
2981     # together:
2982     #   1. $dsc_hash: the Dgit field from the archive
2983     #   2. $lastpush_hash: the suite branch on the dgit git server
2984     #   3. $lastfetch_hash: our local tracking brach for the suite
2985     #
2986     # These may all be distinct and need not be in any fast forward
2987     # relationship:
2988     #
2989     # If the dsc was pushed to this suite, then the server suite
2990     # branch will have been updated; but it might have been pushed to
2991     # a different suite and copied by the archive.  Conversely a more
2992     # recent version may have been pushed with dgit but not appeared
2993     # in the archive (yet).
2994     #
2995     # $lastfetch_hash may be awkward because archive imports
2996     # (particularly, imports of Dgit-less .dscs) are performed only as
2997     # needed on individual clients, so different clients may perform a
2998     # different subset of them - and these imports are only made
2999     # public during push.  So $lastfetch_hash may represent a set of
3000     # imports different to a subsequent upload by a different dgit
3001     # client.
3002     #
3003     # Our approach is as follows:
3004     #
3005     # As between $dsc_hash and $lastpush_hash: if $lastpush_hash is a
3006     # descendant of $dsc_hash, then it was pushed by a dgit user who
3007     # had based their work on $dsc_hash, so we should prefer it.
3008     # Otherwise, $dsc_hash was installed into this suite in the
3009     # archive other than by a dgit push, and (necessarily) after the
3010     # last dgit push into that suite (since a dgit push would have
3011     # been descended from the dgit server git branch); thus, in that
3012     # case, we prefer the archive's version (and produce a
3013     # pseudo-merge to overwrite the dgit server git branch).
3014     #
3015     # (If there is no Dgit field in the archive's .dsc then
3016     # generate_commit_from_dsc uses the version numbers to decide
3017     # whether the suite branch or the archive is newer.  If the suite
3018     # branch is newer it ignores the archive's .dsc; otherwise it
3019     # generates an import of the .dsc, and produces a pseudo-merge to
3020     # overwrite the suite branch with the archive contents.)
3021     #
3022     # The outcome of that part of the algorithm is the `public view',
3023     # and is same for all dgit clients: it does not depend on any
3024     # unpublished history in the local tracking branch.
3025     #
3026     # As between the public view and the local tracking branch: The
3027     # local tracking branch is only updated by dgit fetch, and
3028     # whenever dgit fetch runs it includes the public view in the
3029     # local tracking branch.  Therefore if the public view is not
3030     # descended from the local tracking branch, the local tracking
3031     # branch must contain history which was imported from the archive
3032     # but never pushed; and, its tip is now out of date.  So, we make
3033     # a pseudo-merge to overwrite the old imports and stitch the old
3034     # history in.
3035     #
3036     # Finally: we do not necessarily reify the public view (as
3037     # described above).  This is so that we do not end up stacking two
3038     # pseudo-merges.  So what we actually do is figure out the inputs
3039     # to any public view pseudo-merge and put them in @mergeinputs.
3040
3041     my @mergeinputs;
3042     # $mergeinputs[]{Commit}
3043     # $mergeinputs[]{Info}
3044     # $mergeinputs[0] is the one whose tree we use
3045     # @mergeinputs is in the order we use in the actual commit)
3046     #
3047     # Also:
3048     # $mergeinputs[]{Message} is a commit message to use
3049     # $mergeinputs[]{ReverseParents} if def specifies that parent
3050     #                                list should be in opposite order
3051     # Such an entry has no Commit or Info.  It applies only when found
3052     # in the last entry.  (This ugliness is to support making
3053     # identical imports to previous dgit versions.)
3054
3055     my $lastpush_hash = git_get_ref(lrfetchref());
3056     printdebug "previous reference hash=$lastpush_hash\n";
3057     $lastpush_mergeinput = $lastpush_hash && {
3058         Commit => $lastpush_hash,
3059         Info => "dgit suite branch on dgit git server",
3060     };
3061
3062     my $lastfetch_hash = git_get_ref(lrref());
3063     printdebug "fetch_from_archive: lastfetch=$lastfetch_hash\n";
3064     my $lastfetch_mergeinput = $lastfetch_hash && {
3065         Commit => $lastfetch_hash,
3066         Info => "dgit client's archive history view",
3067     };
3068
3069     my $dsc_mergeinput = $dsc_hash && {
3070         Commit => $dsc_hash,
3071         Info => "Dgit field in .dsc from archive",
3072     };
3073
3074     my $cwd = getcwd();
3075     my $del_lrfetchrefs = sub {
3076         changedir $cwd;
3077         my $gur;
3078         printdebug "del_lrfetchrefs...\n";
3079         foreach my $fullrefname (sort keys %lrfetchrefs_d) {
3080             my $objid = $lrfetchrefs_d{$fullrefname};
3081             printdebug "del_lrfetchrefs: $objid $fullrefname\n";
3082             if (!$gur) {
3083                 $gur ||= new IO::Handle;
3084                 open $gur, "|-", qw(git update-ref --stdin) or die $!;
3085             }
3086             printf $gur "delete %s %s\n", $fullrefname, $objid;
3087         }
3088         if ($gur) {
3089             close $gur or failedcmd "git update-ref delete lrfetchrefs";
3090         }
3091     };
3092
3093     if (defined $dsc_hash) {
3094         ensure_we_have_orig();
3095         if (!$lastpush_hash || $dsc_hash eq $lastpush_hash) {
3096             @mergeinputs = $dsc_mergeinput
3097         } elsif (is_fast_fwd($dsc_hash,$lastpush_hash)) {
3098             print STDERR <<END or die $!;
3099
3100 Git commit in archive is behind the last version allegedly pushed/uploaded.
3101 Commit referred to by archive: $dsc_hash
3102 Last version pushed with dgit: $lastpush_hash
3103 $later_warning_msg
3104 END
3105             @mergeinputs = ($lastpush_mergeinput);
3106         } else {
3107             # Archive has .dsc which is not a descendant of the last dgit
3108             # push.  This can happen if the archive moves .dscs about.
3109             # Just follow its lead.
3110             if (is_fast_fwd($lastpush_hash,$dsc_hash)) {
3111                 progress "archive .dsc names newer git commit";
3112                 @mergeinputs = ($dsc_mergeinput);
3113             } else {
3114                 progress "archive .dsc names other git commit, fixing up";
3115                 @mergeinputs = ($dsc_mergeinput, $lastpush_mergeinput);
3116             }
3117         }
3118     } elsif ($dsc) {
3119         @mergeinputs = generate_commits_from_dsc();
3120         # We have just done an import.  Now, our import algorithm might
3121         # have been improved.  But even so we do not want to generate
3122         # a new different import of the same package.  So if the
3123         # version numbers are the same, just use our existing version.
3124         # If the version numbers are different, the archive has changed
3125         # (perhaps, rewound).
3126         if ($lastfetch_mergeinput &&
3127             !version_compare( (mergeinfo_version $lastfetch_mergeinput),
3128                               (mergeinfo_version $mergeinputs[0]) )) {
3129             @mergeinputs = ($lastfetch_mergeinput);
3130         }
3131     } elsif ($lastpush_hash) {
3132         # only in git, not in the archive yet
3133         @mergeinputs = ($lastpush_mergeinput);
3134         print STDERR <<END or die $!;
3135
3136 Package not found in the archive, but has allegedly been pushed using dgit.
3137 $later_warning_msg
3138 END
3139     } else {
3140         printdebug "nothing found!\n";
3141         if (defined $skew_warning_vsn) {
3142             print STDERR <<END or die $!;
3143
3144 Warning: relevant archive skew detected.
3145 Archive allegedly contains $skew_warning_vsn
3146 But we were not able to obtain any version from the archive or git.
3147
3148 END
3149         }
3150         unshift @end, $del_lrfetchrefs;
3151         return undef;
3152     }
3153
3154     if ($lastfetch_hash &&
3155         !grep {
3156             my $h = $_->{Commit};
3157             $h and is_fast_fwd($lastfetch_hash, $h);
3158             # If true, one of the existing parents of this commit
3159             # is a descendant of the $lastfetch_hash, so we'll
3160             # be ff from that automatically.
3161         } @mergeinputs
3162         ) {
3163         # Otherwise:
3164         push @mergeinputs, $lastfetch_mergeinput;
3165     }
3166
3167     printdebug "fetch mergeinfos:\n";
3168     foreach my $mi (@mergeinputs) {
3169         if ($mi->{Info}) {
3170             printdebug " commit $mi->{Commit} $mi->{Info}\n";
3171         } else {
3172             printdebug sprintf " ReverseParents=%d Message=%s",
3173                 $mi->{ReverseParents}, $mi->{Message};
3174         }
3175     }
3176
3177     my $compat_info= pop @mergeinputs
3178         if $mergeinputs[$#mergeinputs]{Message};
3179
3180     @mergeinputs = grep { defined $_->{Commit} } @mergeinputs;
3181
3182     my $hash;
3183     if (@mergeinputs > 1) {
3184         # here we go, then:
3185         my $tree_commit = $mergeinputs[0]{Commit};
3186
3187         my $tree = cmdoutput @git, qw(cat-file commit), $tree_commit;
3188         $tree =~ m/\n\n/;  $tree = $`;
3189         $tree =~ m/^tree (\w+)$/m or die "$dsc_hash tree ?";
3190         $tree = $1;
3191
3192         # We use the changelog author of the package in question the
3193         # author of this pseudo-merge.  This is (roughly) correct if
3194         # this commit is simply representing aa non-dgit upload.
3195         # (Roughly because it does not record sponsorship - but we
3196         # don't have sponsorship info because that's in the .changes,
3197         # which isn't in the archivw.)
3198         #
3199         # But, it might be that we are representing archive history
3200         # updates (including in-archive copies).  These are not really
3201         # the responsibility of the person who created the .dsc, but
3202         # there is no-one whose name we should better use.  (The
3203         # author of the .dsc-named commit is clearly worse.)
3204
3205         my $useclogp = mergeinfo_getclogp $mergeinputs[0];
3206         my $author = clogp_authline $useclogp;
3207         my $cversion = getfield $useclogp, 'Version';
3208
3209         my $mcf = dgit_privdir()."/mergecommit";
3210         open MC, ">", $mcf or die "$mcf $!";
3211         print MC <<END or die $!;
3212 tree $tree
3213 END
3214
3215         my @parents = grep { $_->{Commit} } @mergeinputs;
3216         @parents = reverse @parents if $compat_info->{ReverseParents};
3217         print MC <<END or die $! foreach @parents;
3218 parent $_->{Commit}
3219 END
3220
3221         print MC <<END or die $!;
3222 author $author
3223 committer $author
3224
3225 END
3226
3227         if (defined $compat_info->{Message}) {
3228             print MC $compat_info->{Message} or die $!;
3229         } else {
3230             print MC <<END or die $!;
3231 Record $package ($cversion) in archive suite $csuite
3232
3233 Record that
3234 END
3235             my $message_add_info = sub {
3236                 my ($mi) = (@_);
3237                 my $mversion = mergeinfo_version $mi;
3238                 printf MC "  %-20s %s\n", $mversion, $mi->{Info}
3239                     or die $!;
3240             };
3241
3242             $message_add_info->($mergeinputs[0]);
3243             print MC <<END or die $!;
3244 should be treated as descended from
3245 END
3246             $message_add_info->($_) foreach @mergeinputs[1..$#mergeinputs];
3247         }
3248
3249         close MC or die $!;
3250         $hash = make_commit $mcf;
3251     } else {
3252         $hash = $mergeinputs[0]{Commit};
3253     }
3254     printdebug "fetch hash=$hash\n";
3255
3256     my $chkff = sub {
3257         my ($lasth, $what) = @_;
3258         return unless $lasth;
3259         die "$lasth $hash $what ?" unless is_fast_fwd($lasth, $hash);
3260     };
3261
3262     $chkff->($lastpush_hash, 'dgit repo server tip (last push)')
3263         if $lastpush_hash;
3264     $chkff->($lastfetch_hash, 'local tracking tip (last fetch)');
3265
3266     fetch_from_archive_record_1($hash);
3267
3268     if (defined $skew_warning_vsn) {
3269         printdebug "SKEW CHECK WANT $skew_warning_vsn\n";
3270         my $gotclogp = commit_getclogp($hash);
3271         my $got_vsn = getfield $gotclogp, 'Version';
3272         printdebug "SKEW CHECK GOT $got_vsn\n";
3273         if (version_compare($got_vsn, $skew_warning_vsn) < 0) {
3274             print STDERR <<END or die $!;
3275
3276 Warning: archive skew detected.  Using the available version:
3277 Archive allegedly contains    $skew_warning_vsn
3278 We were able to obtain only   $got_vsn
3279
3280 END
3281         }
3282     }
3283
3284     if ($lastfetch_hash ne $hash) {
3285         fetch_from_archive_record_2($hash);
3286     }
3287
3288     lrfetchref_used lrfetchref();
3289
3290     check_gitattrs($hash, "fetched source tree");
3291
3292     unshift @end, $del_lrfetchrefs;
3293     return $hash;
3294 }
3295
3296 sub set_local_git_config ($$) {
3297     my ($k, $v) = @_;
3298     runcmd @git, qw(config), $k, $v;
3299 }
3300
3301 sub setup_mergechangelogs (;$) {
3302     my ($always) = @_;
3303     return unless $always || access_cfg_bool(1, 'setup-mergechangelogs');
3304
3305     my $driver = 'dpkg-mergechangelogs';
3306     my $cb = "merge.$driver";
3307     confess unless defined $maindir;
3308     my $attrs = "$maindir_gitcommon/info/attributes";
3309     ensuredir "$maindir_gitcommon/info";
3310
3311     open NATTRS, ">", "$attrs.new" or die "$attrs.new $!";
3312     if (!open ATTRS, "<", $attrs) {
3313         $!==ENOENT or die "$attrs: $!";
3314     } else {
3315         while (<ATTRS>) {
3316             chomp;
3317             next if m{^debian/changelog\s};
3318             print NATTRS $_, "\n" or die $!;
3319         }
3320         ATTRS->error and die $!;
3321         close ATTRS;
3322     }
3323     print NATTRS "debian/changelog merge=$driver\n" or die $!;
3324     close NATTRS;
3325
3326     set_local_git_config "$cb.name", 'debian/changelog merge driver';
3327     set_local_git_config "$cb.driver", 'dpkg-mergechangelogs -m %O %A %B %A';
3328
3329     rename "$attrs.new", "$attrs" or die "$attrs: $!";
3330 }
3331
3332 sub setup_useremail (;$) {
3333     my ($always) = @_;
3334     return unless $always || access_cfg_bool(1, 'setup-useremail');
3335
3336     my $setup = sub {
3337         my ($k, $envvar) = @_;
3338         my $v = access_cfg("user-$k", 'RETURN-UNDEF') // $ENV{$envvar};
3339         return unless defined $v;
3340         set_local_git_config "user.$k", $v;
3341     };
3342
3343     $setup->('email', 'DEBEMAIL');
3344     $setup->('name', 'DEBFULLNAME');
3345 }
3346
3347 sub ensure_setup_existing_tree () {
3348     my $k = "remote.$remotename.skipdefaultupdate";
3349     my $c = git_get_config $k;
3350     return if defined $c;
3351     set_local_git_config $k, 'true';
3352 }
3353
3354 sub open_main_gitattrs () {
3355     confess 'internal error no maindir' unless defined $maindir;
3356     my $gai = new IO::File "$maindir_gitcommon/info/attributes"
3357         or $!==ENOENT
3358         or die "open $maindir_gitcommon/info/attributes: $!";
3359     return $gai;
3360 }
3361
3362 sub is_gitattrs_setup () {
3363     my $gai = open_main_gitattrs();
3364     return 0 unless $gai;
3365     while (<$gai>) {
3366         return 1 if m{^\[attr\]dgit-defuse-attrs\s};
3367     }
3368     $gai->error and die $!;
3369     return 0;
3370 }    
3371
3372 sub setup_gitattrs (;$) {
3373     my ($always) = @_;
3374     return unless $always || access_cfg_bool(1, 'setup-gitattributes');
3375
3376     if (is_gitattrs_setup()) {
3377         progress <<END;
3378 [attr]dgit-defuse-attrs already found in .git/info/attributes
3379  not doing further gitattributes setup
3380 END
3381         return;
3382     }
3383     my $af = "$maindir_gitcommon/info/attributes";
3384     ensuredir "$maindir_gitcommon/info";
3385     open GAO, "> $af.new" or die $!;
3386     print GAO <<END or die $!;
3387 *       dgit-defuse-attrs
3388 [attr]dgit-defuse-attrs $negate_harmful_gitattrs
3389 # ^ see GITATTRIBUTES in dgit(7) and dgit setup-new-tree in dgit(1)
3390 END
3391     my $gai = open_main_gitattrs();
3392     if ($gai) {
3393         while (<$gai>) {
3394             chomp;
3395             print GAO $_, "\n" or die $!;
3396         }
3397         $gai->error and die $!;
3398     }
3399     close GAO or die $!;
3400     rename "$af.new", "$af" or die "install $af: $!";
3401 }
3402
3403 sub setup_new_tree () {
3404     setup_mergechangelogs();
3405     setup_useremail();
3406     setup_gitattrs();
3407 }
3408
3409 sub check_gitattrs ($$) {
3410     my ($treeish, $what) = @_;
3411
3412     return if is_gitattrs_setup;
3413
3414     local $/="\0";
3415     my @cmd = (@git, qw(ls-tree -lrz --), "${treeish}:");
3416     debugcmd "|",@cmd;
3417     my $gafl = new IO::File;
3418     open $gafl, "-|", @cmd or die $!;
3419     while (<$gafl>) {
3420         chomp or die;
3421         s/^\d+\s+\w+\s+\w+\s+(\d+)\t// or die;
3422         next if $1 == 0;
3423         next unless m{(?:^|/)\.gitattributes$};
3424
3425         # oh dear, found one
3426         print STDERR <<END;
3427 dgit: warning: $what contains .gitattributes
3428 dgit: .gitattributes have not been defused.  Recommended: dgit setup-new-tree.
3429 END
3430         close $gafl;
3431         return;
3432     }
3433     # tree contains no .gitattributes files
3434     $?=0; $!=0; close $gafl or failedcmd @cmd;
3435 }
3436
3437
3438 sub multisuite_suite_child ($$$) {
3439     my ($tsuite, $merginputs, $fn) = @_;
3440     # in child, sets things up, calls $fn->(), and returns undef
3441     # in parent, returns canonical suite name for $tsuite
3442     my $canonsuitefh = IO::File::new_tmpfile;
3443     my $pid = fork // die $!;
3444     if (!$pid) {
3445         forkcheck_setup();
3446         $isuite = $tsuite;
3447         $us .= " [$isuite]";
3448         $debugprefix .= " ";
3449         progress "fetching $tsuite...";
3450         canonicalise_suite();
3451         print $canonsuitefh $csuite, "\n" or die $!;
3452         close $canonsuitefh or die $!;
3453         $fn->();
3454         return undef;
3455     }
3456     waitpid $pid,0 == $pid or die $!;
3457     fail "failed to obtain $tsuite: ".waitstatusmsg() if $? && $?!=256*4;
3458     seek $canonsuitefh,0,0 or die $!;
3459     local $csuite = <$canonsuitefh>;
3460     die $! unless defined $csuite && chomp $csuite;
3461     if ($? == 256*4) {
3462         printdebug "multisuite $tsuite missing\n";
3463         return $csuite;
3464     }
3465     printdebug "multisuite $tsuite ok (canon=$csuite)\n";
3466     push @$merginputs, {
3467         Ref => lrref,
3468         Info => $csuite,
3469     };
3470     return $csuite;
3471 }
3472
3473 sub fork_for_multisuite ($) {
3474     my ($before_fetch_merge) = @_;
3475     # if nothing unusual, just returns ''
3476     #
3477     # if multisuite:
3478     # returns 0 to caller in child, to do first of the specified suites
3479     # in child, $csuite is not yet set
3480     #
3481     # returns 1 to caller in parent, to finish up anything needed after
3482     # in parent, $csuite is set to canonicalised portmanteau
3483
3484     my $org_isuite = $isuite;
3485     my @suites = split /\,/, $isuite;
3486     return '' unless @suites > 1;
3487     printdebug "fork_for_multisuite: @suites\n";
3488
3489     my @mergeinputs;
3490
3491     my $cbasesuite = multisuite_suite_child($suites[0], \@mergeinputs,
3492                                             sub { });
3493     return 0 unless defined $cbasesuite;
3494
3495     fail "package $package missing in (base suite) $cbasesuite"
3496         unless @mergeinputs;
3497
3498     my @csuites = ($cbasesuite);
3499
3500     $before_fetch_merge->();
3501
3502     foreach my $tsuite (@suites[1..$#suites]) {
3503         $tsuite =~ s/^-/$cbasesuite-/;
3504         my $csubsuite = multisuite_suite_child($tsuite, \@mergeinputs,
3505                                                sub {
3506             @end = ();
3507             fetch();
3508             exit 0;
3509         });
3510         # xxx collecte the ref here
3511
3512         $csubsuite =~ s/^\Q$cbasesuite\E-/-/;
3513         push @csuites, $csubsuite;
3514     }
3515
3516     foreach my $mi (@mergeinputs) {
3517         my $ref = git_get_ref $mi->{Ref};
3518         die "$mi->{Ref} ?" unless length $ref;
3519         $mi->{Commit} = $ref;
3520     }
3521
3522     $csuite = join ",", @csuites;
3523
3524     my $previous = git_get_ref lrref;
3525     if ($previous) {
3526         unshift @mergeinputs, {
3527             Commit => $previous,
3528             Info => "local combined tracking branch",
3529             Warning =>
3530  "archive seems to have rewound: local tracking branch is ahead!",
3531         };
3532     }
3533
3534     foreach my $ix (0..$#mergeinputs) {
3535         $mergeinputs[$ix]{Index} = $ix;
3536     }
3537
3538     @mergeinputs = sort {
3539         -version_compare(mergeinfo_version $a,
3540                          mergeinfo_version $b) # highest version first
3541             or
3542         $a->{Index} <=> $b->{Index}; # earliest in spec first
3543     } @mergeinputs;
3544
3545     my @needed;
3546
3547   NEEDED:
3548     foreach my $mi (@mergeinputs) {
3549         printdebug "multisuite merge check $mi->{Info}\n";
3550         foreach my $previous (@needed) {
3551             next unless is_fast_fwd $mi->{Commit}, $previous->{Commit};
3552             printdebug "multisuite merge un-needed $previous->{Info}\n";
3553             next NEEDED;
3554         }
3555         push @needed, $mi;
3556         printdebug "multisuite merge this-needed\n";
3557         $mi->{Character} = '+';
3558     }
3559
3560     $needed[0]{Character} = '*';
3561
3562     my $output = $needed[0]{Commit};
3563
3564     if (@needed > 1) {
3565         printdebug "multisuite merge nontrivial\n";
3566         my $tree = cmdoutput qw(git rev-parse), $needed[0]{Commit}.':';
3567
3568         my $commit = "tree $tree\n";
3569         my $msg = "Combine archive branches $csuite [dgit]\n\n".
3570             "Input branches:\n";
3571
3572         foreach my $mi (sort { $a->{Index} <=> $b->{Index} } @mergeinputs) {
3573             printdebug "multisuite merge include $mi->{Info}\n";
3574             $mi->{Character} //= ' ';
3575             $commit .= "parent $mi->{Commit}\n";
3576             $msg .= sprintf " %s  %-25s %s\n",
3577                 $mi->{Character},
3578                 (mergeinfo_version $mi),
3579                 $mi->{Info};
3580         }
3581         my $authline = clogp_authline mergeinfo_getclogp $needed[0];
3582         $msg .= "\nKey\n".
3583             " * marks the highest version branch, which choose to use\n".
3584             " + marks each branch which was not already an ancestor\n\n".
3585             "[dgit multi-suite $csuite]\n";
3586         $commit .=
3587             "author $authline\n".
3588             "committer $authline\n\n";
3589         $output = make_commit_text $commit.$msg;
3590         printdebug "multisuite merge generated $output\n";
3591     }
3592
3593     fetch_from_archive_record_1($output);
3594     fetch_from_archive_record_2($output);
3595
3596     progress "calculated combined tracking suite $csuite";
3597
3598     return 1;
3599 }
3600
3601 sub clone_set_head () {
3602     open H, "> .git/HEAD" or die $!;
3603     print H "ref: ".lref()."\n" or die $!;
3604     close H or die $!;
3605 }
3606 sub clone_finish ($) {
3607     my ($dstdir) = @_;
3608     runcmd @git, qw(reset --hard), lrref();
3609     runcmd qw(bash -ec), <<'END';
3610         set -o pipefail
3611         git ls-tree -r --name-only -z HEAD | \
3612         xargs -0r touch -h -r . --
3613 END
3614     printdone "ready for work in $dstdir";
3615 }
3616
3617 sub clone ($) {
3618     # in multisuite, returns twice!
3619     # once in parent after first suite fetched,
3620     # and then again in child after everything is finished
3621     my ($dstdir) = @_;
3622     badusage "dry run makes no sense with clone" unless act_local();
3623
3624     my $multi_fetched = fork_for_multisuite(sub {
3625         printdebug "multi clone before fetch merge\n";
3626         changedir $dstdir;
3627         record_maindir();
3628     });
3629     if ($multi_fetched) {
3630         printdebug "multi clone after fetch merge\n";
3631         clone_set_head();
3632         clone_finish($dstdir);
3633         return;
3634     }
3635     printdebug "clone main body\n";
3636
3637     canonicalise_suite();
3638     my $hasgit = check_for_git();
3639     mkdir $dstdir or fail "create \`$dstdir': $!";
3640     changedir $dstdir;
3641     runcmd @git, qw(init -q);
3642     record_maindir();
3643     setup_new_tree();
3644     clone_set_head();
3645     my $giturl = access_giturl(1);
3646     if (defined $giturl) {
3647         runcmd @git, qw(remote add), 'origin', $giturl;
3648     }
3649     if ($hasgit) {
3650         progress "fetching existing git history";
3651         git_fetch_us();
3652         runcmd_ordryrun_local @git, qw(fetch origin);
3653     } else {
3654         progress "starting new git history";
3655     }
3656     fetch_from_archive() or no_such_package;
3657     my $vcsgiturl = $dsc->{'Vcs-Git'};
3658     if (length $vcsgiturl) {
3659         $vcsgiturl =~ s/\s+-b\s+\S+//g;
3660         runcmd @git, qw(remote add vcs-git), $vcsgiturl;
3661     }
3662     clone_finish($dstdir);
3663 }
3664
3665 sub fetch () {
3666     canonicalise_suite();
3667     if (check_for_git()) {
3668         git_fetch_us();
3669     }
3670     fetch_from_archive() or no_such_package();
3671     printdone "fetched into ".lrref();
3672 }
3673
3674 sub pull () {
3675     my $multi_fetched = fork_for_multisuite(sub { });
3676     fetch() unless $multi_fetched; # parent
3677     return if $multi_fetched eq '0'; # child
3678     runcmd_ordryrun_local @git, qw(merge -m),"Merge from $csuite [dgit]",
3679         lrref();
3680     printdone "fetched to ".lrref()." and merged into HEAD";
3681 }
3682
3683 sub check_not_dirty () {
3684     foreach my $f (qw(local-options local-patch-header)) {
3685         if (stat_exists "debian/source/$f") {
3686             fail "git tree contains debian/source/$f";
3687         }
3688     }
3689
3690     return if $ignoredirty;
3691
3692     my @cmd = (@git, qw(diff --quiet HEAD));
3693     debugcmd "+",@cmd;
3694     $!=0; $?=-1; system @cmd;
3695     return if !$?;
3696     if ($?==256) {
3697         fail "working tree is dirty (does not match HEAD)";
3698     } else {
3699         failedcmd @cmd;
3700     }
3701 }
3702
3703 sub commit_admin ($) {
3704     my ($m) = @_;
3705     progress "$m";
3706     runcmd_ordryrun_local @git, qw(commit -m), $m;
3707 }
3708
3709 sub commit_quilty_patch () {
3710     my $output = cmdoutput @git, qw(status --porcelain);
3711     my %adds;
3712     foreach my $l (split /\n/, $output) {
3713         next unless $l =~ m/\S/;
3714         if ($l =~ m{^(?:\?\?| M) (.pc|debian/patches)}) {
3715             $adds{$1}++;
3716         }
3717     }
3718     delete $adds{'.pc'}; # if there wasn't one before, don't add it
3719     if (!%adds) {
3720         progress "nothing quilty to commit, ok.";
3721         return;
3722     }
3723     my @adds = map { s/[][*?\\]/\\$&/g; $_; } sort keys %adds;
3724     runcmd_ordryrun_local @git, qw(add -f), @adds;
3725     commit_admin <<END
3726 Commit Debian 3.0 (quilt) metadata
3727
3728 [dgit ($our_version) quilt-fixup]
3729 END
3730 }
3731
3732 sub get_source_format () {
3733     my %options;
3734     if (open F, "debian/source/options") {
3735         while (<F>) {
3736             next if m/^\s*\#/;
3737             next unless m/\S/;
3738             s/\s+$//; # ignore missing final newline
3739             if (m/\s*\#\s*/) {
3740                 my ($k, $v) = ($`, $'); #');
3741                 $v =~ s/^"(.*)"$/$1/;
3742                 $options{$k} = $v;
3743             } else {
3744                 $options{$_} = 1;
3745             }
3746         }
3747         F->error and die $!;
3748         close F;
3749     } else {
3750         die $! unless $!==&ENOENT;
3751     }
3752
3753     if (!open F, "debian/source/format") {
3754         die $! unless $!==&ENOENT;
3755         return '';
3756     }
3757     $_ = <F>;
3758     F->error and die $!;
3759     chomp;
3760     return ($_, \%options);
3761 }
3762
3763 sub madformat_wantfixup ($) {
3764     my ($format) = @_;
3765     return 0 unless $format eq '3.0 (quilt)';
3766     our $quilt_mode_warned;
3767     if ($quilt_mode eq 'nocheck') {
3768         progress "Not doing any fixup of \`$format' due to".
3769             " ----no-quilt-fixup or --quilt=nocheck"
3770             unless $quilt_mode_warned++;
3771         return 0;
3772     }
3773     progress "Format \`$format', need to check/update patch stack"
3774         unless $quilt_mode_warned++;
3775     return 1;
3776 }
3777
3778 sub maybe_split_brain_save ($$$) {
3779     my ($headref, $dgitview, $msg) = @_;
3780     # => message fragment "$saved" describing disposition of $dgitview
3781     return "commit id $dgitview" unless defined $split_brain_save;
3782     my @cmd = (shell_cmd 'cd "$1"; shift', $maindir,
3783                @git, qw(update-ref -m),
3784                "dgit --dgit-view-save $msg HEAD=$headref",
3785                $split_brain_save, $dgitview);
3786     runcmd @cmd;
3787     return "and left in $split_brain_save";
3788 }
3789
3790 # An "infopair" is a tuple [ $thing, $what ]
3791 # (often $thing is a commit hash; $what is a description)
3792
3793 sub infopair_cond_equal ($$) {
3794     my ($x,$y) = @_;
3795     $x->[0] eq $y->[0] or fail <<END;
3796 $x->[1] ($x->[0]) not equal to $y->[1] ($y->[0])
3797 END
3798 };
3799
3800 sub infopair_lrf_tag_lookup ($$) {
3801     my ($tagnames, $what) = @_;
3802     # $tagname may be an array ref
3803     my @tagnames = ref $tagnames ? @$tagnames : ($tagnames);
3804     printdebug "infopair_lrfetchref_tag_lookup $what @tagnames\n";
3805     foreach my $tagname (@tagnames) {
3806         my $lrefname = lrfetchrefs."/tags/$tagname";
3807         my $tagobj = $lrfetchrefs_f{$lrefname};
3808         next unless defined $tagobj;
3809         printdebug "infopair_lrfetchref_tag_lookup $tagobj $tagname $what\n";
3810         return [ git_rev_parse($tagobj), $what ];
3811     }
3812     fail @tagnames==1 ? <<END : <<END;
3813 Wanted tag $what (@tagnames) on dgit server, but not found
3814 END
3815 Wanted tag $what (one of: @tagnames) on dgit server, but not found
3816 END
3817 }
3818
3819 sub infopair_cond_ff ($$) {
3820     my ($anc,$desc) = @_;
3821     is_fast_fwd($anc->[0], $desc->[0]) or fail <<END;
3822 $anc->[1] ($anc->[0]) .. $desc->[1] ($desc->[0]) is not fast forward
3823 END
3824 };
3825
3826 sub pseudomerge_version_check ($$) {
3827     my ($clogp, $archive_hash) = @_;
3828
3829     my $arch_clogp = commit_getclogp $archive_hash;
3830     my $i_arch_v = [ (getfield $arch_clogp, 'Version'),
3831                      'version currently in archive' ];
3832     if (defined $overwrite_version) {
3833         if (length $overwrite_version) {
3834             infopair_cond_equal([ $overwrite_version,
3835                                   '--overwrite= version' ],
3836                                 $i_arch_v);
3837         } else {
3838             my $v = $i_arch_v->[0];
3839             progress "Checking package changelog for archive version $v ...";
3840             my $cd;
3841             eval {
3842                 my @xa = ("-f$v", "-t$v");
3843                 my $vclogp = parsechangelog @xa;
3844                 my $gf = sub {
3845                     my ($fn) = @_;
3846                     [ (getfield $vclogp, $fn),
3847                       "$fn field from dpkg-parsechangelog @xa" ];
3848                 };
3849                 my $cv = $gf->('Version');
3850                 infopair_cond_equal($i_arch_v, $cv);
3851                 $cd = $gf->('Distribution');
3852             };
3853             if ($@) {
3854                 $@ =~ s/^dgit: //gm;
3855                 fail "$@".
3856                     "Perhaps debian/changelog does not mention $v ?";
3857             }
3858             fail <<END if $cd->[0] =~ m/UNRELEASED/;
3859 $cd->[1] is $cd->[0]
3860 Your tree seems to based on earlier (not uploaded) $v.
3861 END
3862         }
3863     }
3864     
3865     printdebug "pseudomerge_version_check i_arch_v @$i_arch_v\n";
3866     return $i_arch_v;
3867 }
3868
3869 sub pseudomerge_make_commit ($$$$ $$) {
3870     my ($clogp, $dgitview, $archive_hash, $i_arch_v,
3871         $msg_cmd, $msg_msg) = @_;
3872     progress "Declaring that HEAD inciudes all changes in $i_arch_v->[0]...";
3873
3874     my $tree = cmdoutput qw(git rev-parse), "${dgitview}:";
3875     my $authline = clogp_authline $clogp;
3876
3877     chomp $msg_msg;
3878     $msg_cmd .=
3879         !defined $overwrite_version ? ""
3880         : !length  $overwrite_version ? " --overwrite"
3881         : " --overwrite=".$overwrite_version;
3882
3883     my $pmf = dgit_privdir()."/pseudomerge";
3884     open MC, ">", $pmf or die "$pmf $!";
3885     print MC <<END or die $!;
3886 tree $tree
3887 parent $dgitview
3888 parent $archive_hash
3889 author $authline
3890 committer $authline
3891
3892 $msg_msg
3893
3894 [$msg_cmd]
3895 END
3896     close MC or die $!;
3897
3898     return make_commit($pmf);
3899 }
3900
3901 sub splitbrain_pseudomerge ($$$$) {
3902     my ($clogp, $maintview, $dgitview, $archive_hash) = @_;
3903     # => $merged_dgitview
3904     printdebug "splitbrain_pseudomerge...\n";
3905     #
3906     #     We:      debian/PREVIOUS    HEAD($maintview)
3907     # expect:          o ----------------- o
3908     #                    \                   \
3909     #                     o                   o
3910     #                 a/d/PREVIOUS        $dgitview
3911     #                $archive_hash              \
3912     #  If so,                \                   \
3913     #  we do:                 `------------------ o
3914     #   this:                                   $dgitview'
3915     #
3916
3917     return $dgitview unless defined $archive_hash;
3918     return $dgitview if deliberately_not_fast_forward();
3919
3920     printdebug "splitbrain_pseudomerge...\n";
3921
3922     my $i_arch_v = pseudomerge_version_check($clogp, $archive_hash);
3923
3924     if (!defined $overwrite_version) {
3925         progress "Checking that HEAD inciudes all changes in archive...";
3926     }
3927
3928     return $dgitview if is_fast_fwd $archive_hash, $dgitview;
3929
3930     if (defined $overwrite_version) {
3931     } elsif (!eval {
3932         my $t_dep14 = debiantag_maintview $i_arch_v->[0], access_nomdistro;
3933         my $i_dep14 = infopair_lrf_tag_lookup($t_dep14, "maintainer view tag");
3934         my $t_dgit = debiantag_new $i_arch_v->[0], access_nomdistro;
3935         my $i_dgit = infopair_lrf_tag_lookup($t_dgit, "dgit view tag");
3936         my $i_archive = [ $archive_hash, "current archive contents" ];
3937
3938         printdebug "splitbrain_pseudomerge i_archive @$i_archive\n";
3939
3940         infopair_cond_equal($i_dgit, $i_archive);
3941         infopair_cond_ff($i_dep14, $i_dgit);
3942         infopair_cond_ff($i_dep14, [ $maintview, 'HEAD' ]);
3943         1;
3944     }) {
3945         print STDERR <<END;
3946 $us: check failed (maybe --overwrite is needed, consult documentation)
3947 END
3948         die "$@";
3949     }
3950
3951     my $r = pseudomerge_make_commit
3952         $clogp, $dgitview, $archive_hash, $i_arch_v,
3953         "dgit --quilt=$quilt_mode",
3954         (defined $overwrite_version ? <<END_OVERWR : <<END_MAKEFF);
3955 Declare fast forward from $i_arch_v->[0]
3956 END_OVERWR
3957 Make fast forward from $i_arch_v->[0]
3958 END_MAKEFF
3959
3960     maybe_split_brain_save $maintview, $r, "pseudomerge";
3961
3962     progress "Made pseudo-merge of $i_arch_v->[0] into dgit view.";
3963     return $r;
3964 }       
3965
3966 sub plain_overwrite_pseudomerge ($$$) {
3967     my ($clogp, $head, $archive_hash) = @_;
3968
3969     printdebug "plain_overwrite_pseudomerge...";
3970
3971     my $i_arch_v = pseudomerge_version_check($clogp, $archive_hash);
3972
3973     return $head if is_fast_fwd $archive_hash, $head;
3974
3975     my $m = "Declare fast forward from $i_arch_v->[0]";
3976
3977     my $r = pseudomerge_make_commit
3978         $clogp, $head, $archive_hash, $i_arch_v,
3979         "dgit", $m;
3980
3981     runcmd @git, qw(update-ref -m), $m, 'HEAD', $r, $head;
3982
3983     progress "Make pseudo-merge of $i_arch_v->[0] into your HEAD.";
3984     return $r;
3985 }
3986
3987 sub push_parse_changelog ($) {
3988     my ($clogpfn) = @_;
3989
3990     my $clogp = Dpkg::Control::Hash->new();
3991     $clogp->load($clogpfn) or die;
3992
3993     my $clogpackage = getfield $clogp, 'Source';
3994     $package //= $clogpackage;
3995     fail "-p specified $package but changelog specified $clogpackage"
3996         unless $package eq $clogpackage;
3997     my $cversion = getfield $clogp, 'Version';
3998
3999     if (!$we_are_initiator) {
4000         # rpush initiator can't do this because it doesn't have $isuite yet
4001         my $tag = debiantag($cversion, access_nomdistro);
4002         runcmd @git, qw(check-ref-format), $tag;
4003     }
4004
4005     my $dscfn = dscfn($cversion);
4006
4007     return ($clogp, $cversion, $dscfn);
4008 }
4009
4010 sub push_parse_dsc ($$$) {
4011     my ($dscfn,$dscfnwhat, $cversion) = @_;
4012     $dsc = parsecontrol($dscfn,$dscfnwhat);
4013     my $dversion = getfield $dsc, 'Version';
4014     my $dscpackage = getfield $dsc, 'Source';
4015     ($dscpackage eq $package && $dversion eq $cversion) or
4016         fail "$dscfn is for $dscpackage $dversion".
4017             " but debian/changelog is for $package $cversion";
4018 }
4019
4020 sub push_tagwants ($$$$) {
4021     my ($cversion, $dgithead, $maintviewhead, $tfbase) = @_;
4022     my @tagwants;
4023     push @tagwants, {
4024         TagFn => \&debiantag,
4025         Objid => $dgithead,
4026         TfSuffix => '',
4027         View => 'dgit',
4028     };
4029     if (defined $maintviewhead) {
4030         push @tagwants, {
4031             TagFn => \&debiantag_maintview,
4032             Objid => $maintviewhead,
4033             TfSuffix => '-maintview',
4034             View => 'maint',
4035         };
4036     } elsif ($dodep14tag eq 'no' ? 0
4037              : $dodep14tag eq 'want' ? access_cfg_tagformats_can_splitbrain
4038              : $dodep14tag eq 'always'
4039              ? (access_cfg_tagformats_can_splitbrain or fail <<END)
4040 --dep14tag-always (or equivalent in config) means server must support
4041  both "new" and "maint" tag formats, but config says it doesn't.
4042 END
4043             : die "$dodep14tag ?") {
4044         push @tagwants, {
4045             TagFn => \&debiantag_maintview,
4046             Objid => $dgithead,
4047             TfSuffix => '-dgit',
4048             View => 'dgit',
4049         };
4050     };
4051     foreach my $tw (@tagwants) {
4052         $tw->{Tag} = $tw->{TagFn}($cversion, access_nomdistro);
4053         $tw->{Tfn} = sub { $tfbase.$tw->{TfSuffix}.$_[0]; };
4054     }
4055     printdebug 'push_tagwants: ', Dumper(\@_, \@tagwants);
4056     return @tagwants;
4057 }
4058
4059 sub push_mktags ($$ $$ $) {
4060     my ($clogp,$dscfn,
4061         $changesfile,$changesfilewhat,
4062         $tagwants) = @_;
4063
4064     die unless $tagwants->[0]{View} eq 'dgit';
4065
4066     my $declaredistro = access_nomdistro();
4067     my $reader_giturl = do { local $access_forpush=0; access_giturl(); };
4068     $dsc->{$ourdscfield[0]} = join " ",
4069         $tagwants->[0]{Objid}, $declaredistro, $tagwants->[0]{Tag},
4070         $reader_giturl;
4071     $dsc->save("$dscfn.tmp") or die $!;
4072
4073     my $changes = parsecontrol($changesfile,$changesfilewhat);
4074     foreach my $field (qw(Source Distribution Version)) {
4075         $changes->{$field} eq $clogp->{$field} or
4076             fail "changes field $field \`$changes->{$field}'".
4077                 " does not match changelog \`$clogp->{$field}'";
4078     }
4079
4080     my $cversion = getfield $clogp, 'Version';
4081     my $clogsuite = getfield $clogp, 'Distribution';
4082
4083     # We make the git tag by hand because (a) that makes it easier
4084     # to control the "tagger" (b) we can do remote signing
4085     my $authline = clogp_authline $clogp;
4086     my $delibs = join(" ", "",@deliberatelies);
4087
4088     my $mktag = sub {
4089         my ($tw) = @_;
4090         my $tfn = $tw->{Tfn};
4091         my $head = $tw->{Objid};
4092         my $tag = $tw->{Tag};
4093
4094         open TO, '>', $tfn->('.tmp') or die $!;
4095         print TO <<END or die $!;
4096 object $head
4097 type commit
4098 tag $tag
4099 tagger $authline
4100
4101 END
4102         if ($tw->{View} eq 'dgit') {
4103             print TO <<END or die $!;
4104 $package release $cversion for $clogsuite ($csuite) [dgit]
4105 [dgit distro=$declaredistro$delibs]
4106 END
4107             foreach my $ref (sort keys %previously) {
4108                 print TO <<END or die $!;
4109 [dgit previously:$ref=$previously{$ref}]
4110 END
4111             }
4112         } elsif ($tw->{View} eq 'maint') {
4113             print TO <<END or die $!;
4114 $package release $cversion for $clogsuite ($csuite)
4115 (maintainer view tag generated by dgit --quilt=$quilt_mode)
4116 END
4117         } else {
4118             die Dumper($tw)."?";
4119         }
4120
4121         close TO or die $!;
4122
4123         my $tagobjfn = $tfn->('.tmp');
4124         if ($sign) {
4125             if (!defined $keyid) {
4126                 $keyid = access_cfg('keyid','RETURN-UNDEF');
4127             }
4128             if (!defined $keyid) {
4129                 $keyid = getfield $clogp, 'Maintainer';
4130             }
4131             unlink $tfn->('.tmp.asc') or $!==&ENOENT or die $!;
4132             my @sign_cmd = (@gpg, qw(--detach-sign --armor));
4133             push @sign_cmd, qw(-u),$keyid if defined $keyid;
4134             push @sign_cmd, $tfn->('.tmp');
4135             runcmd_ordryrun @sign_cmd;
4136             if (act_scary()) {
4137                 $tagobjfn = $tfn->('.signed.tmp');
4138                 runcmd shell_cmd "exec >$tagobjfn", qw(cat --),
4139                     $tfn->('.tmp'), $tfn->('.tmp.asc');
4140             }
4141         }
4142         return $tagobjfn;
4143     };
4144
4145     my @r = map { $mktag->($_); } @$tagwants;
4146     return @r;
4147 }
4148
4149 sub sign_changes ($) {
4150     my ($changesfile) = @_;
4151     if ($sign) {
4152         my @debsign_cmd = @debsign;
4153         push @debsign_cmd, "-k$keyid" if defined $keyid;
4154         push @debsign_cmd, "-p$gpg[0]" if $gpg[0] ne 'gpg';
4155         push @debsign_cmd, $changesfile;
4156         runcmd_ordryrun @debsign_cmd;
4157     }
4158 }
4159
4160 sub dopush () {
4161     printdebug "actually entering push\n";
4162
4163     supplementary_message(<<'END');
4164 Push failed, while checking state of the archive.
4165 You can retry the push, after fixing the problem, if you like.
4166 END
4167     if (check_for_git()) {
4168         git_fetch_us();
4169     }
4170     my $archive_hash = fetch_from_archive();
4171     if (!$archive_hash) {
4172         $new_package or
4173             fail "package appears to be new in this suite;".
4174                 " if this is intentional, use --new";
4175     }
4176
4177     supplementary_message(<<'END');
4178 Push failed, while preparing your push.
4179 You can retry the push, after fixing the problem, if you like.
4180 END
4181
4182     need_tagformat 'new', "quilt mode $quilt_mode"
4183         if quiltmode_splitbrain;
4184
4185     prep_ud();
4186
4187     access_giturl(); # check that success is vaguely likely
4188     rpush_handle_protovsn_bothends() if $we_are_initiator;
4189     select_tagformat();
4190
4191     my $clogpfn = dgit_privdir()."/changelog.822.tmp";
4192     runcmd shell_cmd "exec >$clogpfn", qw(dpkg-parsechangelog);
4193
4194     responder_send_file('parsed-changelog', $clogpfn);
4195
4196     my ($clogp, $cversion, $dscfn) =
4197         push_parse_changelog("$clogpfn");
4198
4199     my $dscpath = "$buildproductsdir/$dscfn";
4200     stat_exists $dscpath or
4201         fail "looked for .dsc $dscpath, but $!;".
4202             " maybe you forgot to build";
4203
4204     responder_send_file('dsc', $dscpath);
4205
4206     push_parse_dsc($dscpath, $dscfn, $cversion);
4207
4208     my $format = getfield $dsc, 'Format';
4209     printdebug "format $format\n";
4210
4211     my $actualhead = git_rev_parse('HEAD');
4212     my $dgithead = $actualhead;
4213     my $maintviewhead = undef;
4214
4215     my $upstreamversion = upstreamversion $clogp->{Version};
4216
4217     if (madformat_wantfixup($format)) {
4218         # user might have not used dgit build, so maybe do this now:
4219         if (quiltmode_splitbrain()) {
4220             changedir $playground;
4221             quilt_make_fake_dsc($upstreamversion);
4222             my $cachekey;
4223             ($dgithead, $cachekey) =
4224                 quilt_check_splitbrain_cache($actualhead, $upstreamversion);
4225             $dgithead or fail
4226  "--quilt=$quilt_mode but no cached dgit view:
4227  perhaps HEAD changed since dgit build[-source] ?";
4228             $split_brain = 1;
4229             $dgithead = splitbrain_pseudomerge($clogp,
4230                                                $actualhead, $dgithead,
4231                                                $archive_hash);
4232             $maintviewhead = $actualhead;
4233             changedir $maindir;
4234             prep_ud(); # so _only_subdir() works, below
4235         } else {
4236             commit_quilty_patch();
4237         }
4238     }
4239
4240     if (defined $overwrite_version && !defined $maintviewhead) {
4241         $dgithead = plain_overwrite_pseudomerge($clogp,
4242                                                 $dgithead,
4243                                                 $archive_hash);
4244     }
4245
4246     check_not_dirty();
4247
4248     my $forceflag = '';
4249     if ($archive_hash) {
4250         if (is_fast_fwd($archive_hash, $dgithead)) {
4251             # ok
4252         } elsif (deliberately_not_fast_forward) {
4253             $forceflag = '+';
4254         } else {
4255             fail "dgit push: HEAD is not a descendant".
4256                 " of the archive's version.\n".
4257                 "To overwrite the archive's contents,".
4258                 " pass --overwrite[=VERSION].\n".
4259                 "To rewind history, if permitted by the archive,".
4260                 " use --deliberately-not-fast-forward.";
4261         }
4262     }
4263
4264     changedir $playground;
4265     progress "checking that $dscfn corresponds to HEAD";
4266     runcmd qw(dpkg-source -x --),
4267         $dscpath =~ m#^/# ? $dscpath : "$maindir/$dscpath";
4268     my ($tree,$dir) = mktree_in_ud_from_only_subdir("source package");
4269     check_for_vendor_patches() if madformat($dsc->{format});
4270     changedir $maindir;
4271     my @diffcmd = (@git, qw(diff --quiet), $tree, $dgithead);
4272     debugcmd "+",@diffcmd;
4273     $!=0; $?=-1;
4274     my $r = system @diffcmd;
4275     if ($r) {
4276         if ($r==256) {
4277             my $referent = $split_brain ? $dgithead : 'HEAD';
4278             my $diffs = cmdoutput @git, qw(diff --stat), $tree, $dgithead;
4279
4280             my @mode_changes;
4281             my $raw = cmdoutput @git,
4282                 qw(diff --no-renames -z -r --raw), $tree, $dgithead;
4283             my $changed;
4284             foreach (split /\0/, $raw) {
4285                 if (defined $changed) {
4286                     push @mode_changes, "$changed: $_\n" if $changed;
4287                     $changed = undef;
4288                     next;
4289                 } elsif (m/^:0+ 0+ /) {
4290                     $changed = '';
4291                 } elsif (m/^:(?:10*)?(\d+) (?:10*)?(\d+) /) {
4292                     $changed = "Mode change from $1 to $2"
4293                 } else {
4294                     die "$_ ?";
4295                 }
4296             }
4297             if (@mode_changes) {
4298                 fail <<END.(join '', @mode_changes).<<END;
4299 HEAD specifies a different tree to $dscfn:
4300 $diffs
4301 END
4302 There is a problem with your source tree (see dgit(7) for some hints).
4303 To see a full diff, run git diff $tree $referent
4304 END
4305             }
4306
4307             fail <<END;
4308 HEAD specifies a different tree to $dscfn:
4309 $diffs
4310 Perhaps you forgot to build.  Or perhaps there is a problem with your
4311  source tree (see dgit(7) for some hints).  To see a full diff, run
4312    git diff $tree $referent
4313 END
4314         } else {
4315             failedcmd @diffcmd;
4316         }
4317     }
4318     if (!$changesfile) {
4319         my $pat = changespat $cversion;
4320         my @cs = glob "$buildproductsdir/$pat";
4321         fail "failed to find unique changes file".
4322             " (looked for $pat in $buildproductsdir);".
4323             " perhaps you need to use dgit -C"
4324             unless @cs==1;
4325         ($changesfile) = @cs;
4326     } else {
4327         $changesfile = "$buildproductsdir/$changesfile";
4328     }
4329
4330     # Check that changes and .dsc agree enough
4331     $changesfile =~ m{[^/]*$};
4332     my $changes = parsecontrol($changesfile,$&);
4333     files_compare_inputs($dsc, $changes)
4334         unless forceing [qw(dsc-changes-mismatch)];
4335
4336     # Perhaps adjust .dsc to contain right set of origs
4337     changes_update_origs_from_dsc($dsc, $changes, $upstreamversion,
4338                                   $changesfile)
4339         unless forceing [qw(changes-origs-exactly)];
4340
4341     # Checks complete, we're going to try and go ahead:
4342
4343     responder_send_file('changes',$changesfile);
4344     responder_send_command("param head $dgithead");
4345     responder_send_command("param csuite $csuite");
4346     responder_send_command("param isuite $isuite");
4347     responder_send_command("param tagformat $tagformat");
4348     if (defined $maintviewhead) {
4349         die unless ($protovsn//4) >= 4;
4350         responder_send_command("param maint-view $maintviewhead");
4351     }
4352
4353     # Perhaps send buildinfo(s) for signing
4354     my $changes_files = getfield $changes, 'Files';
4355     my @buildinfos = ($changes_files =~ m/ .* (\S+\.buildinfo)$/mg);
4356     foreach my $bi (@buildinfos) {
4357         responder_send_command("param buildinfo-filename $bi");
4358         responder_send_file('buildinfo', "$buildproductsdir/$bi");
4359     }
4360
4361     if (deliberately_not_fast_forward) {
4362         git_for_each_ref(lrfetchrefs, sub {
4363             my ($objid,$objtype,$lrfetchrefname,$reftail) = @_;
4364             my $rrefname= substr($lrfetchrefname, length(lrfetchrefs) + 1);
4365             responder_send_command("previously $rrefname=$objid");
4366             $previously{$rrefname} = $objid;
4367         });
4368     }
4369
4370     my @tagwants = push_tagwants($cversion, $dgithead, $maintviewhead,
4371                                  dgit_privdir()."/tag");
4372     my @tagobjfns;
4373
4374     supplementary_message(<<'END');
4375 Push failed, while signing the tag.
4376 You can retry the push, after fixing the problem, if you like.
4377 END