chiark / gitweb /
Dgit: break must_getcwd out into Dgit.pm
[dgit.git] / dgit
1 #!/usr/bin/perl -w
2 # dgit
3 # Integration between git and Debian-style archives
4 #
5 # Copyright (C)2013-2016 Ian Jackson
6 #
7 # This program is free software: you can redistribute it and/or modify
8 # it under the terms of the GNU General Public License as published by
9 # the Free Software Foundation, either version 3 of the License, or
10 # (at your option) any later version.
11 #
12 # This program is distributed in the hope that it will be useful,
13 # but WITHOUT ANY WARRANTY; without even the implied warranty of
14 # MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
15 # GNU General Public License for more details.
16 #
17 # You should have received a copy of the GNU General Public License
18 # along with this program.  If not, see <http://www.gnu.org/licenses/>.
19
20 use strict;
21
22 use Debian::Dgit;
23 setup_sigwarn();
24
25 use IO::Handle;
26 use Data::Dumper;
27 use LWP::UserAgent;
28 use Dpkg::Control::Hash;
29 use File::Path;
30 use File::Temp qw(tempdir);
31 use File::Basename;
32 use Dpkg::Version;
33 use POSIX;
34 use IPC::Open2;
35 use Digest::SHA;
36 use Digest::MD5;
37 use List::MoreUtils qw(pairwise);
38 use Text::Glob qw(match_glob);
39 use Fcntl qw(:DEFAULT :flock);
40 use Carp;
41
42 use Debian::Dgit;
43
44 our $our_version = 'UNRELEASED'; ###substituted###
45 our $absurdity = undef; ###substituted###
46
47 our @rpushprotovsn_support = qw(4 3 2); # 4 is new tag format
48 our $protovsn;
49
50 our $cmd;
51 our $subcommand;
52 our $isuite;
53 our $idistro;
54 our $package;
55 our @ropts;
56
57 our $sign = 1;
58 our $dryrun_level = 0;
59 our $changesfile;
60 our $buildproductsdir = '..';
61 our $new_package = 0;
62 our $ignoredirty = 0;
63 our $rmonerror = 1;
64 our @deliberatelies;
65 our %previously;
66 our $existing_package = 'dpkg';
67 our $cleanmode;
68 our $changes_since_version;
69 our $rmchanges;
70 our $overwrite_version; # undef: not specified; '': check changelog
71 our $quilt_mode;
72 our $quilt_modes_re = 'linear|smash|auto|nofix|nocheck|gbp|dpm|unapplied';
73 our $dodep14tag;
74 our $split_brain_save;
75 our $we_are_responder;
76 our $we_are_initiator;
77 our $initiator_tempdir;
78 our $patches_applied_dirtily = 00;
79 our $tagformat_want;
80 our $tagformat;
81 our $tagformatfn;
82 our $chase_dsc_distro=1;
83
84 our %forceopts = map { $_=>0 }
85     qw(unrepresentable unsupported-source-format
86        dsc-changes-mismatch changes-origs-exactly
87        import-gitapply-absurd
88        import-gitapply-no-absurd
89        import-dsc-with-dgit-field);
90
91 our %format_ok = map { $_=>1 } ("1.0","3.0 (native)","3.0 (quilt)");
92
93 our $suite_re = '[-+.0-9a-z]+';
94 our $cleanmode_re = 'dpkg-source(?:-d)?|git|git-ff|check|none';
95 our $orig_f_comp_re = 'orig(?:-[-0-9a-z]+)?';
96 our $orig_f_sig_re = '\\.(?:asc|gpg|pgp)';
97 our $orig_f_tail_re = "$orig_f_comp_re\\.tar(?:\\.\\w+)?(?:$orig_f_sig_re)?";
98
99 our $git_authline_re = '^([^<>]+) \<(\S+)\> (\d+ [-+]\d+)$';
100 our $splitbraincache = 'dgit-intern/quilt-cache';
101 our $rewritemap = 'dgit-rewrite/map';
102
103 our (@git) = qw(git);
104 our (@dget) = qw(dget);
105 our (@curl) = (qw(curl --proto-redir), '-all,http,https', qw(-L));
106 our (@dput) = qw(dput);
107 our (@debsign) = qw(debsign);
108 our (@gpg) = qw(gpg);
109 our (@sbuild) = qw(sbuild);
110 our (@ssh) = 'ssh';
111 our (@dgit) = qw(dgit);
112 our (@aptget) = qw(apt-get);
113 our (@aptcache) = qw(apt-cache);
114 our (@dpkgbuildpackage) = qw(dpkg-buildpackage -i\.git/ -I.git);
115 our (@dpkgsource) = qw(dpkg-source -i\.git/ -I.git);
116 our (@dpkggenchanges) = qw(dpkg-genchanges);
117 our (@mergechanges) = qw(mergechanges -f);
118 our (@gbp_build) = ('');
119 our (@gbp_pq) = ('gbp pq');
120 our (@changesopts) = ('');
121
122 our %opts_opt_map = ('dget' => \@dget, # accept for compatibility
123                      'curl' => \@curl,
124                      'dput' => \@dput,
125                      'debsign' => \@debsign,
126                      'gpg' => \@gpg,
127                      'sbuild' => \@sbuild,
128                      'ssh' => \@ssh,
129                      'dgit' => \@dgit,
130                      'git' => \@git,
131                      'apt-get' => \@aptget,
132                      'apt-cache' => \@aptcache,
133                      'dpkg-source' => \@dpkgsource,
134                      'dpkg-buildpackage' => \@dpkgbuildpackage,
135                      'dpkg-genchanges' => \@dpkggenchanges,
136                      'gbp-build' => \@gbp_build,
137                      'gbp-pq' => \@gbp_pq,
138                      'ch' => \@changesopts,
139                      'mergechanges' => \@mergechanges);
140
141 our %opts_opt_cmdonly = ('gpg' => 1, 'git' => 1);
142 our %opts_cfg_insertpos = map {
143     $_,
144     scalar @{ $opts_opt_map{$_} }
145 } keys %opts_opt_map;
146
147 sub parseopts_late_defaults();
148 sub setup_gitattrs(;$);
149 sub check_gitattrs($$);
150
151 our $keyid;
152
153 autoflush STDOUT 1;
154
155 our $supplementary_message = '';
156 our $need_split_build_invocation = 0;
157 our $split_brain = 0;
158
159 END {
160     local ($@, $?);
161     return unless forkcheck_mainprocess();
162     print STDERR "! $_\n" foreach $supplementary_message =~ m/^.+$/mg;
163 }
164
165 our $remotename = 'dgit';
166 our @ourdscfield = qw(Dgit Vcs-Dgit-Master);
167 our $csuite;
168 our $instead_distro;
169
170 if (!defined $absurdity) {
171     $absurdity = $0;
172     $absurdity =~ s{/[^/]+$}{/absurd} or die;
173 }
174
175 sub debiantag ($$) {
176     my ($v,$distro) = @_;
177     return $tagformatfn->($v, $distro);
178 }
179
180 sub debiantag_maintview ($$) { 
181     my ($v,$distro) = @_;
182     return "$distro/".dep14_version_mangle $v;
183 }
184
185 sub madformat ($) { $_[0] eq '3.0 (quilt)' }
186
187 sub lbranch () { return "$branchprefix/$csuite"; }
188 my $lbranch_re = '^refs/heads/'.$branchprefix.'/([^/.]+)$';
189 sub lref () { return "refs/heads/".lbranch(); }
190 sub lrref () { return "refs/remotes/$remotename/".server_branch($csuite); }
191 sub rrref () { return server_ref($csuite); }
192
193 sub stripepoch ($) {
194     my ($vsn) = @_;
195     $vsn =~ s/^\d+\://;
196     return $vsn;
197 }
198
199 sub srcfn ($$) {
200     my ($vsn,$sfx) = @_;
201     return "${package}_".(stripepoch $vsn).$sfx
202 }
203
204 sub dscfn ($) {
205     my ($vsn) = @_;
206     return srcfn($vsn,".dsc");
207 }
208
209 sub changespat ($;$) {
210     my ($vsn, $arch) = @_;
211     return "${package}_".(stripepoch $vsn)."_".($arch//'*').".changes";
212 }
213
214 sub upstreamversion ($) {
215     my ($vsn) = @_;
216     $vsn =~ s/-[^-]+$//;
217     return $vsn;
218 }
219
220 our $us = 'dgit';
221 initdebug('');
222
223 our @end;
224 END { 
225     local ($?);
226     return unless forkcheck_mainprocess();
227     foreach my $f (@end) {
228         eval { $f->(); };
229         print STDERR "$us: cleanup: $@" if length $@;
230     }
231 };
232
233 sub badcfg { print STDERR "$us: invalid configuration: @_\n"; exit 12; }
234
235 sub forceable_fail ($$) {
236     my ($forceoptsl, $msg) = @_;
237     fail $msg unless grep { $forceopts{$_} } @$forceoptsl;
238     print STDERR "warning: overriding problem due to --force:\n". $msg;
239 }
240
241 sub forceing ($) {
242     my ($forceoptsl) = @_;
243     my @got = grep { $forceopts{$_} } @$forceoptsl;
244     return 0 unless @got;
245     print STDERR
246  "warning: skipping checks or functionality due to --force-$got[0]\n";
247 }
248
249 sub no_such_package () {
250     print STDERR "$us: package $package does not exist in suite $isuite\n";
251     exit 4;
252 }
253
254 sub deliberately ($) {
255     my ($enquiry) = @_;
256     return !!grep { $_ eq "--deliberately-$enquiry" } @deliberatelies;
257 }
258
259 sub deliberately_not_fast_forward () {
260     foreach (qw(not-fast-forward fresh-repo)) {
261         return 1 if deliberately($_) || deliberately("TEST-dgit-only-$_");
262     }
263 }
264
265 sub quiltmode_splitbrain () {
266     $quilt_mode =~ m/gbp|dpm|unapplied/;
267 }
268
269 sub opts_opt_multi_cmd {
270     my @cmd;
271     push @cmd, split /\s+/, shift @_;
272     push @cmd, @_;
273     @cmd;
274 }
275
276 sub gbp_pq {
277     return opts_opt_multi_cmd @gbp_pq;
278 }
279
280 #---------- remote protocol support, common ----------
281
282 # remote push initiator/responder protocol:
283 #  $ dgit remote-push-build-host <n-rargs> <rargs>... <push-args>...
284 #  where <rargs> is <push-host-dir> <supported-proto-vsn>,... ...
285 #  < dgit-remote-push-ready <actual-proto-vsn>
286 #
287 # occasionally:
288 #
289 #  > progress NBYTES
290 #  [NBYTES message]
291 #
292 #  > supplementary-message NBYTES          # $protovsn >= 3
293 #  [NBYTES message]
294 #
295 # main sequence:
296 #
297 #  > file parsed-changelog
298 #  [indicates that output of dpkg-parsechangelog follows]
299 #  > data-block NBYTES
300 #  > [NBYTES bytes of data (no newline)]
301 #  [maybe some more blocks]
302 #  > data-end
303 #
304 #  > file dsc
305 #  [etc]
306 #
307 #  > file changes
308 #  [etc]
309 #
310 #  > param head DGIT-VIEW-HEAD
311 #  > param csuite SUITE
312 #  > param tagformat old|new
313 #  > param maint-view MAINT-VIEW-HEAD
314 #
315 #  > param buildinfo-filename P_V_X.buildinfo   # zero or more times
316 #  > file buildinfo                             # for buildinfos to sign
317 #
318 #  > previously REFNAME=OBJNAME       # if --deliberately-not-fast-forward
319 #                                     # goes into tag, for replay prevention
320 #
321 #  > want signed-tag
322 #  [indicates that signed tag is wanted]
323 #  < data-block NBYTES
324 #  < [NBYTES bytes of data (no newline)]
325 #  [maybe some more blocks]
326 #  < data-end
327 #  < files-end
328 #
329 #  > want signed-dsc-changes
330 #  < data-block NBYTES    [transfer of signed dsc]
331 #  [etc]
332 #  < data-block NBYTES    [transfer of signed changes]
333 #  [etc]
334 #  < data-block NBYTES    [transfer of each signed buildinfo
335 #  [etc]                   same number and order as "file buildinfo"]
336 #  ...
337 #  < files-end
338 #
339 #  > complete
340
341 our $i_child_pid;
342
343 sub i_child_report () {
344     # Sees if our child has died, and reap it if so.  Returns a string
345     # describing how it died if it failed, or undef otherwise.
346     return undef unless $i_child_pid;
347     my $got = waitpid $i_child_pid, WNOHANG;
348     return undef if $got <= 0;
349     die unless $got == $i_child_pid;
350     $i_child_pid = undef;
351     return undef unless $?;
352     return "build host child ".waitstatusmsg();
353 }
354
355 sub badproto ($$) {
356     my ($fh, $m) = @_;
357     fail "connection lost: $!" if $fh->error;
358     fail "protocol violation; $m not expected";
359 }
360
361 sub badproto_badread ($$) {
362     my ($fh, $wh) = @_;
363     fail "connection lost: $!" if $!;
364     my $report = i_child_report();
365     fail $report if defined $report;
366     badproto $fh, "eof (reading $wh)";
367 }
368
369 sub protocol_expect (&$) {
370     my ($match, $fh) = @_;
371     local $_;
372     $_ = <$fh>;
373     defined && chomp or badproto_badread $fh, "protocol message";
374     if (wantarray) {
375         my @r = &$match;
376         return @r if @r;
377     } else {
378         my $r = &$match;
379         return $r if $r;
380     }
381     badproto $fh, "\`$_'";
382 }
383
384 sub protocol_send_file ($$) {
385     my ($fh, $ourfn) = @_;
386     open PF, "<", $ourfn or die "$ourfn: $!";
387     for (;;) {
388         my $d;
389         my $got = read PF, $d, 65536;
390         die "$ourfn: $!" unless defined $got;
391         last if !$got;
392         print $fh "data-block ".length($d)."\n" or die $!;
393         print $fh $d or die $!;
394     }
395     PF->error and die "$ourfn $!";
396     print $fh "data-end\n" or die $!;
397     close PF;
398 }
399
400 sub protocol_read_bytes ($$) {
401     my ($fh, $nbytes) = @_;
402     $nbytes =~ m/^[1-9]\d{0,5}$|^0$/ or badproto \*RO, "bad byte count";
403     my $d;
404     my $got = read $fh, $d, $nbytes;
405     $got==$nbytes or badproto_badread $fh, "data block";
406     return $d;
407 }
408
409 sub protocol_receive_file ($$) {
410     my ($fh, $ourfn) = @_;
411     printdebug "() $ourfn\n";
412     open PF, ">", $ourfn or die "$ourfn: $!";
413     for (;;) {
414         my ($y,$l) = protocol_expect {
415             m/^data-block (.*)$/ ? (1,$1) :
416             m/^data-end$/ ? (0,) :
417             ();
418         } $fh;
419         last unless $y;
420         my $d = protocol_read_bytes $fh, $l;
421         print PF $d or die $!;
422     }
423     close PF or die $!;
424 }
425
426 #---------- remote protocol support, responder ----------
427
428 sub responder_send_command ($) {
429     my ($command) = @_;
430     return unless $we_are_responder;
431     # called even without $we_are_responder
432     printdebug ">> $command\n";
433     print PO $command, "\n" or die $!;
434 }    
435
436 sub responder_send_file ($$) {
437     my ($keyword, $ourfn) = @_;
438     return unless $we_are_responder;
439     printdebug "]] $keyword $ourfn\n";
440     responder_send_command "file $keyword";
441     protocol_send_file \*PO, $ourfn;
442 }
443
444 sub responder_receive_files ($@) {
445     my ($keyword, @ourfns) = @_;
446     die unless $we_are_responder;
447     printdebug "[[ $keyword @ourfns\n";
448     responder_send_command "want $keyword";
449     foreach my $fn (@ourfns) {
450         protocol_receive_file \*PI, $fn;
451     }
452     printdebug "[[\$\n";
453     protocol_expect { m/^files-end$/ } \*PI;
454 }
455
456 #---------- remote protocol support, initiator ----------
457
458 sub initiator_expect (&) {
459     my ($match) = @_;
460     protocol_expect { &$match } \*RO;
461 }
462
463 #---------- end remote code ----------
464
465 sub progress {
466     if ($we_are_responder) {
467         my $m = join '', @_;
468         responder_send_command "progress ".length($m) or die $!;
469         print PO $m or die $!;
470     } else {
471         print @_, "\n";
472     }
473 }
474
475 our $ua;
476
477 sub url_get {
478     if (!$ua) {
479         $ua = LWP::UserAgent->new();
480         $ua->env_proxy;
481     }
482     my $what = $_[$#_];
483     progress "downloading $what...";
484     my $r = $ua->get(@_) or die $!;
485     return undef if $r->code == 404;
486     $r->is_success or fail "failed to fetch $what: ".$r->status_line;
487     return $r->decoded_content(charset => 'none');
488 }
489
490 our ($dscdata,$dscurl,$dsc,$dsc_checked,$skew_warning_vsn);
491
492 sub act_local () { return $dryrun_level <= 1; }
493 sub act_scary () { return !$dryrun_level; }
494
495 sub printdone {
496     if (!$dryrun_level) {
497         progress "$us ok: @_";
498     } else {
499         progress "would be ok: @_ (but dry run only)";
500     }
501 }
502
503 sub dryrun_report {
504     printcmd(\*STDERR,$debugprefix."#",@_);
505 }
506
507 sub runcmd_ordryrun {
508     if (act_scary()) {
509         runcmd @_;
510     } else {
511         dryrun_report @_;
512     }
513 }
514
515 sub runcmd_ordryrun_local {
516     if (act_local()) {
517         runcmd @_;
518     } else {
519         dryrun_report @_;
520     }
521 }
522
523 sub shell_cmd {
524     my ($first_shell, @cmd) = @_;
525     return qw(sh -ec), $first_shell.'; exec "$@"', 'x', @cmd;
526 }
527
528 our $helpmsg = <<END;
529 main usages:
530   dgit [dgit-opts] clone [dgit-opts] package [suite] [./dir|/dir]
531   dgit [dgit-opts] fetch|pull [dgit-opts] [suite]
532   dgit [dgit-opts] build [dpkg-buildpackage-opts]
533   dgit [dgit-opts] sbuild [sbuild-opts]
534   dgit [dgit-opts] push [dgit-opts] [suite]
535   dgit [dgit-opts] rpush build-host:build-dir ...
536 important dgit options:
537   -k<keyid>           sign tag and package with <keyid> instead of default
538   --dry-run -n        do not change anything, but go through the motions
539   --damp-run -L       like --dry-run but make local changes, without signing
540   --new -N            allow introducing a new package
541   --debug -D          increase debug level
542   -c<name>=<value>    set git config option (used directly by dgit too)
543 END
544
545 our $later_warning_msg = <<END;
546 Perhaps the upload is stuck in incoming.  Using the version from git.
547 END
548
549 sub badusage {
550     print STDERR "$us: @_\n", $helpmsg or die $!;
551     exit 8;
552 }
553
554 sub nextarg {
555     @ARGV or badusage "too few arguments";
556     return scalar shift @ARGV;
557 }
558
559 sub pre_help () {
560     no_local_git_cfg();
561 }
562 sub cmd_help () {
563     print $helpmsg or die $!;
564     exit 0;
565 }
566
567 our $td = $ENV{DGIT_TEST_DUMMY_DIR} || "DGIT_TEST_DUMMY_DIR-unset";
568
569 our %defcfg = ('dgit.default.distro' => 'debian',
570                'dgit.default.default-suite' => 'unstable',
571                'dgit.default.old-dsc-distro' => 'debian',
572                'dgit-suite.*-security.distro' => 'debian-security',
573                'dgit.default.username' => '',
574                'dgit.default.archive-query-default-component' => 'main',
575                'dgit.default.ssh' => 'ssh',
576                'dgit.default.archive-query' => 'madison:',
577                'dgit.default.sshpsql-dbname' => 'service=projectb',
578                'dgit.default.aptget-components' => 'main',
579                'dgit.default.dgit-tag-format' => 'new,old,maint',
580                'dgit.dsc-url-proto-ok.http'    => 'true',
581                'dgit.dsc-url-proto-ok.https'   => 'true',
582                'dgit.dsc-url-proto-ok.git'     => 'true',
583                'dgit.default.dsc-url-proto-ok' => 'false',
584                # old means "repo server accepts pushes with old dgit tags"
585                # new means "repo server accepts pushes with new dgit tags"
586                # maint means "repo server accepts split brain pushes"
587                # hist means "repo server may have old pushes without new tag"
588                #   ("hist" is implied by "old")
589                'dgit-distro.debian.archive-query' => 'ftpmasterapi:',
590                'dgit-distro.debian.git-check' => 'url',
591                'dgit-distro.debian.git-check-suffix' => '/info/refs',
592                'dgit-distro.debian.new-private-pushers' => 't',
593                'dgit-distro.debian/push.git-url' => '',
594                'dgit-distro.debian/push.git-host' => 'push.dgit.debian.org',
595                'dgit-distro.debian/push.git-user-force' => 'dgit',
596                'dgit-distro.debian/push.git-proto' => 'git+ssh://',
597                'dgit-distro.debian/push.git-path' => '/dgit/debian/repos',
598                'dgit-distro.debian/push.git-create' => 'true',
599                'dgit-distro.debian/push.git-check' => 'ssh-cmd',
600  'dgit-distro.debian.archive-query-url', 'https://api.ftp-master.debian.org/',
601 # 'dgit-distro.debian.archive-query-tls-key',
602 #    '/etc/ssl/certs/%HOST%.pem:/etc/dgit/%HOST%.pem',
603 # ^ this does not work because curl is broken nowadays
604 # Fixing #790093 properly will involve providing providing the key
605 # in some pacagke and maybe updating these paths.
606 #
607 # 'dgit-distro.debian.archive-query-tls-curl-args',
608 #   '--ca-path=/etc/ssl/ca-debian',
609 # ^ this is a workaround but works (only) on DSA-administered machines
610                'dgit-distro.debian.git-url' => 'https://git.dgit.debian.org',
611                'dgit-distro.debian.git-url-suffix' => '',
612                'dgit-distro.debian.upload-host' => 'ftp-master', # for dput
613                'dgit-distro.debian.mirror' => 'http://ftp.debian.org/debian/',
614  'dgit-distro.debian-security.archive-query' => 'aptget:',
615  'dgit-distro.debian-security.mirror' => 'http://security.debian.org/debian-security/',
616  'dgit-distro.debian-security.aptget-suite-map' => 's#-security$#/updates#',
617  'dgit-distro.debian-security.aptget-suite-rmap' => 's#$#-security#',
618  'dgit-distro.debian-security.nominal-distro' => 'debian',
619  'dgit-distro.debian.backports-quirk' => '(squeeze)-backports*',
620  'dgit-distro.debian-backports.mirror' => 'http://backports.debian.org/debian-backports/',
621                'dgit-distro.ubuntu.git-check' => 'false',
622  'dgit-distro.ubuntu.mirror' => 'http://archive.ubuntu.com/ubuntu',
623                'dgit-distro.test-dummy.ssh' => "$td/ssh",
624                'dgit-distro.test-dummy.username' => "alice",
625                'dgit-distro.test-dummy.git-check' => "ssh-cmd",
626                'dgit-distro.test-dummy.git-create' => "ssh-cmd",
627                'dgit-distro.test-dummy.git-url' => "$td/git",
628                'dgit-distro.test-dummy.git-host' => "git",
629                'dgit-distro.test-dummy.git-path' => "$td/git",
630                'dgit-distro.test-dummy.archive-query' => "dummycatapi:",
631                'dgit-distro.test-dummy.archive-query-url' => "file://$td/aq/",
632                'dgit-distro.test-dummy.mirror' => "file://$td/mirror/",
633                'dgit-distro.test-dummy.upload-host' => 'test-dummy',
634                );
635
636 our %gitcfgs;
637 our @gitcfgsources = qw(cmdline local global system);
638
639 sub git_slurp_config () {
640     # This algoritm is a bit subtle, but this is needed so that for
641     # options which we want to be single-valued, we allow the
642     # different config sources to override properly.  See #835858.
643     foreach my $src (@gitcfgsources) {
644         next if $src eq 'cmdline';
645         # we do this ourselves since git doesn't handle it
646
647         $gitcfgs{$src} = git_slurp_config_src $src;
648     }
649 }
650
651 sub git_get_config ($) {
652     my ($c) = @_;
653     foreach my $src (@gitcfgsources) {
654         my $l = $gitcfgs{$src}{$c};
655         confess "internal error ($l $c)" if $l && !ref $l;
656         printdebug"C $c ".(defined $l ?
657                            join " ", map { messagequote "'$_'" } @$l :
658                            "undef")."\n"
659             if $debuglevel >= 4;
660         $l or next;
661         @$l==1 or badcfg "multiple values for $c".
662             " (in $src git config)" if @$l > 1;
663         return $l->[0];
664     }
665     return undef;
666 }
667
668 sub cfg {
669     foreach my $c (@_) {
670         return undef if $c =~ /RETURN-UNDEF/;
671         printdebug "C? $c\n" if $debuglevel >= 5;
672         my $v = git_get_config($c);
673         return $v if defined $v;
674         my $dv = $defcfg{$c};
675         if (defined $dv) {
676             printdebug "CD $c $dv\n" if $debuglevel >= 4;
677             return $dv;
678         }
679     }
680     badcfg "need value for one of: @_\n".
681         "$us: distro or suite appears not to be (properly) supported";
682 }
683
684 sub no_local_git_cfg () {
685     # needs to be called from pre_*
686     @gitcfgsources = grep { $_ ne 'local' } @gitcfgsources;
687 }
688
689 sub access_basedistro__noalias () {
690     if (defined $idistro) {
691         return $idistro;
692     } else {    
693         my $def = cfg("dgit-suite.$isuite.distro", 'RETURN-UNDEF');
694         return $def if defined $def;
695         foreach my $src (@gitcfgsources, 'internal') {
696             my $kl = $src eq 'internal' ? \%defcfg : $gitcfgs{$src};
697             next unless $kl;
698             foreach my $k (keys %$kl) {
699                 next unless $k =~ m#^dgit-suite\.(.*)\.distro$#;
700                 my $dpat = $1;
701                 next unless match_glob $dpat, $isuite;
702                 return $kl->{$k};
703             }
704         }
705         return cfg("dgit.default.distro");
706     }
707 }
708
709 sub access_basedistro () {
710     my $noalias = access_basedistro__noalias();
711     my $canon = cfg("dgit-distro.$noalias.alias-canon",'RETURN-UNDEF');
712     return $canon // $noalias;
713 }
714
715 sub access_nomdistro () {
716     my $base = access_basedistro();
717     my $r = cfg("dgit-distro.$base.nominal-distro",'RETURN-UNDEF') // $base;
718     $r =~ m/^$distro_re$/ or badcfg
719  "bad syntax for (nominal) distro \`$r' (does not match /^$distro_re$/)";
720     return $r;
721 }
722
723 sub access_quirk () {
724     # returns (quirk name, distro to use instead or undef, quirk-specific info)
725     my $basedistro = access_basedistro();
726     my $backports_quirk = cfg("dgit-distro.$basedistro.backports-quirk",
727                               'RETURN-UNDEF');
728     if (defined $backports_quirk) {
729         my $re = $backports_quirk;
730         $re =~ s/[^-0-9a-z_\%*()]/\\$&/ig;
731         $re =~ s/\*/.*/g;
732         $re =~ s/\%/([-0-9a-z_]+)/
733             or $re =~ m/[()]/ or badcfg "backports-quirk needs \% or ( )";
734         if ($isuite =~ m/^$re$/) {
735             return ('backports',"$basedistro-backports",$1);
736         }
737     }
738     return ('none',undef);
739 }
740
741 our $access_forpush;
742
743 sub parse_cfg_bool ($$$) {
744     my ($what,$def,$v) = @_;
745     $v //= $def;
746     return
747         $v =~ m/^[ty1]/ ? 1 :
748         $v =~ m/^[fn0]/ ? 0 :
749         badcfg "$what needs t (true, y, 1) or f (false, n, 0) not \`$v'";
750 }       
751
752 sub access_forpush_config () {
753     my $d = access_basedistro();
754
755     return 1 if
756         $new_package &&
757         parse_cfg_bool('new-private-pushers', 0,
758                        cfg("dgit-distro.$d.new-private-pushers",
759                            'RETURN-UNDEF'));
760
761     my $v = cfg("dgit-distro.$d.readonly", 'RETURN-UNDEF');
762     $v //= 'a';
763     return
764         $v =~ m/^[ty1]/ ? 0 : # force readonly,    forpush = 0
765         $v =~ m/^[fn0]/ ? 1 : # force nonreadonly, forpush = 1
766         $v =~ m/^[a]/  ? '' : # auto,              forpush = ''
767         badcfg "readonly needs t (true, y, 1) or f (false, n, 0) or a (auto)";
768 }
769
770 sub access_forpush () {
771     $access_forpush //= access_forpush_config();
772     return $access_forpush;
773 }
774
775 sub pushing () {
776     die "$access_forpush ?" if ($access_forpush // 1) ne 1;
777     badcfg "pushing but distro is configured readonly"
778         if access_forpush_config() eq '0';
779     $access_forpush = 1;
780     $supplementary_message = <<'END' unless $we_are_responder;
781 Push failed, before we got started.
782 You can retry the push, after fixing the problem, if you like.
783 END
784     parseopts_late_defaults();
785 }
786
787 sub notpushing () {
788     parseopts_late_defaults();
789 }
790
791 sub supplementary_message ($) {
792     my ($msg) = @_;
793     if (!$we_are_responder) {
794         $supplementary_message = $msg;
795         return;
796     } elsif ($protovsn >= 3) {
797         responder_send_command "supplementary-message ".length($msg)
798             or die $!;
799         print PO $msg or die $!;
800     }
801 }
802
803 sub access_distros () {
804     # Returns list of distros to try, in order
805     #
806     # We want to try:
807     #    0. `instead of' distro name(s) we have been pointed to
808     #    1. the access_quirk distro, if any
809     #    2a. the user's specified distro, or failing that  } basedistro
810     #    2b. the distro calculated from the suite          }
811     my @l = access_basedistro();
812
813     my (undef,$quirkdistro) = access_quirk();
814     unshift @l, $quirkdistro;
815     unshift @l, $instead_distro;
816     @l = grep { defined } @l;
817
818     push @l, access_nomdistro();
819
820     if (access_forpush()) {
821         @l = map { ("$_/push", $_) } @l;
822     }
823     @l;
824 }
825
826 sub access_cfg_cfgs (@) {
827     my (@keys) = @_;
828     my @cfgs;
829     # The nesting of these loops determines the search order.  We put
830     # the key loop on the outside so that we search all the distros
831     # for each key, before going on to the next key.  That means that
832     # if access_cfg is called with a more specific, and then a less
833     # specific, key, an earlier distro can override the less specific
834     # without necessarily overriding any more specific keys.  (If the
835     # distro wants to override the more specific keys it can simply do
836     # so; whereas if we did the loop the other way around, it would be
837     # impossible to for an earlier distro to override a less specific
838     # key but not the more specific ones without restating the unknown
839     # values of the more specific keys.
840     my @realkeys;
841     my @rundef;
842     # We have to deal with RETURN-UNDEF specially, so that we don't
843     # terminate the search prematurely.
844     foreach (@keys) {
845         if (m/RETURN-UNDEF/) { push @rundef, $_; last; }
846         push @realkeys, $_
847     }
848     foreach my $d (access_distros()) {
849         push @cfgs, map { "dgit-distro.$d.$_" } @realkeys;
850     }
851     push @cfgs, map { "dgit.default.$_" } @realkeys;
852     push @cfgs, @rundef;
853     return @cfgs;
854 }
855
856 sub access_cfg (@) {
857     my (@keys) = @_;
858     my (@cfgs) = access_cfg_cfgs(@keys);
859     my $value = cfg(@cfgs);
860     return $value;
861 }
862
863 sub access_cfg_bool ($$) {
864     my ($def, @keys) = @_;
865     parse_cfg_bool($keys[0], $def, access_cfg(@keys, 'RETURN-UNDEF'));
866 }
867
868 sub string_to_ssh ($) {
869     my ($spec) = @_;
870     if ($spec =~ m/\s/) {
871         return qw(sh -ec), 'exec '.$spec.' "$@"', 'x';
872     } else {
873         return ($spec);
874     }
875 }
876
877 sub access_cfg_ssh () {
878     my $gitssh = access_cfg('ssh', 'RETURN-UNDEF');
879     if (!defined $gitssh) {
880         return @ssh;
881     } else {
882         return string_to_ssh $gitssh;
883     }
884 }
885
886 sub access_runeinfo ($) {
887     my ($info) = @_;
888     return ": dgit ".access_basedistro()." $info ;";
889 }
890
891 sub access_someuserhost ($) {
892     my ($some) = @_;
893     my $user = access_cfg("$some-user-force", 'RETURN-UNDEF');
894     defined($user) && length($user) or
895         $user = access_cfg("$some-user",'username');
896     my $host = access_cfg("$some-host");
897     return length($user) ? "$user\@$host" : $host;
898 }
899
900 sub access_gituserhost () {
901     return access_someuserhost('git');
902 }
903
904 sub access_giturl (;$) {
905     my ($optional) = @_;
906     my $url = access_cfg('git-url','RETURN-UNDEF');
907     my $suffix;
908     if (!length $url) {
909         my $proto = access_cfg('git-proto', 'RETURN-UNDEF');
910         return undef unless defined $proto;
911         $url =
912             $proto.
913             access_gituserhost().
914             access_cfg('git-path');
915     } else {
916         $suffix = access_cfg('git-url-suffix','RETURN-UNDEF');
917     }
918     $suffix //= '.git';
919     return "$url/$package$suffix";
920 }              
921
922 sub parsecontrolfh ($$;$) {
923     my ($fh, $desc, $allowsigned) = @_;
924     our $dpkgcontrolhash_noissigned;
925     my $c;
926     for (;;) {
927         my %opts = ('name' => $desc);
928         $opts{allow_pgp}= $allowsigned || !$dpkgcontrolhash_noissigned;
929         $c = Dpkg::Control::Hash->new(%opts);
930         $c->parse($fh,$desc) or die "parsing of $desc failed";
931         last if $allowsigned;
932         last if $dpkgcontrolhash_noissigned;
933         my $issigned= $c->get_option('is_pgp_signed');
934         if (!defined $issigned) {
935             $dpkgcontrolhash_noissigned= 1;
936             seek $fh, 0,0 or die "seek $desc: $!";
937         } elsif ($issigned) {
938             fail "control file $desc is (already) PGP-signed. ".
939                 " Note that dgit push needs to modify the .dsc and then".
940                 " do the signature itself";
941         } else {
942             last;
943         }
944     }
945     return $c;
946 }
947
948 sub parsecontrol {
949     my ($file, $desc, $allowsigned) = @_;
950     my $fh = new IO::Handle;
951     open $fh, '<', $file or die "$file: $!";
952     my $c = parsecontrolfh($fh,$desc,$allowsigned);
953     $fh->error and die $!;
954     close $fh;
955     return $c;
956 }
957
958 sub getfield ($$) {
959     my ($dctrl,$field) = @_;
960     my $v = $dctrl->{$field};
961     return $v if defined $v;
962     fail "missing field $field in ".$dctrl->get_option('name');
963 }
964
965 sub parsechangelog {
966     my $c = Dpkg::Control::Hash->new(name => 'parsed changelog');
967     my $p = new IO::Handle;
968     my @cmd = (qw(dpkg-parsechangelog), @_);
969     open $p, '-|', @cmd or die $!;
970     $c->parse($p);
971     $?=0; $!=0; close $p or failedcmd @cmd;
972     return $c;
973 }
974
975 sub commit_getclogp ($) {
976     # Returns the parsed changelog hashref for a particular commit
977     my ($objid) = @_;
978     our %commit_getclogp_memo;
979     my $memo = $commit_getclogp_memo{$objid};
980     return $memo if $memo;
981     mkpath '.git/dgit';
982     my $mclog = ".git/dgit/clog-$objid";
983     runcmd shell_cmd "exec >$mclog", @git, qw(cat-file blob),
984         "$objid:debian/changelog";
985     $commit_getclogp_memo{$objid} = parsechangelog("-l$mclog");
986 }
987
988 sub parse_dscdata () {
989     my $dscfh = new IO::File \$dscdata, '<' or die $!;
990     printdebug Dumper($dscdata) if $debuglevel>1;
991     $dsc = parsecontrolfh($dscfh,$dscurl,1);
992     printdebug Dumper($dsc) if $debuglevel>1;
993 }
994
995 our %rmad;
996
997 sub archive_query ($;@) {
998     my ($method) = shift @_;
999     fail "this operation does not support multiple comma-separated suites"
1000         if $isuite =~ m/,/;
1001     my $query = access_cfg('archive-query','RETURN-UNDEF');
1002     $query =~ s/^(\w+):// or badcfg "invalid archive-query method \`$query'";
1003     my $proto = $1;
1004     my $data = $'; #';
1005     { no strict qw(refs); &{"${method}_${proto}"}($proto,$data,@_); }
1006 }
1007
1008 sub archive_query_prepend_mirror {
1009     my $m = access_cfg('mirror');
1010     return map { [ $_->[0], $m.$_->[1], @$_[2..$#$_] ] } @_;
1011 }
1012
1013 sub pool_dsc_subpath ($$) {
1014     my ($vsn,$component) = @_; # $package is implict arg
1015     my $prefix = substr($package, 0, $package =~ m/^l/ ? 4 : 1);
1016     return "/pool/$component/$prefix/$package/".dscfn($vsn);
1017 }
1018
1019 sub cfg_apply_map ($$$) {
1020     my ($varref, $what, $mapspec) = @_;
1021     return unless $mapspec;
1022
1023     printdebug "config $what EVAL{ $mapspec; }\n";
1024     $_ = $$varref;
1025     eval "package Dgit::Config; $mapspec;";
1026     die $@ if $@;
1027     $$varref = $_;
1028 }
1029
1030 #---------- `ftpmasterapi' archive query method (nascent) ----------
1031
1032 sub archive_api_query_cmd ($) {
1033     my ($subpath) = @_;
1034     my @cmd = (@curl, qw(-sS));
1035     my $url = access_cfg('archive-query-url');
1036     if ($url =~ m#^https://([-.0-9a-z]+)/#) {
1037         my $host = $1;
1038         my $keys = access_cfg('archive-query-tls-key','RETURN-UNDEF') //'';
1039         foreach my $key (split /\:/, $keys) {
1040             $key =~ s/\%HOST\%/$host/g;
1041             if (!stat $key) {
1042                 fail "for $url: stat $key: $!" unless $!==ENOENT;
1043                 next;
1044             }
1045             fail "config requested specific TLS key but do not know".
1046                 " how to get curl to use exactly that EE key ($key)";
1047 #           push @cmd, "--cacert", $key, "--capath", "/dev/enoent";
1048 #           # Sadly the above line does not work because of changes
1049 #           # to gnutls.   The real fix for #790093 may involve
1050 #           # new curl options.
1051             last;
1052         }
1053         # Fixing #790093 properly will involve providing a value
1054         # for this on clients.
1055         my $kargs = access_cfg('archive-query-tls-curl-ca-args','RETURN-UNDEF');
1056         push @cmd, split / /, $kargs if defined $kargs;
1057     }
1058     push @cmd, $url.$subpath;
1059     return @cmd;
1060 }
1061
1062 sub api_query ($$;$) {
1063     use JSON;
1064     my ($data, $subpath, $ok404) = @_;
1065     badcfg "ftpmasterapi archive query method takes no data part"
1066         if length $data;
1067     my @cmd = archive_api_query_cmd($subpath);
1068     my $url = $cmd[$#cmd];
1069     push @cmd, qw(-w %{http_code});
1070     my $json = cmdoutput @cmd;
1071     unless ($json =~ s/\d+\d+\d$//) {
1072         failedcmd_report_cmd undef, @cmd;
1073         fail "curl failed to print 3-digit HTTP code";
1074     }
1075     my $code = $&;
1076     return undef if $code eq '404' && $ok404;
1077     fail "fetch of $url gave HTTP code $code"
1078         unless $url =~ m#^file://# or $code =~ m/^2/;
1079     return decode_json($json);
1080 }
1081
1082 sub canonicalise_suite_ftpmasterapi {
1083     my ($proto,$data) = @_;
1084     my $suites = api_query($data, 'suites');
1085     my @matched;
1086     foreach my $entry (@$suites) {
1087         next unless grep { 
1088             my $v = $entry->{$_};
1089             defined $v && $v eq $isuite;
1090         } qw(codename name);
1091         push @matched, $entry;
1092     }
1093     fail "unknown suite $isuite" unless @matched;
1094     my $cn;
1095     eval {
1096         @matched==1 or die "multiple matches for suite $isuite\n";
1097         $cn = "$matched[0]{codename}";
1098         defined $cn or die "suite $isuite info has no codename\n";
1099         $cn =~ m/^$suite_re$/ or die "suite $isuite maps to bad codename\n";
1100     };
1101     die "bad ftpmaster api response: $@\n".Dumper(\@matched)
1102         if length $@;
1103     return $cn;
1104 }
1105
1106 sub archive_query_ftpmasterapi {
1107     my ($proto,$data) = @_;
1108     my $info = api_query($data, "dsc_in_suite/$isuite/$package");
1109     my @rows;
1110     my $digester = Digest::SHA->new(256);
1111     foreach my $entry (@$info) {
1112         eval {
1113             my $vsn = "$entry->{version}";
1114             my ($ok,$msg) = version_check $vsn;
1115             die "bad version: $msg\n" unless $ok;
1116             my $component = "$entry->{component}";
1117             $component =~ m/^$component_re$/ or die "bad component";
1118             my $filename = "$entry->{filename}";
1119             $filename && $filename !~ m#[^-+:._~0-9a-zA-Z/]|^[/.]|/[/.]#
1120                 or die "bad filename";
1121             my $sha256sum = "$entry->{sha256sum}";
1122             $sha256sum =~ m/^[0-9a-f]+$/ or die "bad sha256sum";
1123             push @rows, [ $vsn, "/pool/$component/$filename",
1124                           $digester, $sha256sum ];
1125         };
1126         die "bad ftpmaster api response: $@\n".Dumper($entry)
1127             if length $@;
1128     }
1129     @rows = sort { -version_compare($a->[0],$b->[0]) } @rows;
1130     return archive_query_prepend_mirror @rows;
1131 }
1132
1133 sub file_in_archive_ftpmasterapi {
1134     my ($proto,$data,$filename) = @_;
1135     my $pat = $filename;
1136     $pat =~ s/_/\\_/g;
1137     $pat = "%/$pat";
1138     $pat =~ s#[^-+_.0-9a-z/]# sprintf '%%%02x', ord $& #ge;
1139     my $info = api_query($data, "file_in_archive/$pat", 1);
1140 }
1141
1142 #---------- `aptget' archive query method ----------
1143
1144 our $aptget_base;
1145 our $aptget_releasefile;
1146 our $aptget_configpath;
1147
1148 sub aptget_aptget   () { return @aptget,   qw(-c), $aptget_configpath; }
1149 sub aptget_aptcache () { return @aptcache, qw(-c), $aptget_configpath; }
1150
1151 sub aptget_cache_clean {
1152     runcmd_ordryrun_local qw(sh -ec),
1153         'cd "$1"; find -atime +30 -type f -print0 | xargs -0r rm --',
1154         'x', $aptget_base;
1155 }
1156
1157 sub aptget_lock_acquire () {
1158     my $lockfile = "$aptget_base/lock";
1159     open APTGET_LOCK, '>', $lockfile or die "open $lockfile: $!";
1160     flock APTGET_LOCK, LOCK_EX or die "lock $lockfile: $!";
1161 }
1162
1163 sub aptget_prep ($) {
1164     my ($data) = @_;
1165     return if defined $aptget_base;
1166
1167     badcfg "aptget archive query method takes no data part"
1168         if length $data;
1169
1170     my $cache = $ENV{XDG_CACHE_DIR} // "$ENV{HOME}/.cache";
1171
1172     ensuredir $cache;
1173     ensuredir "$cache/dgit";
1174     my $cachekey =
1175         access_cfg('aptget-cachekey','RETURN-UNDEF')
1176         // access_nomdistro();
1177
1178     $aptget_base = "$cache/dgit/aptget";
1179     ensuredir $aptget_base;
1180
1181     my $quoted_base = $aptget_base;
1182     die "$quoted_base contains bad chars, cannot continue"
1183         if $quoted_base =~ m/["\\]/; # apt.conf(5) says no escaping :-/
1184
1185     ensuredir $aptget_base;
1186
1187     aptget_lock_acquire();
1188
1189     aptget_cache_clean();
1190
1191     $aptget_configpath = "$aptget_base/apt.conf#$cachekey";
1192     my $sourceslist = "source.list#$cachekey";
1193
1194     my $aptsuites = $isuite;
1195     cfg_apply_map(\$aptsuites, 'suite map',
1196                   access_cfg('aptget-suite-map', 'RETURN-UNDEF'));
1197
1198     open SRCS, ">", "$aptget_base/$sourceslist" or die $!;
1199     printf SRCS "deb-src %s %s %s\n",
1200         access_cfg('mirror'),
1201         $aptsuites,
1202         access_cfg('aptget-components')
1203         or die $!;
1204
1205     ensuredir "$aptget_base/cache";
1206     ensuredir "$aptget_base/lists";
1207
1208     open CONF, ">", $aptget_configpath or die $!;
1209     print CONF <<END;
1210 Debug::NoLocking "true";
1211 APT::Get::List-Cleanup "false";
1212 #clear APT::Update::Post-Invoke-Success;
1213 Dir::Etc::SourceList "$quoted_base/$sourceslist";
1214 Dir::State::Lists "$quoted_base/lists";
1215 Dir::Etc::preferences "$quoted_base/preferences";
1216 Dir::Cache::srcpkgcache "$quoted_base/cache/srcs#$cachekey";
1217 Dir::Cache::pkgcache "$quoted_base/cache/pkgs#$cachekey";
1218 END
1219
1220     foreach my $key (qw(
1221                         Dir::Cache
1222                         Dir::State
1223                         Dir::Cache::Archives
1224                         Dir::Etc::SourceParts
1225                         Dir::Etc::preferencesparts
1226                       )) {
1227         ensuredir "$aptget_base/$key";
1228         print CONF "$key \"$quoted_base/$key\";\n" or die $!;
1229     };
1230
1231     my $oldatime = (time // die $!) - 1;
1232     foreach my $oldlist (<$aptget_base/lists/*Release>) {
1233         next unless stat_exists $oldlist;
1234         my ($mtime) = (stat _)[9];
1235         utime $oldatime, $mtime, $oldlist or die "$oldlist $!";
1236     }
1237
1238     runcmd_ordryrun_local aptget_aptget(), qw(update);
1239
1240     my @releasefiles;
1241     foreach my $oldlist (<$aptget_base/lists/*Release>) {
1242         next unless stat_exists $oldlist;
1243         my ($atime) = (stat _)[8];
1244         next if $atime == $oldatime;
1245         push @releasefiles, $oldlist;
1246     }
1247     my @inreleasefiles = grep { m#/InRelease$# } @releasefiles;
1248     @releasefiles = @inreleasefiles if @inreleasefiles;
1249     die "apt updated wrong number of Release files (@releasefiles), erk"
1250         unless @releasefiles == 1;
1251
1252     ($aptget_releasefile) = @releasefiles;
1253 }
1254
1255 sub canonicalise_suite_aptget {
1256     my ($proto,$data) = @_;
1257     aptget_prep($data);
1258
1259     my $release = parsecontrol $aptget_releasefile, "Release file", 1;
1260
1261     foreach my $name (qw(Codename Suite)) {
1262         my $val = $release->{$name};
1263         if (defined $val) {
1264             printdebug "release file $name: $val\n";
1265             $val =~ m/^$suite_re$/o or fail
1266  "Release file ($aptget_releasefile) specifies intolerable $name";
1267             cfg_apply_map(\$val, 'suite rmap',
1268                           access_cfg('aptget-suite-rmap', 'RETURN-UNDEF'));
1269             return $val
1270         }
1271     }
1272     return $isuite;
1273 }
1274
1275 sub archive_query_aptget {
1276     my ($proto,$data) = @_;
1277     aptget_prep($data);
1278
1279     ensuredir "$aptget_base/source";
1280     foreach my $old (<$aptget_base/source/*.dsc>) {
1281         unlink $old or die "$old: $!";
1282     }
1283
1284     my $showsrc = cmdoutput aptget_aptcache(), qw(showsrc), $package;
1285     return () unless $showsrc =~ m/^package:\s*\Q$package\E\s*$/mi;
1286     # avoids apt-get source failing with ambiguous error code
1287
1288     runcmd_ordryrun_local
1289         shell_cmd 'cd "$1"/source; shift', $aptget_base,
1290         aptget_aptget(), qw(--download-only --only-source source), $package;
1291
1292     my @dscs = <$aptget_base/source/*.dsc>;
1293     fail "apt-get source did not produce a .dsc" unless @dscs;
1294     fail "apt-get source produced several .dscs (@dscs)" unless @dscs==1;
1295
1296     my $pre_dsc = parsecontrol $dscs[0], $dscs[0], 1;
1297
1298     use URI::Escape;
1299     my $uri = "file://". uri_escape $dscs[0];
1300     $uri =~ s{\%2f}{/}gi;
1301     return [ (getfield $pre_dsc, 'Version'), $uri ];
1302 }
1303
1304 sub file_in_archive_aptget () { return undef; }
1305
1306 #---------- `dummyapicat' archive query method ----------
1307
1308 sub archive_query_dummycatapi { archive_query_ftpmasterapi @_; }
1309 sub canonicalise_suite_dummycatapi { canonicalise_suite_ftpmasterapi @_; }
1310
1311 sub file_in_archive_dummycatapi ($$$) {
1312     my ($proto,$data,$filename) = @_;
1313     my $mirror = access_cfg('mirror');
1314     $mirror =~ s#^file://#/# or die "$mirror ?";
1315     my @out;
1316     my @cmd = (qw(sh -ec), '
1317             cd "$1"
1318             find -name "$2" -print0 |
1319             xargs -0r sha256sum
1320         ', qw(x), $mirror, $filename);
1321     debugcmd "-|", @cmd;
1322     open FIA, "-|", @cmd or die $!;
1323     while (<FIA>) {
1324         chomp or die;
1325         printdebug "| $_\n";
1326         m/^(\w+)  (\S+)$/ or die "$_ ?";
1327         push @out, { sha256sum => $1, filename => $2 };
1328     }
1329     close FIA or die failedcmd @cmd;
1330     return \@out;
1331 }
1332
1333 #---------- `madison' archive query method ----------
1334
1335 sub archive_query_madison {
1336     return archive_query_prepend_mirror
1337         map { [ @$_[0..1] ] } madison_get_parse(@_);
1338 }
1339
1340 sub madison_get_parse {
1341     my ($proto,$data) = @_;
1342     die unless $proto eq 'madison';
1343     if (!length $data) {
1344         $data= access_cfg('madison-distro','RETURN-UNDEF');
1345         $data //= access_basedistro();
1346     }
1347     $rmad{$proto,$data,$package} ||= cmdoutput
1348         qw(rmadison -asource),"-s$isuite","-u$data",$package;
1349     my $rmad = $rmad{$proto,$data,$package};
1350
1351     my @out;
1352     foreach my $l (split /\n/, $rmad) {
1353         $l =~ m{^ \s*( [^ \t|]+ )\s* \|
1354                   \s*( [^ \t|]+ )\s* \|
1355                   \s*( [^ \t|/]+ )(?:/([^ \t|/]+))? \s* \|
1356                   \s*( [^ \t|]+ )\s* }x or die "$rmad ?";
1357         $1 eq $package or die "$rmad $package ?";
1358         my $vsn = $2;
1359         my $newsuite = $3;
1360         my $component;
1361         if (defined $4) {
1362             $component = $4;
1363         } else {
1364             $component = access_cfg('archive-query-default-component');
1365         }
1366         $5 eq 'source' or die "$rmad ?";
1367         push @out, [$vsn,pool_dsc_subpath($vsn,$component),$newsuite];
1368     }
1369     return sort { -version_compare($a->[0],$b->[0]); } @out;
1370 }
1371
1372 sub canonicalise_suite_madison {
1373     # madison canonicalises for us
1374     my @r = madison_get_parse(@_);
1375     @r or fail
1376         "unable to canonicalise suite using package $package".
1377         " which does not appear to exist in suite $isuite;".
1378         " --existing-package may help";
1379     return $r[0][2];
1380 }
1381
1382 sub file_in_archive_madison { return undef; }
1383
1384 #---------- `sshpsql' archive query method ----------
1385
1386 sub sshpsql ($$$) {
1387     my ($data,$runeinfo,$sql) = @_;
1388     if (!length $data) {
1389         $data= access_someuserhost('sshpsql').':'.
1390             access_cfg('sshpsql-dbname');
1391     }
1392     $data =~ m/:/ or badcfg "invalid sshpsql method string \`$data'";
1393     my ($userhost,$dbname) = ($`,$'); #';
1394     my @rows;
1395     my @cmd = (access_cfg_ssh, $userhost,
1396                access_runeinfo("ssh-psql $runeinfo").
1397                " export LC_MESSAGES=C; export LC_CTYPE=C;".
1398                " ".shellquote qw(psql -A), $dbname, qw(-c), $sql);
1399     debugcmd "|",@cmd;
1400     open P, "-|", @cmd or die $!;
1401     while (<P>) {
1402         chomp or die;
1403         printdebug(">|$_|\n");
1404         push @rows, $_;
1405     }
1406     $!=0; $?=0; close P or failedcmd @cmd;
1407     @rows or die;
1408     my $nrows = pop @rows;
1409     $nrows =~ s/^\((\d+) rows?\)$/$1/ or die "$nrows ?";
1410     @rows == $nrows+1 or die "$nrows ".(scalar @rows)." ?";
1411     @rows = map { [ split /\|/, $_ ] } @rows;
1412     my $ncols = scalar @{ shift @rows };
1413     die if grep { scalar @$_ != $ncols } @rows;
1414     return @rows;
1415 }
1416
1417 sub sql_injection_check {
1418     foreach (@_) { die "$_ $& ?" if m{[^-+=:_.,/0-9a-zA-Z]}; }
1419 }
1420
1421 sub archive_query_sshpsql ($$) {
1422     my ($proto,$data) = @_;
1423     sql_injection_check $isuite, $package;
1424     my @rows = sshpsql($data, "archive-query $isuite $package", <<END);
1425         SELECT source.version, component.name, files.filename, files.sha256sum
1426           FROM source
1427           JOIN src_associations ON source.id = src_associations.source
1428           JOIN suite ON suite.id = src_associations.suite
1429           JOIN dsc_files ON dsc_files.source = source.id
1430           JOIN files_archive_map ON files_archive_map.file_id = dsc_files.file
1431           JOIN component ON component.id = files_archive_map.component_id
1432           JOIN files ON files.id = dsc_files.file
1433          WHERE ( suite.suite_name='$isuite' OR suite.codename='$isuite' )
1434            AND source.source='$package'
1435            AND files.filename LIKE '%.dsc';
1436 END
1437     @rows = sort { -version_compare($a->[0],$b->[0]) } @rows;
1438     my $digester = Digest::SHA->new(256);
1439     @rows = map {
1440         my ($vsn,$component,$filename,$sha256sum) = @$_;
1441         [ $vsn, "/pool/$component/$filename",$digester,$sha256sum ];
1442     } @rows;
1443     return archive_query_prepend_mirror @rows;
1444 }
1445
1446 sub canonicalise_suite_sshpsql ($$) {
1447     my ($proto,$data) = @_;
1448     sql_injection_check $isuite;
1449     my @rows = sshpsql($data, "canonicalise-suite $isuite", <<END);
1450         SELECT suite.codename
1451           FROM suite where suite_name='$isuite' or codename='$isuite';
1452 END
1453     @rows = map { $_->[0] } @rows;
1454     fail "unknown suite $isuite" unless @rows;
1455     die "ambiguous $isuite: @rows ?" if @rows>1;
1456     return $rows[0];
1457 }
1458
1459 sub file_in_archive_sshpsql ($$$) { return undef; }
1460
1461 #---------- `dummycat' archive query method ----------
1462
1463 sub canonicalise_suite_dummycat ($$) {
1464     my ($proto,$data) = @_;
1465     my $dpath = "$data/suite.$isuite";
1466     if (!open C, "<", $dpath) {
1467         $!==ENOENT or die "$dpath: $!";
1468         printdebug "dummycat canonicalise_suite $isuite $dpath ENOENT\n";
1469         return $isuite;
1470     }
1471     $!=0; $_ = <C>;
1472     chomp or die "$dpath: $!";
1473     close C;
1474     printdebug "dummycat canonicalise_suite $isuite $dpath = $_\n";
1475     return $_;
1476 }
1477
1478 sub archive_query_dummycat ($$) {
1479     my ($proto,$data) = @_;
1480     canonicalise_suite();
1481     my $dpath = "$data/package.$csuite.$package";
1482     if (!open C, "<", $dpath) {
1483         $!==ENOENT or die "$dpath: $!";
1484         printdebug "dummycat query $csuite $package $dpath ENOENT\n";
1485         return ();
1486     }
1487     my @rows;
1488     while (<C>) {
1489         next if m/^\#/;
1490         next unless m/\S/;
1491         die unless chomp;
1492         printdebug "dummycat query $csuite $package $dpath | $_\n";
1493         my @row = split /\s+/, $_;
1494         @row==2 or die "$dpath: $_ ?";
1495         push @rows, \@row;
1496     }
1497     C->error and die "$dpath: $!";
1498     close C;
1499     return archive_query_prepend_mirror
1500         sort { -version_compare($a->[0],$b->[0]); } @rows;
1501 }
1502
1503 sub file_in_archive_dummycat () { return undef; }
1504
1505 #---------- tag format handling ----------
1506
1507 sub access_cfg_tagformats () {
1508     split /\,/, access_cfg('dgit-tag-format');
1509 }
1510
1511 sub access_cfg_tagformats_can_splitbrain () {
1512     my %y = map { $_ => 1 } access_cfg_tagformats;
1513     foreach my $needtf (qw(new maint)) {
1514         next if $y{$needtf};
1515         return 0;
1516     }
1517     return 1;
1518 }
1519
1520 sub need_tagformat ($$) {
1521     my ($fmt, $why) = @_;
1522     fail "need to use tag format $fmt ($why) but also need".
1523         " to use tag format $tagformat_want->[0] ($tagformat_want->[1])".
1524         " - no way to proceed"
1525         if $tagformat_want && $tagformat_want->[0] ne $fmt;
1526     $tagformat_want = [$fmt, $why, $tagformat_want->[2] // 0];
1527 }
1528
1529 sub select_tagformat () {
1530     # sets $tagformatfn
1531     return if $tagformatfn && !$tagformat_want;
1532     die 'bug' if $tagformatfn && $tagformat_want;
1533     # ... $tagformat_want assigned after previous select_tagformat
1534
1535     my (@supported) = grep { $_ =~ m/^(?:old|new)$/ } access_cfg_tagformats();
1536     printdebug "select_tagformat supported @supported\n";
1537
1538     $tagformat_want //= [ $supported[0], "distro access configuration", 0 ];
1539     printdebug "select_tagformat specified @$tagformat_want\n";
1540
1541     my ($fmt,$why,$override) = @$tagformat_want;
1542
1543     fail "target distro supports tag formats @supported".
1544         " but have to use $fmt ($why)"
1545         unless $override
1546             or grep { $_ eq $fmt } @supported;
1547
1548     $tagformat_want = undef;
1549     $tagformat = $fmt;
1550     $tagformatfn = ${*::}{"debiantag_$fmt"};
1551
1552     fail "trying to use unknown tag format \`$fmt' ($why) !"
1553         unless $tagformatfn;
1554 }
1555
1556 #---------- archive query entrypoints and rest of program ----------
1557
1558 sub canonicalise_suite () {
1559     return if defined $csuite;
1560     fail "cannot operate on $isuite suite" if $isuite eq 'UNRELEASED';
1561     $csuite = archive_query('canonicalise_suite');
1562     if ($isuite ne $csuite) {
1563         progress "canonical suite name for $isuite is $csuite";
1564     } else {
1565         progress "canonical suite name is $csuite";
1566     }
1567 }
1568
1569 sub get_archive_dsc () {
1570     canonicalise_suite();
1571     my @vsns = archive_query('archive_query');
1572     foreach my $vinfo (@vsns) {
1573         my ($vsn,$vsn_dscurl,$digester,$digest) = @$vinfo;
1574         $dscurl = $vsn_dscurl;
1575         $dscdata = url_get($dscurl);
1576         if (!$dscdata) {
1577             $skew_warning_vsn = $vsn if !defined $skew_warning_vsn;
1578             next;
1579         }
1580         if ($digester) {
1581             $digester->reset();
1582             $digester->add($dscdata);
1583             my $got = $digester->hexdigest();
1584             $got eq $digest or
1585                 fail "$dscurl has hash $got but".
1586                     " archive told us to expect $digest";
1587         }
1588         parse_dscdata();
1589         my $fmt = getfield $dsc, 'Format';
1590         $format_ok{$fmt} or forceable_fail [qw(unsupported-source-format)],
1591             "unsupported source format $fmt, sorry";
1592             
1593         $dsc_checked = !!$digester;
1594         printdebug "get_archive_dsc: Version ".(getfield $dsc, 'Version')."\n";
1595         return;
1596     }
1597     $dsc = undef;
1598     printdebug "get_archive_dsc: nothing in archive, returning undef\n";
1599 }
1600
1601 sub check_for_git ();
1602 sub check_for_git () {
1603     # returns 0 or 1
1604     my $how = access_cfg('git-check');
1605     if ($how eq 'ssh-cmd') {
1606         my @cmd =
1607             (access_cfg_ssh, access_gituserhost(),
1608              access_runeinfo("git-check $package").
1609              " set -e; cd ".access_cfg('git-path').";".
1610              " if test -d $package.git; then echo 1; else echo 0; fi");
1611         my $r= cmdoutput @cmd;
1612         if (defined $r and $r =~ m/^divert (\w+)$/) {
1613             my $divert=$1;
1614             my ($usedistro,) = access_distros();
1615             # NB that if we are pushing, $usedistro will be $distro/push
1616             $instead_distro= cfg("dgit-distro.$usedistro.diverts.$divert");
1617             $instead_distro =~ s{^/}{ access_basedistro()."/" }e;
1618             progress "diverting to $divert (using config for $instead_distro)";
1619             return check_for_git();
1620         }
1621         failedcmd @cmd unless defined $r and $r =~ m/^[01]$/;
1622         return $r+0;
1623     } elsif ($how eq 'url') {
1624         my $prefix = access_cfg('git-check-url','git-url');
1625         my $suffix = access_cfg('git-check-suffix','git-suffix',
1626                                 'RETURN-UNDEF') // '.git';
1627         my $url = "$prefix/$package$suffix";
1628         my @cmd = (@curl, qw(-sS -I), $url);
1629         my $result = cmdoutput @cmd;
1630         $result =~ s/^\S+ 200 .*\n\r?\n//;
1631         # curl -sS -I with https_proxy prints
1632         # HTTP/1.0 200 Connection established
1633         $result =~ m/^\S+ (404|200) /s or
1634             fail "unexpected results from git check query - ".
1635                 Dumper($prefix, $result);
1636         my $code = $1;
1637         if ($code eq '404') {
1638             return 0;
1639         } elsif ($code eq '200') {
1640             return 1;
1641         } else {
1642             die;
1643         }
1644     } elsif ($how eq 'true') {
1645         return 1;
1646     } elsif ($how eq 'false') {
1647         return 0;
1648     } else {
1649         badcfg "unknown git-check \`$how'";
1650     }
1651 }
1652
1653 sub create_remote_git_repo () {
1654     my $how = access_cfg('git-create');
1655     if ($how eq 'ssh-cmd') {
1656         runcmd_ordryrun
1657             (access_cfg_ssh, access_gituserhost(),
1658              access_runeinfo("git-create $package").
1659              "set -e; cd ".access_cfg('git-path').";".
1660              " cp -a _template $package.git");
1661     } elsif ($how eq 'true') {
1662         # nothing to do
1663     } else {
1664         badcfg "unknown git-create \`$how'";
1665     }
1666 }
1667
1668 our ($dsc_hash,$lastpush_mergeinput);
1669 our ($dsc_distro, $dsc_hint_tag, $dsc_hint_url);
1670
1671 our $ud = '.git/dgit/unpack';
1672
1673 sub prep_ud (;$) {
1674     my ($d) = @_;
1675     $d //= $ud;
1676     rmtree($d);
1677     mkpath '.git/dgit';
1678     mkdir $d or die $!;
1679 }
1680
1681 sub mktree_in_ud_here () {
1682     workarea_setup $gitcfgs{local};
1683 }
1684
1685 sub git_write_tree () {
1686     my $tree = cmdoutput @git, qw(write-tree);
1687     $tree =~ m/^\w+$/ or die "$tree ?";
1688     return $tree;
1689 }
1690
1691 sub git_add_write_tree () {
1692     runcmd @git, qw(add -Af .);
1693     return git_write_tree();
1694 }
1695
1696 sub remove_stray_gits ($) {
1697     my ($what) = @_;
1698     my @gitscmd = qw(find -name .git -prune -print0);
1699     debugcmd "|",@gitscmd;
1700     open GITS, "-|", @gitscmd or die $!;
1701     {
1702         local $/="\0";
1703         while (<GITS>) {
1704             chomp or die;
1705             print STDERR "$us: warning: removing from $what: ",
1706                 (messagequote $_), "\n";
1707             rmtree $_;
1708         }
1709     }
1710     $!=0; $?=0; close GITS or failedcmd @gitscmd;
1711 }
1712
1713 sub mktree_in_ud_from_only_subdir ($;$) {
1714     my ($what,$raw) = @_;
1715
1716     # changes into the subdir
1717     my (@dirs) = <*/.>;
1718     die "expected one subdir but found @dirs ?" unless @dirs==1;
1719     $dirs[0] =~ m#^([^/]+)/\.$# or die;
1720     my $dir = $1;
1721     changedir $dir;
1722
1723     remove_stray_gits($what);
1724     mktree_in_ud_here();
1725     if (!$raw) {
1726         my ($format, $fopts) = get_source_format();
1727         if (madformat($format)) {
1728             rmtree '.pc';
1729         }
1730     }
1731
1732     my $tree=git_add_write_tree();
1733     return ($tree,$dir);
1734 }
1735
1736 our @files_csum_info_fields = 
1737     (['Checksums-Sha256','Digest::SHA', 'new(256)', 'sha256sum'],
1738      ['Checksums-Sha1',  'Digest::SHA', 'new(1)',   'sha1sum'],
1739      ['Files',           'Digest::MD5', 'new()',    'md5sum']);
1740
1741 sub dsc_files_info () {
1742     foreach my $csumi (@files_csum_info_fields) {
1743         my ($fname, $module, $method) = @$csumi;
1744         my $field = $dsc->{$fname};
1745         next unless defined $field;
1746         eval "use $module; 1;" or die $@;
1747         my @out;
1748         foreach (split /\n/, $field) {
1749             next unless m/\S/;
1750             m/^(\w+) (\d+) (\S+)$/ or
1751                 fail "could not parse .dsc $fname line \`$_'";
1752             my $digester = eval "$module"."->$method;" or die $@;
1753             push @out, {
1754                 Hash => $1,
1755                 Bytes => $2,
1756                 Filename => $3,
1757                 Digester => $digester,
1758             };
1759         }
1760         return @out;
1761     }
1762     fail "missing any supported Checksums-* or Files field in ".
1763         $dsc->get_option('name');
1764 }
1765
1766 sub dsc_files () {
1767     map { $_->{Filename} } dsc_files_info();
1768 }
1769
1770 sub files_compare_inputs (@) {
1771     my $inputs = \@_;
1772     my %record;
1773     my %fchecked;
1774
1775     my $showinputs = sub {
1776         return join "; ", map { $_->get_option('name') } @$inputs;
1777     };
1778
1779     foreach my $in (@$inputs) {
1780         my $expected_files;
1781         my $in_name = $in->get_option('name');
1782
1783         printdebug "files_compare_inputs $in_name\n";
1784
1785         foreach my $csumi (@files_csum_info_fields) {
1786             my ($fname) = @$csumi;
1787             printdebug "files_compare_inputs $in_name $fname\n";
1788
1789             my $field = $in->{$fname};
1790             next unless defined $field;
1791
1792             my @files;
1793             foreach (split /\n/, $field) {
1794                 next unless m/\S/;
1795
1796                 my ($info, $f) = m/^(\w+ \d+) (?:\S+ \S+ )?(\S+)$/ or
1797                     fail "could not parse $in_name $fname line \`$_'";
1798
1799                 printdebug "files_compare_inputs $in_name $fname $f\n";
1800
1801                 push @files, $f;
1802
1803                 my $re = \ $record{$f}{$fname};
1804                 if (defined $$re) {
1805                     $fchecked{$f}{$in_name} = 1;
1806                     $$re eq $info or
1807                         fail "hash or size of $f varies in $fname fields".
1808                         " (between: ".$showinputs->().")";
1809                 } else {
1810                     $$re = $info;
1811                 }
1812             }
1813             @files = sort @files;
1814             $expected_files //= \@files;
1815             "@$expected_files" eq "@files" or
1816                 fail "file list in $in_name varies between hash fields!";
1817         }
1818         $expected_files or
1819             fail "$in_name has no files list field(s)";
1820     }
1821     printdebug "files_compare_inputs ".Dumper(\%fchecked, \%record)
1822         if $debuglevel>=2;
1823
1824     grep { keys %$_ == @$inputs-1 } values %fchecked
1825         or fail "no file appears in all file lists".
1826         " (looked in: ".$showinputs->().")";
1827 }
1828
1829 sub is_orig_file_in_dsc ($$) {
1830     my ($f, $dsc_files_info) = @_;
1831     return 0 if @$dsc_files_info <= 1;
1832     # One file means no origs, and the filename doesn't have a "what
1833     # part of dsc" component.  (Consider versions ending `.orig'.)
1834     return 0 unless $f =~ m/\.$orig_f_tail_re$/o;
1835     return 1;
1836 }
1837
1838 sub is_orig_file_of_vsn ($$) {
1839     my ($f, $upstreamvsn) = @_;
1840     my $base = srcfn $upstreamvsn, '';
1841     return 0 unless $f =~ m/^\Q$base\E\.$orig_f_tail_re$/;
1842     return 1;
1843 }
1844
1845 sub changes_update_origs_from_dsc ($$$$) {
1846     my ($dsc, $changes, $upstreamvsn, $changesfile) = @_;
1847     my %changes_f;
1848     printdebug "checking origs needed ($upstreamvsn)...\n";
1849     $_ = getfield $changes, 'Files';
1850     m/^\w+ \d+ (\S+ \S+) \S+$/m or
1851         fail "cannot find section/priority from .changes Files field";
1852     my $placementinfo = $1;
1853     my %changed;
1854     printdebug "checking origs needed placement '$placementinfo'...\n";
1855     foreach my $l (split /\n/, getfield $dsc, 'Files') {
1856         $l =~ m/\S+$/ or next;
1857         my $file = $&;
1858         printdebug "origs $file | $l\n";
1859         next unless is_orig_file_of_vsn $file, $upstreamvsn;
1860         printdebug "origs $file is_orig\n";
1861         my $have = archive_query('file_in_archive', $file);
1862         if (!defined $have) {
1863             print STDERR <<END;
1864 archive does not support .orig check; hope you used --ch:--sa/-sd if needed
1865 END
1866             return;
1867         }
1868         my $found_same = 0;
1869         my @found_differ;
1870         printdebug "origs $file \$#\$have=$#$have\n";
1871         foreach my $h (@$have) {
1872             my $same = 0;
1873             my @differ;
1874             foreach my $csumi (@files_csum_info_fields) {
1875                 my ($fname, $module, $method, $archivefield) = @$csumi;
1876                 next unless defined $h->{$archivefield};
1877                 $_ = $dsc->{$fname};
1878                 next unless defined;
1879                 m/^(\w+) .* \Q$file\E$/m or
1880                     fail ".dsc $fname missing entry for $file";
1881                 if ($h->{$archivefield} eq $1) {
1882                     $same++;
1883                 } else {
1884                     push @differ,
1885  "$archivefield: $h->{$archivefield} (archive) != $1 (local .dsc)";
1886                 }
1887             }
1888             die "$file ".Dumper($h)." ?!" if $same && @differ;
1889             $found_same++
1890                 if $same;
1891             push @found_differ, "archive $h->{filename}: ".join "; ", @differ
1892                 if @differ;
1893         }
1894         printdebug "origs $file f.same=$found_same".
1895             " #f._differ=$#found_differ\n";
1896         if (@found_differ && !$found_same) {
1897             fail join "\n",
1898                 "archive contains $file with different checksum",
1899                 @found_differ;
1900         }
1901         # Now we edit the changes file to add or remove it
1902         foreach my $csumi (@files_csum_info_fields) {
1903             my ($fname, $module, $method, $archivefield) = @$csumi;
1904             next unless defined $changes->{$fname};
1905             if ($found_same) {
1906                 # in archive, delete from .changes if it's there
1907                 $changed{$file} = "removed" if
1908                     $changes->{$fname} =~ s/^.* \Q$file\E$(?:)\n//m;
1909             } elsif ($changes->{$fname} =~ m/^.* \Q$file\E$(?:)\n/m) {
1910                 # not in archive, but it's here in the .changes
1911             } else {
1912                 my $dsc_data = getfield $dsc, $fname;
1913                 $dsc_data =~ m/^(.* \Q$file\E$)\n/m or die "$dsc_data $file ?";
1914                 my $extra = $1;
1915                 $extra =~ s/ \d+ /$&$placementinfo /
1916                     or die "$fname $extra >$dsc_data< ?"
1917                     if $fname eq 'Files';
1918                 $changes->{$fname} .= "\n". $extra;
1919                 $changed{$file} = "added";
1920             }
1921         }
1922     }
1923     if (%changed) {
1924         foreach my $file (keys %changed) {
1925             progress sprintf
1926                 "edited .changes for archive .orig contents: %s %s",
1927                 $changed{$file}, $file;
1928         }
1929         my $chtmp = "$changesfile.tmp";
1930         $changes->save($chtmp);
1931         if (act_local()) {
1932             rename $chtmp,$changesfile or die "$changesfile $!";
1933         } else {
1934             progress "[new .changes left in $changesfile]";
1935         }
1936     } else {
1937         progress "$changesfile already has appropriate .orig(s) (if any)";
1938     }
1939 }
1940
1941 sub make_commit ($) {
1942     my ($file) = @_;
1943     return cmdoutput @git, qw(hash-object -w -t commit), $file;
1944 }
1945
1946 sub make_commit_text ($) {
1947     my ($text) = @_;
1948     my ($out, $in);
1949     my @cmd = (@git, qw(hash-object -w -t commit --stdin));
1950     debugcmd "|",@cmd;
1951     print Dumper($text) if $debuglevel > 1;
1952     my $child = open2($out, $in, @cmd) or die $!;
1953     my $h;
1954     eval {
1955         print $in $text or die $!;
1956         close $in or die $!;
1957         $h = <$out>;
1958         $h =~ m/^\w+$/ or die;
1959         $h = $&;
1960         printdebug "=> $h\n";
1961     };
1962     close $out;
1963     waitpid $child, 0 == $child or die "$child $!";
1964     $? and failedcmd @cmd;
1965     return $h;
1966 }
1967
1968 sub clogp_authline ($) {
1969     my ($clogp) = @_;
1970     my $author = getfield $clogp, 'Maintainer';
1971     if ($author =~ m/^[^"\@]+\,/) {
1972         # single entry Maintainer field with unquoted comma
1973         $author = ($& =~ y/,//rd).$'; # strip the comma
1974     }
1975     # git wants a single author; any remaining commas in $author
1976     # are by now preceded by @ (or ").  It seems safer to punt on
1977     # "..." for now rather than attempting to dequote or something.
1978     $author =~ s#,.*##ms unless $author =~ m/"/;
1979     my $date = cmdoutput qw(date), '+%s %z', qw(-d), getfield($clogp,'Date');
1980     my $authline = "$author $date";
1981     $authline =~ m/$git_authline_re/o or
1982         fail "unexpected commit author line format \`$authline'".
1983         " (was generated from changelog Maintainer field)";
1984     return ($1,$2,$3) if wantarray;
1985     return $authline;
1986 }
1987
1988 sub vendor_patches_distro ($$) {
1989     my ($checkdistro, $what) = @_;
1990     return unless defined $checkdistro;
1991
1992     my $series = "debian/patches/\L$checkdistro\E.series";
1993     printdebug "checking for vendor-specific $series ($what)\n";
1994
1995     if (!open SERIES, "<", $series) {
1996         die "$series $!" unless $!==ENOENT;
1997         return;
1998     }
1999     while (<SERIES>) {
2000         next unless m/\S/;
2001         next if m/^\s+\#/;
2002
2003         print STDERR <<END;
2004
2005 Unfortunately, this source package uses a feature of dpkg-source where
2006 the same source package unpacks to different source code on different
2007 distros.  dgit cannot safely operate on such packages on affected
2008 distros, because the meaning of source packages is not stable.
2009
2010 Please ask the distro/maintainer to remove the distro-specific series
2011 files and use a different technique (if necessary, uploading actually
2012 different packages, if different distros are supposed to have
2013 different code).
2014
2015 END
2016         fail "Found active distro-specific series file for".
2017             " $checkdistro ($what): $series, cannot continue";
2018     }
2019     die "$series $!" if SERIES->error;
2020     close SERIES;
2021 }
2022
2023 sub check_for_vendor_patches () {
2024     # This dpkg-source feature doesn't seem to be documented anywhere!
2025     # But it can be found in the changelog (reformatted):
2026
2027     #   commit  4fa01b70df1dc4458daee306cfa1f987b69da58c
2028     #   Author: Raphael Hertzog <hertzog@debian.org>
2029     #   Date: Sun  Oct  3  09:36:48  2010 +0200
2030
2031     #   dpkg-source: correctly create .pc/.quilt_series with alternate
2032     #   series files
2033     #   
2034     #   If you have debian/patches/ubuntu.series and you were
2035     #   unpacking the source package on ubuntu, quilt was still
2036     #   directed to debian/patches/series instead of
2037     #   debian/patches/ubuntu.series.
2038     #   
2039     #   debian/changelog                        |    3 +++
2040     #   scripts/Dpkg/Source/Package/V3/quilt.pm |    4 +++-
2041     #   2 files changed, 6 insertions(+), 1 deletion(-)
2042
2043     use Dpkg::Vendor;
2044     vendor_patches_distro($ENV{DEB_VENDOR}, "DEB_VENDOR");
2045     vendor_patches_distro(Dpkg::Vendor::get_current_vendor(),
2046                          "Dpkg::Vendor \`current vendor'");
2047     vendor_patches_distro(access_basedistro(),
2048                           "(base) distro being accessed");
2049     vendor_patches_distro(access_nomdistro(),
2050                           "(nominal) distro being accessed");
2051 }
2052
2053 sub generate_commits_from_dsc () {
2054     # See big comment in fetch_from_archive, below.
2055     # See also README.dsc-import.
2056     prep_ud();
2057     changedir $ud;
2058
2059     my @dfi = dsc_files_info();
2060     foreach my $fi (@dfi) {
2061         my $f = $fi->{Filename};
2062         die "$f ?" if $f =~ m#/|^\.|\.dsc$|\.tmp$#;
2063         my $upper_f = "../../../../$f";
2064
2065         printdebug "considering reusing $f: ";
2066
2067         if (link_ltarget "$upper_f,fetch", $f) {
2068             printdebug "linked (using ...,fetch).\n";
2069         } elsif ((printdebug "($!) "),
2070                  $! != ENOENT) {
2071             fail "accessing ../$f,fetch: $!";
2072         } elsif (link_ltarget $upper_f, $f) {
2073             printdebug "linked.\n";
2074         } elsif ((printdebug "($!) "),
2075                  $! != ENOENT) {
2076             fail "accessing ../$f: $!";
2077         } else {
2078             printdebug "absent.\n";
2079         }
2080
2081         my $refetched;
2082         complete_file_from_dsc('.', $fi, \$refetched)
2083             or next;
2084
2085         printdebug "considering saving $f: ";
2086
2087         if (link $f, $upper_f) {
2088             printdebug "linked.\n";
2089         } elsif ((printdebug "($!) "),
2090                  $! != EEXIST) {
2091             fail "saving ../$f: $!";
2092         } elsif (!$refetched) {
2093             printdebug "no need.\n";
2094         } elsif (link $f, "$upper_f,fetch") {
2095             printdebug "linked (using ...,fetch).\n";
2096         } elsif ((printdebug "($!) "),
2097                  $! != EEXIST) {
2098             fail "saving ../$f,fetch: $!";
2099         } else {
2100             printdebug "cannot.\n";
2101         }
2102     }
2103
2104     # We unpack and record the orig tarballs first, so that we only
2105     # need disk space for one private copy of the unpacked source.
2106     # But we can't make them into commits until we have the metadata
2107     # from the debian/changelog, so we record the tree objects now and
2108     # make them into commits later.
2109     my @tartrees;
2110     my $upstreamv = upstreamversion $dsc->{version};
2111     my $orig_f_base = srcfn $upstreamv, '';
2112
2113     foreach my $fi (@dfi) {
2114         # We actually import, and record as a commit, every tarball
2115         # (unless there is only one file, in which case there seems
2116         # little point.
2117
2118         my $f = $fi->{Filename};
2119         printdebug "import considering $f ";
2120         (printdebug "only one dfi\n"), next if @dfi == 1;
2121         (printdebug "not tar\n"), next unless $f =~ m/\.tar(\.\w+)?$/;
2122         (printdebug "signature\n"), next if $f =~ m/$orig_f_sig_re$/o;
2123         my $compr_ext = $1;
2124
2125         my ($orig_f_part) =
2126             $f =~ m/^\Q$orig_f_base\E\.([^._]+)?\.tar(?:\.\w+)?$/;
2127
2128         printdebug "Y ", (join ' ', map { $_//"(none)" }
2129                           $compr_ext, $orig_f_part
2130                          ), "\n";
2131
2132         my $input = new IO::File $f, '<' or die "$f $!";
2133         my $compr_pid;
2134         my @compr_cmd;
2135
2136         if (defined $compr_ext) {
2137             my $cname =
2138                 Dpkg::Compression::compression_guess_from_filename $f;
2139             fail "Dpkg::Compression cannot handle file $f in source package"
2140                 if defined $compr_ext && !defined $cname;
2141             my $compr_proc =
2142                 new Dpkg::Compression::Process compression => $cname;
2143             @compr_cmd = $compr_proc->get_uncompress_cmdline();
2144             my $compr_fh = new IO::Handle;
2145             my $compr_pid = open $compr_fh, "-|" // die $!;
2146             if (!$compr_pid) {
2147                 open STDIN, "<&", $input or die $!;
2148                 exec @compr_cmd;
2149                 die "dgit (child): exec $compr_cmd[0]: $!\n";
2150             }
2151             $input = $compr_fh;
2152         }
2153
2154         rmtree "_unpack-tar";
2155         mkdir "_unpack-tar" or die $!;
2156         my @tarcmd = qw(tar -x -f -
2157                         --no-same-owner --no-same-permissions
2158                         --no-acls --no-xattrs --no-selinux);
2159         my $tar_pid = fork // die $!;
2160         if (!$tar_pid) {
2161             chdir "_unpack-tar" or die $!;
2162             open STDIN, "<&", $input or die $!;
2163             exec @tarcmd;
2164             die "dgit (child): exec $tarcmd[0]: $!";
2165         }
2166         $!=0; (waitpid $tar_pid, 0) == $tar_pid or die $!;
2167         !$? or failedcmd @tarcmd;
2168
2169         close $input or
2170             (@compr_cmd ? ($?==SIGPIPE || failedcmd @compr_cmd)
2171              : die $!);
2172         # finally, we have the results in "tarball", but maybe
2173         # with the wrong permissions
2174
2175         runcmd qw(chmod -R +rwX _unpack-tar);
2176         changedir "_unpack-tar";
2177         remove_stray_gits($f);
2178         mktree_in_ud_here();
2179         
2180         my ($tree) = git_add_write_tree();
2181         my $tentries = cmdoutput @git, qw(ls-tree -z), $tree;
2182         if ($tentries =~ m/^\d+ tree (\w+)\t[^\000]+\000$/s) {
2183             $tree = $1;
2184             printdebug "one subtree $1\n";
2185         } else {
2186             printdebug "multiple subtrees\n";
2187         }
2188         changedir "..";
2189         rmtree "_unpack-tar";
2190
2191         my $ent = [ $f, $tree ];
2192         push @tartrees, {
2193             Orig => !!$orig_f_part,
2194             Sort => (!$orig_f_part         ? 2 :
2195                      $orig_f_part =~ m/-/g ? 1 :
2196                                              0),
2197             F => $f,
2198             Tree => $tree,
2199         };
2200     }
2201
2202     @tartrees = sort {
2203         # put any without "_" first (spec is not clear whether files
2204         # are always in the usual order).  Tarballs without "_" are
2205         # the main orig or the debian tarball.
2206         $a->{Sort} <=> $b->{Sort} or
2207         $a->{F}    cmp $b->{F}
2208     } @tartrees;
2209
2210     my $any_orig = grep { $_->{Orig} } @tartrees;
2211
2212     my $dscfn = "$package.dsc";
2213
2214     my $treeimporthow = 'package';
2215
2216     open D, ">", $dscfn or die "$dscfn: $!";
2217     print D $dscdata or die "$dscfn: $!";
2218     close D or die "$dscfn: $!";
2219     my @cmd = qw(dpkg-source);
2220     push @cmd, '--no-check' if $dsc_checked;
2221     if (madformat $dsc->{format}) {
2222         push @cmd, '--skip-patches';
2223         $treeimporthow = 'unpatched';
2224     }
2225     push @cmd, qw(-x --), $dscfn;
2226     runcmd @cmd;
2227
2228     my ($tree,$dir) = mktree_in_ud_from_only_subdir("source package");
2229     if (madformat $dsc->{format}) { 
2230         check_for_vendor_patches();
2231     }
2232
2233     my $dappliedtree;
2234     if (madformat $dsc->{format}) {
2235         my @pcmd = qw(dpkg-source --before-build .);
2236         runcmd shell_cmd 'exec >/dev/null', @pcmd;
2237         rmtree '.pc';
2238         $dappliedtree = git_add_write_tree();
2239     }
2240
2241     my @clogcmd = qw(dpkg-parsechangelog --format rfc822 --all);
2242     debugcmd "|",@clogcmd;
2243     open CLOGS, "-|", @clogcmd or die $!;
2244
2245     my $clogp;
2246     my $r1clogp;
2247
2248     printdebug "import clog search...\n";
2249
2250     for (;;) {
2251         my $stanzatext = do { local $/=""; <CLOGS>; };
2252         printdebug "import clogp ".Dumper($stanzatext) if $debuglevel>1;
2253         last if !defined $stanzatext;
2254
2255         my $desc = "package changelog, entry no.$.";
2256         open my $stanzafh, "<", \$stanzatext or die;
2257         my $thisstanza = parsecontrolfh $stanzafh, $desc, 1;
2258         $clogp //= $thisstanza;
2259
2260         printdebug "import clog $thisstanza->{version} $desc...\n";
2261
2262         last if !$any_orig; # we don't need $r1clogp
2263
2264         # We look for the first (most recent) changelog entry whose
2265         # version number is lower than the upstream version of this
2266         # package.  Then the last (least recent) previous changelog
2267         # entry is treated as the one which introduced this upstream
2268         # version and used for the synthetic commits for the upstream
2269         # tarballs.
2270
2271         # One might think that a more sophisticated algorithm would be
2272         # necessary.  But: we do not want to scan the whole changelog
2273         # file.  Stopping when we see an earlier version, which
2274         # necessarily then is an earlier upstream version, is the only
2275         # realistic way to do that.  Then, either the earliest
2276         # changelog entry we have seen so far is indeed the earliest
2277         # upload of this upstream version; or there are only changelog
2278         # entries relating to later upstream versions (which is not
2279         # possible unless the changelog and .dsc disagree about the
2280         # version).  Then it remains to choose between the physically
2281         # last entry in the file, and the one with the lowest version
2282         # number.  If these are not the same, we guess that the
2283         # versions were created in a non-monotic order rather than
2284         # that the changelog entries have been misordered.
2285
2286         printdebug "import clog $thisstanza->{version} vs $upstreamv...\n";
2287
2288         last if version_compare($thisstanza->{version}, $upstreamv) < 0;
2289         $r1clogp = $thisstanza;
2290
2291         printdebug "import clog $r1clogp->{version} becomes r1\n";
2292     }
2293     die $! if CLOGS->error;
2294     close CLOGS or $?==SIGPIPE or failedcmd @clogcmd;
2295
2296     $clogp or fail "package changelog has no entries!";
2297
2298     my $authline = clogp_authline $clogp;
2299     my $changes = getfield $clogp, 'Changes';
2300     $changes =~ s/^\n//; # Changes: \n
2301     my $cversion = getfield $clogp, 'Version';
2302
2303     if (@tartrees) {
2304         $r1clogp //= $clogp; # maybe there's only one entry;
2305         my $r1authline = clogp_authline $r1clogp;
2306         # Strictly, r1authline might now be wrong if it's going to be
2307         # unused because !$any_orig.  Whatever.
2308
2309         printdebug "import tartrees authline   $authline\n";
2310         printdebug "import tartrees r1authline $r1authline\n";
2311
2312         foreach my $tt (@tartrees) {
2313             printdebug "import tartree $tt->{F} $tt->{Tree}\n";
2314
2315             $tt->{Commit} = make_commit_text($tt->{Orig} ? <<END_O : <<END_T);
2316 tree $tt->{Tree}
2317 author $r1authline
2318 committer $r1authline
2319
2320 Import $tt->{F}
2321
2322 [dgit import orig $tt->{F}]
2323 END_O
2324 tree $tt->{Tree}
2325 author $authline
2326 committer $authline
2327
2328 Import $tt->{F}
2329
2330 [dgit import tarball $package $cversion $tt->{F}]
2331 END_T
2332         }
2333     }
2334
2335     printdebug "import main commit\n";
2336
2337     open C, ">../commit.tmp" or die $!;
2338     print C <<END or die $!;
2339 tree $tree
2340 END
2341     print C <<END or die $! foreach @tartrees;
2342 parent $_->{Commit}
2343 END
2344     print C <<END or die $!;
2345 author $authline
2346 committer $authline
2347
2348 $changes
2349
2350 [dgit import $treeimporthow $package $cversion]
2351 END
2352
2353     close C or die $!;
2354     my $rawimport_hash = make_commit qw(../commit.tmp);
2355
2356     if (madformat $dsc->{format}) {
2357         printdebug "import apply patches...\n";
2358
2359         # regularise the state of the working tree so that
2360         # the checkout of $rawimport_hash works nicely.
2361         my $dappliedcommit = make_commit_text(<<END);
2362 tree $dappliedtree
2363 author $authline
2364 committer $authline
2365
2366 [dgit dummy commit]
2367 END
2368         runcmd @git, qw(checkout -q -b dapplied), $dappliedcommit;
2369
2370         runcmd @git, qw(checkout -q -b unpa), $rawimport_hash;
2371
2372         # We need the answers to be reproducible
2373         my @authline = clogp_authline($clogp);
2374         local $ENV{GIT_COMMITTER_NAME} =  $authline[0];
2375         local $ENV{GIT_COMMITTER_EMAIL} = $authline[1];
2376         local $ENV{GIT_COMMITTER_DATE} =  $authline[2];
2377         local $ENV{GIT_AUTHOR_NAME} =  $authline[0];
2378         local $ENV{GIT_AUTHOR_EMAIL} = $authline[1];
2379         local $ENV{GIT_AUTHOR_DATE} =  $authline[2];
2380
2381         my $path = $ENV{PATH} or die;
2382
2383         foreach my $use_absurd (qw(0 1)) {
2384             runcmd @git, qw(checkout -q unpa);
2385             runcmd @git, qw(update-ref -d refs/heads/patch-queue/unpa);
2386             local $ENV{PATH} = $path;
2387             if ($use_absurd) {
2388                 chomp $@;
2389                 progress "warning: $@";
2390                 $path = "$absurdity:$path";
2391                 progress "$us: trying slow absurd-git-apply...";
2392                 rename "../../gbp-pq-output","../../gbp-pq-output.0"
2393                     or $!==ENOENT
2394                     or die $!;
2395             }
2396             eval {
2397                 die "forbid absurd git-apply\n" if $use_absurd
2398                     && forceing [qw(import-gitapply-no-absurd)];
2399                 die "only absurd git-apply!\n" if !$use_absurd
2400                     && forceing [qw(import-gitapply-absurd)];
2401
2402                 local $ENV{DGIT_ABSURD_DEBUG} = $debuglevel if $use_absurd;
2403                 local $ENV{PATH} = $path                    if $use_absurd;
2404
2405                 my @showcmd = (gbp_pq, qw(import));
2406                 my @realcmd = shell_cmd
2407                     'exec >/dev/null 2>>../../gbp-pq-output', @showcmd;
2408                 debugcmd "+",@realcmd;
2409                 if (system @realcmd) {
2410                     die +(shellquote @showcmd).
2411                         " failed: ".
2412                         failedcmd_waitstatus()."\n";
2413                 }
2414
2415                 my $gapplied = git_rev_parse('HEAD');
2416                 my $gappliedtree = cmdoutput @git, qw(rev-parse HEAD:);
2417                 $gappliedtree eq $dappliedtree or
2418                     fail <<END;
2419 gbp-pq import and dpkg-source disagree!
2420  gbp-pq import gave commit $gapplied
2421  gbp-pq import gave tree $gappliedtree
2422  dpkg-source --before-build gave tree $dappliedtree
2423 END
2424                 $rawimport_hash = $gapplied;
2425             };
2426             last unless $@;
2427         }
2428         if ($@) {
2429             { local $@; eval { runcmd qw(cat ../../gbp-pq-output); }; }
2430             die $@;
2431         }
2432     }
2433
2434     progress "synthesised git commit from .dsc $cversion";
2435
2436     my $rawimport_mergeinput = {
2437         Commit => $rawimport_hash,
2438         Info => "Import of source package",
2439     };
2440     my @output = ($rawimport_mergeinput);
2441
2442     if ($lastpush_mergeinput) {
2443         my $oldclogp = mergeinfo_getclogp($lastpush_mergeinput);
2444         my $oversion = getfield $oldclogp, 'Version';
2445         my $vcmp =
2446             version_compare($oversion, $cversion);
2447         if ($vcmp < 0) {
2448             @output = ($rawimport_mergeinput, $lastpush_mergeinput,
2449                 { Message => <<END, ReverseParents => 1 });
2450 Record $package ($cversion) in archive suite $csuite
2451 END
2452         } elsif ($vcmp > 0) {
2453             print STDERR <<END or die $!;
2454
2455 Version actually in archive:   $cversion (older)
2456 Last version pushed with dgit: $oversion (newer or same)
2457 $later_warning_msg
2458 END
2459             @output = $lastpush_mergeinput;
2460         } else {
2461             # Same version.  Use what's in the server git branch,
2462             # discarding our own import.  (This could happen if the
2463             # server automatically imports all packages into git.)
2464             @output = $lastpush_mergeinput;
2465         }
2466     }
2467     changedir '../../../..';
2468     rmtree($ud);
2469     return @output;
2470 }
2471
2472 sub complete_file_from_dsc ($$;$) {
2473     our ($dstdir, $fi, $refetched) = @_;
2474     # Ensures that we have, in $dstdir, the file $fi, with the correct
2475     # contents.  (Downloading it from alongside $dscurl if necessary.)
2476     # If $refetched is defined, can overwrite "$dstdir/$fi->{Filename}"
2477     # and will set $$refetched=1 if it did so (or tried to).
2478
2479     my $f = $fi->{Filename};
2480     my $tf = "$dstdir/$f";
2481     my $downloaded = 0;
2482
2483     my $got;
2484     my $checkhash = sub {
2485         open F, "<", "$tf" or die "$tf: $!";
2486         $fi->{Digester}->reset();
2487         $fi->{Digester}->addfile(*F);
2488         F->error and die $!;
2489         $got = $fi->{Digester}->hexdigest();
2490         return $got eq $fi->{Hash};
2491     };
2492
2493     if (stat_exists $tf) {
2494         if ($checkhash->()) {
2495             progress "using existing $f";
2496             return 1;
2497         }
2498         if (!$refetched) {
2499             fail "file $f has hash $got but .dsc".
2500                 " demands hash $fi->{Hash} ".
2501                 "(perhaps you should delete this file?)";
2502         }
2503         progress "need to fetch correct version of $f";
2504         unlink $tf or die "$tf $!";
2505         $$refetched = 1;
2506     } else {
2507         printdebug "$tf does not exist, need to fetch\n";
2508     }
2509
2510     my $furl = $dscurl;
2511     $furl =~ s{/[^/]+$}{};
2512     $furl .= "/$f";
2513     die "$f ?" unless $f =~ m/^\Q${package}\E_/;
2514     die "$f ?" if $f =~ m#/#;
2515     runcmd_ordryrun_local @curl,qw(-f -o),$tf,'--',"$furl";
2516     return 0 if !act_local();
2517
2518     $checkhash->() or
2519         fail "file $f has hash $got but .dsc".
2520             " demands hash $fi->{Hash} ".
2521             "(got wrong file from archive!)";
2522
2523     return 1;
2524 }
2525
2526 sub ensure_we_have_orig () {
2527     my @dfi = dsc_files_info();
2528     foreach my $fi (@dfi) {
2529         my $f = $fi->{Filename};
2530         next unless is_orig_file_in_dsc($f, \@dfi);
2531         complete_file_from_dsc('..', $fi)
2532             or next;
2533     }
2534 }
2535
2536 #---------- git fetch ----------
2537
2538 sub lrfetchrefs () { return "refs/dgit-fetch/".access_basedistro(); }
2539 sub lrfetchref () { return lrfetchrefs.'/'.server_branch($csuite); }
2540
2541 # We fetch some parts of lrfetchrefs/*.  Ideally we delete these
2542 # locally fetched refs because they have unhelpful names and clutter
2543 # up gitk etc.  So we track whether we have "used up" head ref (ie,
2544 # whether we have made another local ref which refers to this object).
2545 #
2546 # (If we deleted them unconditionally, then we might end up
2547 # re-fetching the same git objects each time dgit fetch was run.)
2548 #
2549 # So, each use of lrfetchrefs needs to be accompanied by arrangements
2550 # in git_fetch_us to fetch the refs in question, and possibly a call
2551 # to lrfetchref_used.
2552
2553 our (%lrfetchrefs_f, %lrfetchrefs_d);
2554 # $lrfetchrefs_X{lrfetchrefs."/heads/whatever"} = $objid
2555
2556 sub lrfetchref_used ($) {
2557     my ($fullrefname) = @_;
2558     my $objid = $lrfetchrefs_f{$fullrefname};
2559     $lrfetchrefs_d{$fullrefname} = $objid if defined $objid;
2560 }
2561
2562 sub git_lrfetch_sane {
2563     my ($url, $supplementary, @specs) = @_;
2564     # Make a 'refs/'.lrfetchrefs.'/*' be just like on server,
2565     # at least as regards @specs.  Also leave the results in
2566     # %lrfetchrefs_f, and arrange for lrfetchref_used to be
2567     # able to clean these up.
2568     #
2569     # With $supplementary==1, @specs must not contain wildcards
2570     # and we add to our previous fetches (non-atomically).
2571
2572     # This is rather miserable:
2573     # When git fetch --prune is passed a fetchspec ending with a *,
2574     # it does a plausible thing.  If there is no * then:
2575     # - it matches subpaths too, even if the supplied refspec
2576     #   starts refs, and behaves completely madly if the source
2577     #   has refs/refs/something.  (See, for example, Debian #NNNN.)
2578     # - if there is no matching remote ref, it bombs out the whole
2579     #   fetch.
2580     # We want to fetch a fixed ref, and we don't know in advance
2581     # if it exists, so this is not suitable.
2582     #
2583     # Our workaround is to use git ls-remote.  git ls-remote has its
2584     # own qairks.  Notably, it has the absurd multi-tail-matching
2585     # behaviour: git ls-remote R refs/foo can report refs/foo AND
2586     # refs/refs/foo etc.
2587     #
2588     # Also, we want an idempotent snapshot, but we have to make two
2589     # calls to the remote: one to git ls-remote and to git fetch.  The
2590     # solution is use git ls-remote to obtain a target state, and
2591     # git fetch to try to generate it.  If we don't manage to generate
2592     # the target state, we try again.
2593
2594     printdebug "git_lrfetch_sane suppl=$supplementary specs @specs\n";
2595
2596     my $specre = join '|', map {
2597         my $x = $_;
2598         $x =~ s/\W/\\$&/g;
2599         my $wildcard = $x =~ s/\\\*$/.*/;
2600         die if $wildcard && $supplementary;
2601         "(?:refs/$x)";
2602     } @specs;
2603     printdebug "git_lrfetch_sane specre=$specre\n";
2604     my $wanted_rref = sub {
2605         local ($_) = @_;
2606         return m/^(?:$specre)$/;
2607     };
2608
2609     my $fetch_iteration = 0;
2610     FETCH_ITERATION:
2611     for (;;) {
2612         printdebug "git_lrfetch_sane iteration $fetch_iteration\n";
2613         if (++$fetch_iteration > 10) {
2614             fail "too many iterations trying to get sane fetch!";
2615         }
2616
2617         my @look = map { "refs/$_" } @specs;
2618         my @lcmd = (@git, qw(ls-remote -q --refs), $url, @look);
2619         debugcmd "|",@lcmd;
2620
2621         my %wantr;
2622         open GITLS, "-|", @lcmd or die $!;
2623         while (<GITLS>) {
2624             printdebug "=> ", $_;
2625             m/^(\w+)\s+(\S+)\n/ or die "ls-remote $_ ?";
2626             my ($objid,$rrefname) = ($1,$2);
2627             if (!$wanted_rref->($rrefname)) {
2628                 print STDERR <<END;
2629 warning: git ls-remote @look reported $rrefname; this is silly, ignoring it.
2630 END
2631                 next;
2632             }
2633             $wantr{$rrefname} = $objid;
2634         }
2635         $!=0; $?=0;
2636         close GITLS or failedcmd @lcmd;
2637
2638         # OK, now %want is exactly what we want for refs in @specs
2639         my @fspecs = map {
2640             !m/\*$/ && !exists $wantr{"refs/$_"} ? () :
2641             "+refs/$_:".lrfetchrefs."/$_";
2642         } @specs;
2643
2644         printdebug "git_lrfetch_sane fspecs @fspecs\n";
2645
2646         my @fcmd = (@git, qw(fetch -p -n -q), $url, @fspecs);
2647         runcmd_ordryrun_local @fcmd if @fspecs;
2648
2649         if (!$supplementary) {
2650             %lrfetchrefs_f = ();
2651         }
2652         my %objgot;
2653
2654         git_for_each_ref(lrfetchrefs, sub {
2655             my ($objid,$objtype,$lrefname,$reftail) = @_;
2656             $lrfetchrefs_f{$lrefname} = $objid;
2657             $objgot{$objid} = 1;
2658         });
2659
2660         if ($supplementary) {
2661             last;
2662         }
2663
2664         foreach my $lrefname (sort keys %lrfetchrefs_f) {
2665             my $rrefname = 'refs'.substr($lrefname, length lrfetchrefs);
2666             if (!exists $wantr{$rrefname}) {
2667                 if ($wanted_rref->($rrefname)) {
2668                     printdebug <<END;
2669 git-fetch @fspecs created $lrefname which git ls-remote @look didn't list.
2670 END
2671                 } else {
2672                     print STDERR <<END
2673 warning: git fetch @fspecs created $lrefname; this is silly, deleting it.
2674 END
2675                 }
2676                 runcmd_ordryrun_local @git, qw(update-ref -d), $lrefname;
2677                 delete $lrfetchrefs_f{$lrefname};
2678                 next;
2679             }
2680         }
2681         foreach my $rrefname (sort keys %wantr) {
2682             my $lrefname = lrfetchrefs.substr($rrefname, 4);
2683             my $got = $lrfetchrefs_f{$lrefname} // '<none>';
2684             my $want = $wantr{$rrefname};
2685             next if $got eq $want;
2686             if (!defined $objgot{$want}) {
2687                 print STDERR <<END;
2688 warning: git ls-remote suggests we want $lrefname
2689 warning:  and it should refer to $want
2690 warning:  but git fetch didn't fetch that object to any relevant ref.
2691 warning:  This may be due to a race with someone updating the server.
2692 warning:  Will try again...
2693 END
2694                 next FETCH_ITERATION;
2695             }
2696             printdebug <<END;
2697 git-fetch @fspecs made $lrefname=$got but want git ls-remote @look says $want
2698 END
2699             runcmd_ordryrun_local @git, qw(update-ref -m),
2700                 "dgit fetch git fetch fixup", $lrefname, $want;
2701             $lrfetchrefs_f{$lrefname} = $want;
2702         }
2703         last;
2704     }
2705
2706     if (defined $csuite) {
2707         printdebug "git_lrfetch_sane: tidying any old suite lrfetchrefs\n";
2708         git_for_each_ref("refs/dgit-fetch/$csuite", sub {
2709             my ($objid,$objtype,$lrefname,$reftail) = @_;
2710             next if $lrfetchrefs_f{$lrefname}; # $csuite eq $distro ?
2711             runcmd_ordryrun_local @git, qw(update-ref -d), $lrefname;
2712         });
2713     }
2714
2715     printdebug "git_lrfetch_sane: git fetch --no-insane emulation complete\n",
2716         Dumper(\%lrfetchrefs_f);
2717 }
2718
2719 sub git_fetch_us () {
2720     # Want to fetch only what we are going to use, unless
2721     # deliberately-not-ff, in which case we must fetch everything.
2722
2723     my @specs = deliberately_not_fast_forward ? qw(tags/*) :
2724         map { "tags/$_" }
2725         (quiltmode_splitbrain
2726          ? (map { $_->('*',access_nomdistro) }
2727             \&debiantag_new, \&debiantag_maintview)
2728          : debiantags('*',access_nomdistro));
2729     push @specs, server_branch($csuite);
2730     push @specs, $rewritemap;
2731     push @specs, qw(heads/*) if deliberately_not_fast_forward;
2732
2733     my $url = access_giturl();
2734     git_lrfetch_sane $url, 0, @specs;
2735
2736     my %here;
2737     my @tagpats = debiantags('*',access_nomdistro);
2738
2739     git_for_each_ref([map { "refs/tags/$_" } @tagpats], sub {
2740         my ($objid,$objtype,$fullrefname,$reftail) = @_;
2741         printdebug "currently $fullrefname=$objid\n";
2742         $here{$fullrefname} = $objid;
2743     });
2744     git_for_each_ref([map { lrfetchrefs."/tags/".$_ } @tagpats], sub {
2745         my ($objid,$objtype,$fullrefname,$reftail) = @_;
2746         my $lref = "refs".substr($fullrefname, length(lrfetchrefs));
2747         printdebug "offered $lref=$objid\n";
2748         if (!defined $here{$lref}) {
2749             my @upd = (@git, qw(update-ref), $lref, $objid, '');
2750             runcmd_ordryrun_local @upd;
2751             lrfetchref_used $fullrefname;
2752         } elsif ($here{$lref} eq $objid) {
2753             lrfetchref_used $fullrefname;
2754         } else {
2755             print STDERR
2756                 "Not updating $lref from $here{$lref} to $objid.\n";
2757         }
2758     });
2759 }
2760
2761 #---------- dsc and archive handling ----------
2762
2763 sub mergeinfo_getclogp ($) {
2764     # Ensures thit $mi->{Clogp} exists and returns it
2765     my ($mi) = @_;
2766     $mi->{Clogp} = commit_getclogp($mi->{Commit});
2767 }
2768
2769 sub mergeinfo_version ($) {
2770     return getfield( (mergeinfo_getclogp $_[0]), 'Version' );
2771 }
2772
2773 sub fetch_from_archive_record_1 ($) {
2774     my ($hash) = @_;
2775     runcmd @git, qw(update-ref -m), "dgit fetch $csuite",
2776             'DGIT_ARCHIVE', $hash;
2777     cmdoutput @git, qw(log -n2), $hash;
2778     # ... gives git a chance to complain if our commit is malformed
2779 }
2780
2781 sub fetch_from_archive_record_2 ($) {
2782     my ($hash) = @_;
2783     my @upd_cmd = (@git, qw(update-ref -m), 'dgit fetch', lrref(), $hash);
2784     if (act_local()) {
2785         cmdoutput @upd_cmd;
2786     } else {
2787         dryrun_report @upd_cmd;
2788     }
2789 }
2790
2791 sub parse_dsc_field_def_dsc_distro () {
2792     $dsc_distro //= cfg qw(dgit.default.old-dsc-distro
2793                            dgit.default.distro);
2794 }
2795
2796 sub parse_dsc_field ($$) {
2797     my ($dsc, $what) = @_;
2798     my $f;
2799     foreach my $field (@ourdscfield) {
2800         $f = $dsc->{$field};
2801         last if defined $f;
2802     }
2803
2804     if (!defined $f) {
2805         progress "$what: NO git hash";
2806         parse_dsc_field_def_dsc_distro();
2807     } elsif (($dsc_hash, $dsc_distro, $dsc_hint_tag, $dsc_hint_url)
2808              = $f =~ m/^(\w+)\s+($distro_re)\s+($versiontag_re)\s+(\S+)(?:\s|$)/) {
2809         progress "$what: specified git info ($dsc_distro)";
2810         $dsc_hint_tag = [ $dsc_hint_tag ];
2811     } elsif ($f =~ m/^\w+\s*$/) {
2812         $dsc_hash = $&;
2813         parse_dsc_field_def_dsc_distro();
2814         $dsc_hint_tag = [ debiantags +(getfield $dsc, 'Version'),
2815                           $dsc_distro ];
2816         progress "$what: specified git hash";
2817     } else {
2818         fail "$what: invalid Dgit info";
2819     }
2820 }
2821
2822 sub resolve_dsc_field_commit ($$) {
2823     my ($already_distro, $already_mapref) = @_;
2824
2825     return unless defined $dsc_hash;
2826
2827     my $mapref =
2828         defined $already_mapref &&
2829         ($already_distro eq $dsc_distro || !$chase_dsc_distro)
2830         ? $already_mapref : undef;
2831
2832     my $do_fetch;
2833     $do_fetch = sub {
2834         my ($what, @fetch) = @_;
2835
2836         local $idistro = $dsc_distro;
2837         my $lrf = lrfetchrefs;
2838
2839         if (!$chase_dsc_distro) {
2840             progress
2841                 "not chasing .dsc distro $dsc_distro: not fetching $what";
2842             return 0;
2843         }
2844
2845         progress
2846             ".dsc names distro $dsc_distro: fetching $what";
2847
2848         my $url = access_giturl();
2849         if (!defined $url) {
2850             defined $dsc_hint_url or fail <<END;
2851 .dsc Dgit metadata is in context of distro $dsc_distro
2852 for which we have no configured url and .dsc provides no hint
2853 END
2854             my $proto =
2855                 $dsc_hint_url =~ m#^([-+0-9a-zA-Z]+):# ? $1 :
2856                 $dsc_hint_url =~ m#^/# ? 'file' : 'bad-syntax';
2857             parse_cfg_bool "dsc-url-proto-ok", 'false',
2858                 cfg("dgit.dsc-url-proto-ok.$proto",
2859                     "dgit.default.dsc-url-proto-ok")
2860                 or fail <<END;
2861 .dsc Dgit metadata is in context of distro $dsc_distro
2862 for which we have no configured url;
2863 .dsc provides hinted url with protocol $proto which is unsafe.
2864 (can be overridden by config - consult documentation)
2865 END
2866             $url = $dsc_hint_url;
2867         }
2868
2869         git_lrfetch_sane $url, 1, @fetch;
2870
2871         return $lrf;
2872     };
2873
2874     my $rewrite_enable = do {
2875         local $idistro = $dsc_distro;
2876         access_cfg('rewrite-map-enable', 'RETURN-UNDEF');
2877     };
2878
2879     if (parse_cfg_bool 'rewrite-map-enable', 'true', $rewrite_enable) {
2880         if (!defined $mapref) {
2881             my $lrf = $do_fetch->("rewrite map", $rewritemap) or return;
2882             $mapref = $lrf.'/'.$rewritemap;
2883         }
2884         my $rewritemapdata = git_cat_file $mapref.':map';
2885         if (defined $rewritemapdata
2886             && $rewritemapdata =~ m/^$dsc_hash(?:[ \t](\w+))/m) {
2887             progress
2888                 "server's git history rewrite map contains a relevant entry!";
2889
2890             $dsc_hash = $1;
2891             if (defined $dsc_hash) {
2892                 progress "using rewritten git hash in place of .dsc value";
2893             } else {
2894                 progress "server data says .dsc hash is to be disregarded";
2895             }
2896         }
2897     }
2898
2899     if (!defined git_cat_file $dsc_hash) {
2900         my @tags = map { "tags/".$_ } @$dsc_hint_tag;
2901         my $lrf = $do_fetch->("additional commits", @tags) &&
2902             defined git_cat_file $dsc_hash
2903             or fail <<END;
2904 .dsc Dgit metadata requires commit $dsc_hash
2905 but we could not obtain that object anywhere.
2906 END
2907         foreach my $t (@tags) {
2908             my $fullrefname = $lrf.'/'.$t;
2909 #           print STDERR "CHK $t $fullrefname ".Dumper(\%lrfetchrefs_f);
2910             next unless $lrfetchrefs_f{$fullrefname};
2911             next unless is_fast_fwd "$fullrefname~0", $dsc_hash;
2912             lrfetchref_used $fullrefname;
2913         }
2914     }
2915 }
2916
2917 sub fetch_from_archive () {
2918     ensure_setup_existing_tree();
2919
2920     # Ensures that lrref() is what is actually in the archive, one way
2921     # or another, according to us - ie this client's
2922     # appropritaely-updated archive view.  Also returns the commit id.
2923     # If there is nothing in the archive, leaves lrref alone and
2924     # returns undef.  git_fetch_us must have already been called.
2925     get_archive_dsc();
2926
2927     if ($dsc) {
2928         parse_dsc_field($dsc, 'last upload to archive');
2929         resolve_dsc_field_commit access_basedistro,
2930             lrfetchrefs."/".$rewritemap
2931     } else {
2932         progress "no version available from the archive";
2933     }
2934
2935     # If the archive's .dsc has a Dgit field, there are three
2936     # relevant git commitids we need to choose between and/or merge
2937     # together:
2938     #   1. $dsc_hash: the Dgit field from the archive
2939     #   2. $lastpush_hash: the suite branch on the dgit git server
2940     #   3. $lastfetch_hash: our local tracking brach for the suite
2941     #
2942     # These may all be distinct and need not be in any fast forward
2943     # relationship:
2944     #
2945     # If the dsc was pushed to this suite, then the server suite
2946     # branch will have been updated; but it might have been pushed to
2947     # a different suite and copied by the archive.  Conversely a more
2948     # recent version may have been pushed with dgit but not appeared
2949     # in the archive (yet).
2950     #
2951     # $lastfetch_hash may be awkward because archive imports
2952     # (particularly, imports of Dgit-less .dscs) are performed only as
2953     # needed on individual clients, so different clients may perform a
2954     # different subset of them - and these imports are only made
2955     # public during push.  So $lastfetch_hash may represent a set of
2956     # imports different to a subsequent upload by a different dgit
2957     # client.
2958     #
2959     # Our approach is as follows:
2960     #
2961     # As between $dsc_hash and $lastpush_hash: if $lastpush_hash is a
2962     # descendant of $dsc_hash, then it was pushed by a dgit user who
2963     # had based their work on $dsc_hash, so we should prefer it.
2964     # Otherwise, $dsc_hash was installed into this suite in the
2965     # archive other than by a dgit push, and (necessarily) after the
2966     # last dgit push into that suite (since a dgit push would have
2967     # been descended from the dgit server git branch); thus, in that
2968     # case, we prefer the archive's version (and produce a
2969     # pseudo-merge to overwrite the dgit server git branch).
2970     #
2971     # (If there is no Dgit field in the archive's .dsc then
2972     # generate_commit_from_dsc uses the version numbers to decide
2973     # whether the suite branch or the archive is newer.  If the suite
2974     # branch is newer it ignores the archive's .dsc; otherwise it
2975     # generates an import of the .dsc, and produces a pseudo-merge to
2976     # overwrite the suite branch with the archive contents.)
2977     #
2978     # The outcome of that part of the algorithm is the `public view',
2979     # and is same for all dgit clients: it does not depend on any
2980     # unpublished history in the local tracking branch.
2981     #
2982     # As between the public view and the local tracking branch: The
2983     # local tracking branch is only updated by dgit fetch, and
2984     # whenever dgit fetch runs it includes the public view in the
2985     # local tracking branch.  Therefore if the public view is not
2986     # descended from the local tracking branch, the local tracking
2987     # branch must contain history which was imported from the archive
2988     # but never pushed; and, its tip is now out of date.  So, we make
2989     # a pseudo-merge to overwrite the old imports and stitch the old
2990     # history in.
2991     #
2992     # Finally: we do not necessarily reify the public view (as
2993     # described above).  This is so that we do not end up stacking two
2994     # pseudo-merges.  So what we actually do is figure out the inputs
2995     # to any public view pseudo-merge and put them in @mergeinputs.
2996
2997     my @mergeinputs;
2998     # $mergeinputs[]{Commit}
2999     # $mergeinputs[]{Info}
3000     # $mergeinputs[0] is the one whose tree we use
3001     # @mergeinputs is in the order we use in the actual commit)
3002     #
3003     # Also:
3004     # $mergeinputs[]{Message} is a commit message to use
3005     # $mergeinputs[]{ReverseParents} if def specifies that parent
3006     #                                list should be in opposite order
3007     # Such an entry has no Commit or Info.  It applies only when found
3008     # in the last entry.  (This ugliness is to support making
3009     # identical imports to previous dgit versions.)
3010
3011     my $lastpush_hash = git_get_ref(lrfetchref());
3012     printdebug "previous reference hash=$lastpush_hash\n";
3013     $lastpush_mergeinput = $lastpush_hash && {
3014         Commit => $lastpush_hash,
3015         Info => "dgit suite branch on dgit git server",
3016     };
3017
3018     my $lastfetch_hash = git_get_ref(lrref());
3019     printdebug "fetch_from_archive: lastfetch=$lastfetch_hash\n";
3020     my $lastfetch_mergeinput = $lastfetch_hash && {
3021         Commit => $lastfetch_hash,
3022         Info => "dgit client's archive history view",
3023     };
3024
3025     my $dsc_mergeinput = $dsc_hash && {
3026         Commit => $dsc_hash,
3027         Info => "Dgit field in .dsc from archive",
3028     };
3029
3030     my $cwd = getcwd();
3031     my $del_lrfetchrefs = sub {
3032         changedir $cwd;
3033         my $gur;
3034         printdebug "del_lrfetchrefs...\n";
3035         foreach my $fullrefname (sort keys %lrfetchrefs_d) {
3036             my $objid = $lrfetchrefs_d{$fullrefname};
3037             printdebug "del_lrfetchrefs: $objid $fullrefname\n";
3038             if (!$gur) {
3039                 $gur ||= new IO::Handle;
3040                 open $gur, "|-", qw(git update-ref --stdin) or die $!;
3041             }
3042             printf $gur "delete %s %s\n", $fullrefname, $objid;
3043         }
3044         if ($gur) {
3045             close $gur or failedcmd "git update-ref delete lrfetchrefs";
3046         }
3047     };
3048
3049     if (defined $dsc_hash) {
3050         ensure_we_have_orig();
3051         if (!$lastpush_hash || $dsc_hash eq $lastpush_hash) {
3052             @mergeinputs = $dsc_mergeinput
3053         } elsif (is_fast_fwd($dsc_hash,$lastpush_hash)) {
3054             print STDERR <<END or die $!;
3055
3056 Git commit in archive is behind the last version allegedly pushed/uploaded.
3057 Commit referred to by archive: $dsc_hash
3058 Last version pushed with dgit: $lastpush_hash
3059 $later_warning_msg
3060 END
3061             @mergeinputs = ($lastpush_mergeinput);
3062         } else {
3063             # Archive has .dsc which is not a descendant of the last dgit
3064             # push.  This can happen if the archive moves .dscs about.
3065             # Just follow its lead.
3066             if (is_fast_fwd($lastpush_hash,$dsc_hash)) {
3067                 progress "archive .dsc names newer git commit";
3068                 @mergeinputs = ($dsc_mergeinput);
3069             } else {
3070                 progress "archive .dsc names other git commit, fixing up";
3071                 @mergeinputs = ($dsc_mergeinput, $lastpush_mergeinput);
3072             }
3073         }
3074     } elsif ($dsc) {
3075         @mergeinputs = generate_commits_from_dsc();
3076         # We have just done an import.  Now, our import algorithm might
3077         # have been improved.  But even so we do not want to generate
3078         # a new different import of the same package.  So if the
3079         # version numbers are the same, just use our existing version.
3080         # If the version numbers are different, the archive has changed
3081         # (perhaps, rewound).
3082         if ($lastfetch_mergeinput &&
3083             !version_compare( (mergeinfo_version $lastfetch_mergeinput),
3084                               (mergeinfo_version $mergeinputs[0]) )) {
3085             @mergeinputs = ($lastfetch_mergeinput);
3086         }
3087     } elsif ($lastpush_hash) {
3088         # only in git, not in the archive yet
3089         @mergeinputs = ($lastpush_mergeinput);
3090         print STDERR <<END or die $!;
3091
3092 Package not found in the archive, but has allegedly been pushed using dgit.
3093 $later_warning_msg
3094 END
3095     } else {
3096         printdebug "nothing found!\n";
3097         if (defined $skew_warning_vsn) {
3098             print STDERR <<END or die $!;
3099
3100 Warning: relevant archive skew detected.
3101 Archive allegedly contains $skew_warning_vsn
3102 But we were not able to obtain any version from the archive or git.
3103
3104 END
3105         }
3106         unshift @end, $del_lrfetchrefs;
3107         return undef;
3108     }
3109
3110     if ($lastfetch_hash &&
3111         !grep {
3112             my $h = $_->{Commit};
3113             $h and is_fast_fwd($lastfetch_hash, $h);
3114             # If true, one of the existing parents of this commit
3115             # is a descendant of the $lastfetch_hash, so we'll
3116             # be ff from that automatically.
3117         } @mergeinputs
3118         ) {
3119         # Otherwise:
3120         push @mergeinputs, $lastfetch_mergeinput;
3121     }
3122
3123     printdebug "fetch mergeinfos:\n";
3124     foreach my $mi (@mergeinputs) {
3125         if ($mi->{Info}) {
3126             printdebug " commit $mi->{Commit} $mi->{Info}\n";
3127         } else {
3128             printdebug sprintf " ReverseParents=%d Message=%s",
3129                 $mi->{ReverseParents}, $mi->{Message};
3130         }
3131     }
3132
3133     my $compat_info= pop @mergeinputs
3134         if $mergeinputs[$#mergeinputs]{Message};
3135
3136     @mergeinputs = grep { defined $_->{Commit} } @mergeinputs;
3137
3138     my $hash;
3139     if (@mergeinputs > 1) {
3140         # here we go, then:
3141         my $tree_commit = $mergeinputs[0]{Commit};
3142
3143         my $tree = cmdoutput @git, qw(cat-file commit), $tree_commit;
3144         $tree =~ m/\n\n/;  $tree = $`;
3145         $tree =~ m/^tree (\w+)$/m or die "$dsc_hash tree ?";
3146         $tree = $1;
3147
3148         # We use the changelog author of the package in question the
3149         # author of this pseudo-merge.  This is (roughly) correct if
3150         # this commit is simply representing aa non-dgit upload.
3151         # (Roughly because it does not record sponsorship - but we
3152         # don't have sponsorship info because that's in the .changes,
3153         # which isn't in the archivw.)
3154         #
3155         # But, it might be that we are representing archive history
3156         # updates (including in-archive copies).  These are not really
3157         # the responsibility of the person who created the .dsc, but
3158         # there is no-one whose name we should better use.  (The
3159         # author of the .dsc-named commit is clearly worse.)
3160
3161         my $useclogp = mergeinfo_getclogp $mergeinputs[0];
3162         my $author = clogp_authline $useclogp;
3163         my $cversion = getfield $useclogp, 'Version';
3164
3165         my $mcf = ".git/dgit/mergecommit";
3166         open MC, ">", $mcf or die "$mcf $!";
3167         print MC <<END or die $!;
3168 tree $tree
3169 END
3170
3171         my @parents = grep { $_->{Commit} } @mergeinputs;
3172         @parents = reverse @parents if $compat_info->{ReverseParents};
3173         print MC <<END or die $! foreach @parents;
3174 parent $_->{Commit}
3175 END
3176
3177         print MC <<END or die $!;
3178 author $author
3179 committer $author
3180
3181 END
3182
3183         if (defined $compat_info->{Message}) {
3184             print MC $compat_info->{Message} or die $!;
3185         } else {
3186             print MC <<END or die $!;
3187 Record $package ($cversion) in archive suite $csuite
3188
3189 Record that
3190 END
3191             my $message_add_info = sub {
3192                 my ($mi) = (@_);
3193                 my $mversion = mergeinfo_version $mi;
3194                 printf MC "  %-20s %s\n", $mversion, $mi->{Info}
3195                     or die $!;
3196             };
3197
3198             $message_add_info->($mergeinputs[0]);
3199             print MC <<END or die $!;
3200 should be treated as descended from
3201 END
3202             $message_add_info->($_) foreach @mergeinputs[1..$#mergeinputs];
3203         }
3204
3205         close MC or die $!;
3206         $hash = make_commit $mcf;
3207     } else {
3208         $hash = $mergeinputs[0]{Commit};
3209     }
3210     printdebug "fetch hash=$hash\n";
3211
3212     my $chkff = sub {
3213         my ($lasth, $what) = @_;
3214         return unless $lasth;
3215         die "$lasth $hash $what ?" unless is_fast_fwd($lasth, $hash);
3216     };
3217
3218     $chkff->($lastpush_hash, 'dgit repo server tip (last push)')
3219         if $lastpush_hash;
3220     $chkff->($lastfetch_hash, 'local tracking tip (last fetch)');
3221
3222     fetch_from_archive_record_1($hash);
3223
3224     if (defined $skew_warning_vsn) {
3225         mkpath '.git/dgit';
3226         printdebug "SKEW CHECK WANT $skew_warning_vsn\n";
3227         my $gotclogp = commit_getclogp($hash);
3228         my $got_vsn = getfield $gotclogp, 'Version';
3229         printdebug "SKEW CHECK GOT $got_vsn\n";
3230         if (version_compare($got_vsn, $skew_warning_vsn) < 0) {
3231             print STDERR <<END or die $!;
3232
3233 Warning: archive skew detected.  Using the available version:
3234 Archive allegedly contains    $skew_warning_vsn
3235 We were able to obtain only   $got_vsn
3236
3237 END
3238         }
3239     }
3240
3241     if ($lastfetch_hash ne $hash) {
3242         fetch_from_archive_record_2($hash);
3243     }
3244
3245     lrfetchref_used lrfetchref();
3246
3247     check_gitattrs($hash, "fetched source tree");
3248
3249     unshift @end, $del_lrfetchrefs;
3250     return $hash;
3251 }
3252
3253 sub set_local_git_config ($$) {
3254     my ($k, $v) = @_;
3255     runcmd @git, qw(config), $k, $v;
3256 }
3257
3258 sub setup_mergechangelogs (;$) {
3259     my ($always) = @_;
3260     return unless $always || access_cfg_bool(1, 'setup-mergechangelogs');
3261
3262     my $driver = 'dpkg-mergechangelogs';
3263     my $cb = "merge.$driver";
3264     my $attrs = '.git/info/attributes';
3265     ensuredir '.git/info';
3266
3267     open NATTRS, ">", "$attrs.new" or die "$attrs.new $!";
3268     if (!open ATTRS, "<", $attrs) {
3269         $!==ENOENT or die "$attrs: $!";
3270     } else {
3271         while (<ATTRS>) {
3272             chomp;
3273             next if m{^debian/changelog\s};
3274             print NATTRS $_, "\n" or die $!;
3275         }
3276         ATTRS->error and die $!;
3277         close ATTRS;
3278     }
3279     print NATTRS "debian/changelog merge=$driver\n" or die $!;
3280     close NATTRS;
3281
3282     set_local_git_config "$cb.name", 'debian/changelog merge driver';
3283     set_local_git_config "$cb.driver", 'dpkg-mergechangelogs -m %O %A %B %A';
3284
3285     rename "$attrs.new", "$attrs" or die "$attrs: $!";
3286 }
3287
3288 sub setup_useremail (;$) {
3289     my ($always) = @_;
3290     return unless $always || access_cfg_bool(1, 'setup-useremail');
3291
3292     my $setup = sub {
3293         my ($k, $envvar) = @_;
3294         my $v = access_cfg("user-$k", 'RETURN-UNDEF') // $ENV{$envvar};
3295         return unless defined $v;
3296         set_local_git_config "user.$k", $v;
3297     };
3298
3299     $setup->('email', 'DEBEMAIL');
3300     $setup->('name', 'DEBFULLNAME');
3301 }
3302
3303 sub ensure_setup_existing_tree () {
3304     my $k = "remote.$remotename.skipdefaultupdate";
3305     my $c = git_get_config $k;
3306     return if defined $c;
3307     set_local_git_config $k, 'true';
3308 }
3309
3310 sub open_gitattrs () {
3311     my $gai = new IO::File ".git/info/attributes"
3312         or $!==ENOENT
3313         or die "open .git/info/attributes: $!";
3314     return $gai;
3315 }
3316
3317 sub is_gitattrs_setup () {
3318     my $gai = open_gitattrs();
3319     return 0 unless $gai;
3320     while (<$gai>) {
3321         return 1 if m{^\[attr\]dgit-defuse-attrs\s};
3322     }
3323     $gai->error and die $!;
3324     return 0;
3325 }    
3326
3327 sub setup_gitattrs (;$) {
3328     my ($always) = @_;
3329     return unless $always || access_cfg_bool(1, 'setup-gitattributes');
3330
3331     if (is_gitattrs_setup()) {
3332         progress <<END;
3333 [attr]dgit-defuse-attrs already found in .git/info/attributes
3334  not doing further gitattributes setup
3335 END
3336         return;
3337     }
3338     my $af = ".git/info/attributes";
3339     ensuredir '.git/info';
3340     open GAO, "> $af.new" or die $!;
3341     print GAO <<END or die $!;
3342 *       dgit-defuse-attrs
3343 [attr]dgit-defuse-attrs $negate_harmful_gitattrs
3344 # ^ see GITATTRIBUTES in dgit(7) and dgit setup-new-tree in dgit(1)
3345 END
3346     my $gai = open_gitattrs();
3347     if ($gai) {
3348         while (<$gai>) {
3349             chomp;
3350             print GAO $_, "\n" or die $!;
3351         }
3352         $gai->error and die $!;
3353     }
3354     close GAO or die $!;
3355     rename "$af.new", "$af" or die "install $af: $!";
3356 }
3357
3358 sub setup_new_tree () {
3359     setup_mergechangelogs();
3360     setup_useremail();
3361     setup_gitattrs();
3362 }
3363
3364 sub check_gitattrs ($$) {
3365     my ($treeish, $what) = @_;
3366
3367     return if is_gitattrs_setup;
3368
3369     local $/="\0";
3370     my @cmd = (@git, qw(ls-tree -lrz --), "${treeish}:");
3371     debugcmd "|",@cmd;
3372     my $gafl = new IO::File;
3373     open $gafl, "-|", @cmd or die $!;
3374     while (<$gafl>) {
3375         chomp or die;
3376         s/^\d+\s+\w+\s+\w+\s+(\d+)\t// or die;
3377         next if $1 == 0;
3378         next unless m{(?:^|/)\.gitattributes$};
3379
3380         # oh dear, found one
3381         print STDERR <<END;
3382 dgit: warning: $what contains .gitattributes
3383 dgit: .gitattributes have not been defused.  Recommended: dgit setup-new-tree.
3384 END
3385         close $gafl;
3386         return;
3387     }
3388     # tree contains no .gitattributes files
3389     $?=0; $!=0; close $gafl or failedcmd @cmd;
3390 }
3391
3392
3393 sub multisuite_suite_child ($$$) {
3394     my ($tsuite, $merginputs, $fn) = @_;
3395     # in child, sets things up, calls $fn->(), and returns undef
3396     # in parent, returns canonical suite name for $tsuite
3397     my $canonsuitefh = IO::File::new_tmpfile;
3398     my $pid = fork // die $!;
3399     if (!$pid) {
3400         forkcheck_setup();
3401         $isuite = $tsuite;
3402         $us .= " [$isuite]";
3403         $debugprefix .= " ";
3404         progress "fetching $tsuite...";
3405         canonicalise_suite();
3406         print $canonsuitefh $csuite, "\n" or die $!;
3407         close $canonsuitefh or die $!;
3408         $fn->();
3409         return undef;
3410     }
3411     waitpid $pid,0 == $pid or die $!;
3412     fail "failed to obtain $tsuite: ".waitstatusmsg() if $? && $?!=256*4;
3413     seek $canonsuitefh,0,0 or die $!;
3414     local $csuite = <$canonsuitefh>;
3415     die $! unless defined $csuite && chomp $csuite;
3416     if ($? == 256*4) {
3417         printdebug "multisuite $tsuite missing\n";
3418         return $csuite;
3419     }
3420     printdebug "multisuite $tsuite ok (canon=$csuite)\n";
3421     push @$merginputs, {
3422         Ref => lrref,
3423         Info => $csuite,
3424     };
3425     return $csuite;
3426 }
3427
3428 sub fork_for_multisuite ($) {
3429     my ($before_fetch_merge) = @_;
3430     # if nothing unusual, just returns ''
3431     #
3432     # if multisuite:
3433     # returns 0 to caller in child, to do first of the specified suites
3434     # in child, $csuite is not yet set
3435     #
3436     # returns 1 to caller in parent, to finish up anything needed after
3437     # in parent, $csuite is set to canonicalised portmanteau
3438
3439     my $org_isuite = $isuite;
3440     my @suites = split /\,/, $isuite;
3441     return '' unless @suites > 1;
3442     printdebug "fork_for_multisuite: @suites\n";
3443
3444     my @mergeinputs;
3445
3446     my $cbasesuite = multisuite_suite_child($suites[0], \@mergeinputs,
3447                                             sub { });
3448     return 0 unless defined $cbasesuite;
3449
3450     fail "package $package missing in (base suite) $cbasesuite"
3451         unless @mergeinputs;
3452
3453     my @csuites = ($cbasesuite);
3454
3455     $before_fetch_merge->();
3456
3457     foreach my $tsuite (@suites[1..$#suites]) {
3458         $tsuite =~ s/^-/$cbasesuite-/;
3459         my $csubsuite = multisuite_suite_child($tsuite, \@mergeinputs,
3460                                                sub {
3461             @end = ();
3462             fetch();
3463             exit 0;
3464         });
3465         # xxx collecte the ref here
3466
3467         $csubsuite =~ s/^\Q$cbasesuite\E-/-/;
3468         push @csuites, $csubsuite;
3469     }
3470
3471     foreach my $mi (@mergeinputs) {
3472         my $ref = git_get_ref $mi->{Ref};
3473         die "$mi->{Ref} ?" unless length $ref;
3474         $mi->{Commit} = $ref;
3475     }
3476
3477     $csuite = join ",", @csuites;
3478
3479     my $previous = git_get_ref lrref;
3480     if ($previous) {
3481         unshift @mergeinputs, {
3482             Commit => $previous,
3483             Info => "local combined tracking branch",
3484             Warning =>
3485  "archive seems to have rewound: local tracking branch is ahead!",
3486         };
3487     }
3488
3489     foreach my $ix (0..$#mergeinputs) {
3490         $mergeinputs[$ix]{Index} = $ix;
3491     }
3492
3493     @mergeinputs = sort {
3494         -version_compare(mergeinfo_version $a,
3495                          mergeinfo_version $b) # highest version first
3496             or
3497         $a->{Index} <=> $b->{Index}; # earliest in spec first
3498     } @mergeinputs;
3499
3500     my @needed;
3501
3502   NEEDED:
3503     foreach my $mi (@mergeinputs) {
3504         printdebug "multisuite merge check $mi->{Info}\n";
3505         foreach my $previous (@needed) {
3506             next unless is_fast_fwd $mi->{Commit}, $previous->{Commit};
3507             printdebug "multisuite merge un-needed $previous->{Info}\n";
3508             next NEEDED;
3509         }
3510         push @needed, $mi;
3511         printdebug "multisuite merge this-needed\n";
3512         $mi->{Character} = '+';
3513     }
3514
3515     $needed[0]{Character} = '*';
3516
3517     my $output = $needed[0]{Commit};
3518
3519     if (@needed > 1) {
3520         printdebug "multisuite merge nontrivial\n";
3521         my $tree = cmdoutput qw(git rev-parse), $needed[0]{Commit}.':';
3522
3523         my $commit = "tree $tree\n";
3524         my $msg = "Combine archive branches $csuite [dgit]\n\n".
3525             "Input branches:\n";
3526
3527         foreach my $mi (sort { $a->{Index} <=> $b->{Index} } @mergeinputs) {
3528             printdebug "multisuite merge include $mi->{Info}\n";
3529             $mi->{Character} //= ' ';
3530             $commit .= "parent $mi->{Commit}\n";
3531             $msg .= sprintf " %s  %-25s %s\n",
3532                 $mi->{Character},
3533                 (mergeinfo_version $mi),
3534                 $mi->{Info};
3535         }
3536         my $authline = clogp_authline mergeinfo_getclogp $needed[0];
3537         $msg .= "\nKey\n".
3538             " * marks the highest version branch, which choose to use\n".
3539             " + marks each branch which was not already an ancestor\n\n".
3540             "[dgit multi-suite $csuite]\n";
3541         $commit .=
3542             "author $authline\n".
3543             "committer $authline\n\n";
3544         $output = make_commit_text $commit.$msg;
3545         printdebug "multisuite merge generated $output\n";
3546     }
3547
3548     fetch_from_archive_record_1($output);
3549     fetch_from_archive_record_2($output);
3550
3551     progress "calculated combined tracking suite $csuite";
3552
3553     return 1;
3554 }
3555
3556 sub clone_set_head () {
3557     open H, "> .git/HEAD" or die $!;
3558     print H "ref: ".lref()."\n" or die $!;
3559     close H or die $!;
3560 }
3561 sub clone_finish ($) {
3562     my ($dstdir) = @_;
3563     runcmd @git, qw(reset --hard), lrref();
3564     runcmd qw(bash -ec), <<'END';
3565         set -o pipefail
3566         git ls-tree -r --name-only -z HEAD | \
3567         xargs -0r touch -h -r . --
3568 END
3569     printdone "ready for work in $dstdir";
3570 }
3571
3572 sub clone ($) {
3573     # in multisuite, returns twice!
3574     # once in parent after first suite fetched,
3575     # and then again in child after everything is finished
3576     my ($dstdir) = @_;
3577     badusage "dry run makes no sense with clone" unless act_local();
3578
3579     my $multi_fetched = fork_for_multisuite(sub {
3580         printdebug "multi clone before fetch merge\n";
3581         changedir $dstdir;
3582     });
3583     if ($multi_fetched) {
3584         printdebug "multi clone after fetch merge\n";
3585         clone_set_head();
3586         clone_finish($dstdir);
3587         return;
3588     }
3589     printdebug "clone main body\n";
3590
3591     canonicalise_suite();
3592     my $hasgit = check_for_git();
3593     mkdir $dstdir or fail "create \`$dstdir': $!";
3594     changedir $dstdir;
3595     runcmd @git, qw(init -q);
3596     setup_new_tree();
3597     clone_set_head();
3598     my $giturl = access_giturl(1);
3599     if (defined $giturl) {
3600         runcmd @git, qw(remote add), 'origin', $giturl;
3601     }
3602     if ($hasgit) {
3603         progress "fetching existing git history";
3604         git_fetch_us();
3605         runcmd_ordryrun_local @git, qw(fetch origin);
3606     } else {
3607         progress "starting new git history";
3608     }
3609     fetch_from_archive() or no_such_package;
3610     my $vcsgiturl = $dsc->{'Vcs-Git'};
3611     if (length $vcsgiturl) {
3612         $vcsgiturl =~ s/\s+-b\s+\S+//g;
3613         runcmd @git, qw(remote add vcs-git), $vcsgiturl;
3614     }
3615     clone_finish($dstdir);
3616 }
3617
3618 sub fetch () {
3619     canonicalise_suite();
3620     if (check_for_git()) {
3621         git_fetch_us();
3622     }
3623     fetch_from_archive() or no_such_package();
3624     printdone "fetched into ".lrref();
3625 }
3626
3627 sub pull () {
3628     my $multi_fetched = fork_for_multisuite(sub { });
3629     fetch() unless $multi_fetched; # parent
3630     return if $multi_fetched eq '0'; # child
3631     runcmd_ordryrun_local @git, qw(merge -m),"Merge from $csuite [dgit]",
3632         lrref();
3633     printdone "fetched to ".lrref()." and merged into HEAD";
3634 }
3635
3636 sub check_not_dirty () {
3637     foreach my $f (qw(local-options local-patch-header)) {
3638         if (stat_exists "debian/source/$f") {
3639             fail "git tree contains debian/source/$f";
3640         }
3641     }
3642
3643     return if $ignoredirty;
3644
3645     my @cmd = (@git, qw(diff --quiet HEAD));
3646     debugcmd "+",@cmd;
3647     $!=0; $?=-1; system @cmd;
3648     return if !$?;
3649     if ($?==256) {
3650         fail "working tree is dirty (does not match HEAD)";
3651     } else {
3652         failedcmd @cmd;
3653     }
3654 }
3655
3656 sub commit_admin ($) {
3657     my ($m) = @_;
3658     progress "$m";
3659     runcmd_ordryrun_local @git, qw(commit -m), $m;
3660 }
3661
3662 sub commit_quilty_patch () {
3663     my $output = cmdoutput @git, qw(status --porcelain);
3664     my %adds;
3665     foreach my $l (split /\n/, $output) {
3666         next unless $l =~ m/\S/;
3667         if ($l =~ m{^(?:\?\?| M) (.pc|debian/patches)}) {
3668             $adds{$1}++;
3669         }
3670     }
3671     delete $adds{'.pc'}; # if there wasn't one before, don't add it
3672     if (!%adds) {
3673         progress "nothing quilty to commit, ok.";
3674         return;
3675     }
3676     my @adds = map { s/[][*?\\]/\\$&/g; $_; } sort keys %adds;
3677     runcmd_ordryrun_local @git, qw(add -f), @adds;
3678     commit_admin <<END
3679 Commit Debian 3.0 (quilt) metadata
3680
3681 [dgit ($our_version) quilt-fixup]
3682 END
3683 }
3684
3685 sub get_source_format () {
3686     my %options;
3687     if (open F, "debian/source/options") {
3688         while (<F>) {
3689             next if m/^\s*\#/;
3690             next unless m/\S/;
3691             s/\s+$//; # ignore missing final newline
3692             if (m/\s*\#\s*/) {
3693                 my ($k, $v) = ($`, $'); #');
3694                 $v =~ s/^"(.*)"$/$1/;
3695                 $options{$k} = $v;
3696             } else {
3697                 $options{$_} = 1;
3698             }
3699         }
3700         F->error and die $!;
3701         close F;
3702     } else {
3703         die $! unless $!==&ENOENT;
3704     }
3705
3706     if (!open F, "debian/source/format") {
3707         die $! unless $!==&ENOENT;
3708         return '';
3709     }
3710     $_ = <F>;
3711     F->error and die $!;
3712     chomp;
3713     return ($_, \%options);
3714 }
3715
3716 sub madformat_wantfixup ($) {
3717     my ($format) = @_;
3718     return 0 unless $format eq '3.0 (quilt)';
3719     our $quilt_mode_warned;