chiark / gitweb /
dgit: dsc Dgit field handling: Parse additional data
[dgit.git] / dgit
1 #!/usr/bin/perl -w
2 # dgit
3 # Integration between git and Debian-style archives
4 #
5 # Copyright (C)2013-2016 Ian Jackson
6 #
7 # This program is free software: you can redistribute it and/or modify
8 # it under the terms of the GNU General Public License as published by
9 # the Free Software Foundation, either version 3 of the License, or
10 # (at your option) any later version.
11 #
12 # This program is distributed in the hope that it will be useful,
13 # but WITHOUT ANY WARRANTY; without even the implied warranty of
14 # MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
15 # GNU General Public License for more details.
16 #
17 # You should have received a copy of the GNU General Public License
18 # along with this program.  If not, see <http://www.gnu.org/licenses/>.
19
20 use strict;
21
22 use Debian::Dgit;
23 setup_sigwarn();
24
25 use IO::Handle;
26 use Data::Dumper;
27 use LWP::UserAgent;
28 use Dpkg::Control::Hash;
29 use File::Path;
30 use File::Temp qw(tempdir);
31 use File::Basename;
32 use Dpkg::Version;
33 use POSIX;
34 use IPC::Open2;
35 use Digest::SHA;
36 use Digest::MD5;
37 use List::Util qw(any);
38 use List::MoreUtils qw(pairwise);
39 use Text::Glob qw(match_glob);
40 use Fcntl qw(:DEFAULT :flock);
41 use Carp;
42
43 use Debian::Dgit;
44
45 our $our_version = 'UNRELEASED'; ###substituted###
46 our $absurdity = undef; ###substituted###
47
48 our @rpushprotovsn_support = qw(4 3 2); # 4 is new tag format
49 our $protovsn;
50
51 our $isuite = 'unstable';
52 our $idistro;
53 our $package;
54 our @ropts;
55
56 our $sign = 1;
57 our $dryrun_level = 0;
58 our $changesfile;
59 our $buildproductsdir = '..';
60 our $new_package = 0;
61 our $ignoredirty = 0;
62 our $rmonerror = 1;
63 our @deliberatelies;
64 our %previously;
65 our $existing_package = 'dpkg';
66 our $cleanmode;
67 our $changes_since_version;
68 our $rmchanges;
69 our $overwrite_version; # undef: not specified; '': check changelog
70 our $quilt_mode;
71 our $quilt_modes_re = 'linear|smash|auto|nofix|nocheck|gbp|dpm|unapplied';
72 our $dodep14tag;
73 our $dodep14tag_re = 'want|no|always';
74 our $split_brain_save;
75 our $we_are_responder;
76 our $initiator_tempdir;
77 our $patches_applied_dirtily = 00;
78 our $tagformat_want;
79 our $tagformat;
80 our $tagformatfn;
81
82 our %forceopts = map { $_=>0 }
83     qw(unrepresentable unsupported-source-format
84        dsc-changes-mismatch changes-origs-exactly
85        import-gitapply-absurd
86        import-gitapply-no-absurd
87        import-dsc-with-dgit-field);
88
89 our %format_ok = map { $_=>1 } ("1.0","3.0 (native)","3.0 (quilt)");
90
91 our $suite_re = '[-+.0-9a-z]+';
92 our $cleanmode_re = 'dpkg-source(?:-d)?|git|git-ff|check|none';
93 our $orig_f_comp_re = 'orig(?:-[-0-9a-z]+)?';
94 our $orig_f_sig_re = '\\.(?:asc|gpg|pgp)';
95 our $orig_f_tail_re = "$orig_f_comp_re\\.tar(?:\\.\\w+)?(?:$orig_f_sig_re)?";
96
97 our $git_authline_re = '^([^<>]+) \<(\S+)\> (\d+ [-+]\d+)$';
98 our $splitbraincache = 'dgit-intern/quilt-cache';
99 our $rewritemap = 'dgit-rewrite/map';
100
101 our (@git) = qw(git);
102 our (@dget) = qw(dget);
103 our (@curl) = qw(curl);
104 our (@dput) = qw(dput);
105 our (@debsign) = qw(debsign);
106 our (@gpg) = qw(gpg);
107 our (@sbuild) = qw(sbuild);
108 our (@ssh) = 'ssh';
109 our (@dgit) = qw(dgit);
110 our (@aptget) = qw(apt-get);
111 our (@aptcache) = qw(apt-cache);
112 our (@dpkgbuildpackage) = qw(dpkg-buildpackage -i\.git/ -I.git);
113 our (@dpkgsource) = qw(dpkg-source -i\.git/ -I.git);
114 our (@dpkggenchanges) = qw(dpkg-genchanges);
115 our (@mergechanges) = qw(mergechanges -f);
116 our (@gbp_build) = ('');
117 our (@gbp_pq) = ('gbp pq');
118 our (@changesopts) = ('');
119
120 our %opts_opt_map = ('dget' => \@dget, # accept for compatibility
121                      'curl' => \@curl,
122                      'dput' => \@dput,
123                      'debsign' => \@debsign,
124                      'gpg' => \@gpg,
125                      'sbuild' => \@sbuild,
126                      'ssh' => \@ssh,
127                      'dgit' => \@dgit,
128                      'git' => \@git,
129                      'apt-get' => \@aptget,
130                      'apt-cache' => \@aptcache,
131                      'dpkg-source' => \@dpkgsource,
132                      'dpkg-buildpackage' => \@dpkgbuildpackage,
133                      'dpkg-genchanges' => \@dpkggenchanges,
134                      'gbp-build' => \@gbp_build,
135                      'gbp-pq' => \@gbp_pq,
136                      'ch' => \@changesopts,
137                      'mergechanges' => \@mergechanges);
138
139 our %opts_opt_cmdonly = ('gpg' => 1, 'git' => 1);
140 our %opts_cfg_insertpos = map {
141     $_,
142     scalar @{ $opts_opt_map{$_} }
143 } keys %opts_opt_map;
144
145 sub parseopts_late_defaults();
146
147 our $keyid;
148
149 autoflush STDOUT 1;
150
151 our $supplementary_message = '';
152 our $need_split_build_invocation = 0;
153 our $split_brain = 0;
154
155 END {
156     local ($@, $?);
157     print STDERR "! $_\n" foreach $supplementary_message =~ m/^.+$/mg;
158 }
159
160 our $remotename = 'dgit';
161 our @ourdscfield = qw(Dgit Vcs-Dgit-Master);
162 our $csuite;
163 our $instead_distro;
164
165 if (!defined $absurdity) {
166     $absurdity = $0;
167     $absurdity =~ s{/[^/]+$}{/absurd} or die;
168 }
169
170 sub debiantag ($$) {
171     my ($v,$distro) = @_;
172     return $tagformatfn->($v, $distro);
173 }
174
175 sub debiantag_maintview ($$) { 
176     my ($v,$distro) = @_;
177     return "$distro/".dep14_version_mangle $v;
178 }
179
180 sub madformat ($) { $_[0] eq '3.0 (quilt)' }
181
182 sub lbranch () { return "$branchprefix/$csuite"; }
183 my $lbranch_re = '^refs/heads/'.$branchprefix.'/([^/.]+)$';
184 sub lref () { return "refs/heads/".lbranch(); }
185 sub lrref () { return "refs/remotes/$remotename/".server_branch($csuite); }
186 sub rrref () { return server_ref($csuite); }
187
188 sub lrfetchrefs () { return "refs/dgit-fetch/$csuite"; }
189 sub lrfetchref () { return lrfetchrefs.'/'.server_branch($csuite); }
190
191 # We fetch some parts of lrfetchrefs/*.  Ideally we delete these
192 # locally fetched refs because they have unhelpful names and clutter
193 # up gitk etc.  So we track whether we have "used up" head ref (ie,
194 # whether we have made another local ref which refers to this object).
195 #
196 # (If we deleted them unconditionally, then we might end up
197 # re-fetching the same git objects each time dgit fetch was run.)
198 #
199 # So, leach use of lrfetchrefs needs to be accompanied by arrangements
200 # in git_fetch_us to fetch the refs in question, and possibly a call
201 # to lrfetchref_used.
202
203 our (%lrfetchrefs_f, %lrfetchrefs_d);
204 # $lrfetchrefs_X{lrfetchrefs."/heads/whatever"} = $objid
205
206 sub lrfetchref_used ($) {
207     my ($fullrefname) = @_;
208     my $objid = $lrfetchrefs_f{$fullrefname};
209     $lrfetchrefs_d{$fullrefname} = $objid if defined $objid;
210 }
211
212 sub stripepoch ($) {
213     my ($vsn) = @_;
214     $vsn =~ s/^\d+\://;
215     return $vsn;
216 }
217
218 sub srcfn ($$) {
219     my ($vsn,$sfx) = @_;
220     return "${package}_".(stripepoch $vsn).$sfx
221 }
222
223 sub dscfn ($) {
224     my ($vsn) = @_;
225     return srcfn($vsn,".dsc");
226 }
227
228 sub changespat ($;$) {
229     my ($vsn, $arch) = @_;
230     return "${package}_".(stripepoch $vsn)."_".($arch//'*').".changes";
231 }
232
233 sub upstreamversion ($) {
234     my ($vsn) = @_;
235     $vsn =~ s/-[^-]+$//;
236     return $vsn;
237 }
238
239 our $us = 'dgit';
240 initdebug('');
241
242 our @end;
243 END { 
244     local ($?);
245     foreach my $f (@end) {
246         eval { $f->(); };
247         print STDERR "$us: cleanup: $@" if length $@;
248     }
249 };
250
251 sub badcfg { print STDERR "$us: invalid configuration: @_\n"; exit 12; }
252
253 sub forceable_fail ($$) {
254     my ($forceoptsl, $msg) = @_;
255     fail $msg unless grep { $forceopts{$_} } @$forceoptsl;
256     print STDERR "warning: overriding problem due to --force:\n". $msg;
257 }
258
259 sub forceing ($) {
260     my ($forceoptsl) = @_;
261     my @got = grep { $forceopts{$_} } @$forceoptsl;
262     return 0 unless @got;
263     print STDERR
264  "warning: skipping checks or functionality due to --force-$got[0]\n";
265 }
266
267 sub no_such_package () {
268     print STDERR "$us: package $package does not exist in suite $isuite\n";
269     exit 4;
270 }
271
272 sub changedir ($) {
273     my ($newdir) = @_;
274     printdebug "CD $newdir\n";
275     chdir $newdir or confess "chdir: $newdir: $!";
276 }
277
278 sub deliberately ($) {
279     my ($enquiry) = @_;
280     return !!grep { $_ eq "--deliberately-$enquiry" } @deliberatelies;
281 }
282
283 sub deliberately_not_fast_forward () {
284     foreach (qw(not-fast-forward fresh-repo)) {
285         return 1 if deliberately($_) || deliberately("TEST-dgit-only-$_");
286     }
287 }
288
289 sub quiltmode_splitbrain () {
290     $quilt_mode =~ m/gbp|dpm|unapplied/;
291 }
292
293 sub opts_opt_multi_cmd {
294     my @cmd;
295     push @cmd, split /\s+/, shift @_;
296     push @cmd, @_;
297     @cmd;
298 }
299
300 sub gbp_pq {
301     return opts_opt_multi_cmd @gbp_pq;
302 }
303
304 #---------- remote protocol support, common ----------
305
306 # remote push initiator/responder protocol:
307 #  $ dgit remote-push-build-host <n-rargs> <rargs>... <push-args>...
308 #  where <rargs> is <push-host-dir> <supported-proto-vsn>,... ...
309 #  < dgit-remote-push-ready <actual-proto-vsn>
310 #
311 # occasionally:
312 #
313 #  > progress NBYTES
314 #  [NBYTES message]
315 #
316 #  > supplementary-message NBYTES          # $protovsn >= 3
317 #  [NBYTES message]
318 #
319 # main sequence:
320 #
321 #  > file parsed-changelog
322 #  [indicates that output of dpkg-parsechangelog follows]
323 #  > data-block NBYTES
324 #  > [NBYTES bytes of data (no newline)]
325 #  [maybe some more blocks]
326 #  > data-end
327 #
328 #  > file dsc
329 #  [etc]
330 #
331 #  > file changes
332 #  [etc]
333 #
334 #  > param head DGIT-VIEW-HEAD
335 #  > param csuite SUITE
336 #  > param tagformat old|new
337 #  > param maint-view MAINT-VIEW-HEAD
338 #
339 #  > previously REFNAME=OBJNAME       # if --deliberately-not-fast-forward
340 #                                     # goes into tag, for replay prevention
341 #
342 #  > want signed-tag
343 #  [indicates that signed tag is wanted]
344 #  < data-block NBYTES
345 #  < [NBYTES bytes of data (no newline)]
346 #  [maybe some more blocks]
347 #  < data-end
348 #  < files-end
349 #
350 #  > want signed-dsc-changes
351 #  < data-block NBYTES    [transfer of signed dsc]
352 #  [etc]
353 #  < data-block NBYTES    [transfer of signed changes]
354 #  [etc]
355 #  < files-end
356 #
357 #  > complete
358
359 our $i_child_pid;
360
361 sub i_child_report () {
362     # Sees if our child has died, and reap it if so.  Returns a string
363     # describing how it died if it failed, or undef otherwise.
364     return undef unless $i_child_pid;
365     my $got = waitpid $i_child_pid, WNOHANG;
366     return undef if $got <= 0;
367     die unless $got == $i_child_pid;
368     $i_child_pid = undef;
369     return undef unless $?;
370     return "build host child ".waitstatusmsg();
371 }
372
373 sub badproto ($$) {
374     my ($fh, $m) = @_;
375     fail "connection lost: $!" if $fh->error;
376     fail "protocol violation; $m not expected";
377 }
378
379 sub badproto_badread ($$) {
380     my ($fh, $wh) = @_;
381     fail "connection lost: $!" if $!;
382     my $report = i_child_report();
383     fail $report if defined $report;
384     badproto $fh, "eof (reading $wh)";
385 }
386
387 sub protocol_expect (&$) {
388     my ($match, $fh) = @_;
389     local $_;
390     $_ = <$fh>;
391     defined && chomp or badproto_badread $fh, "protocol message";
392     if (wantarray) {
393         my @r = &$match;
394         return @r if @r;
395     } else {
396         my $r = &$match;
397         return $r if $r;
398     }
399     badproto $fh, "\`$_'";
400 }
401
402 sub protocol_send_file ($$) {
403     my ($fh, $ourfn) = @_;
404     open PF, "<", $ourfn or die "$ourfn: $!";
405     for (;;) {
406         my $d;
407         my $got = read PF, $d, 65536;
408         die "$ourfn: $!" unless defined $got;
409         last if !$got;
410         print $fh "data-block ".length($d)."\n" or die $!;
411         print $fh $d or die $!;
412     }
413     PF->error and die "$ourfn $!";
414     print $fh "data-end\n" or die $!;
415     close PF;
416 }
417
418 sub protocol_read_bytes ($$) {
419     my ($fh, $nbytes) = @_;
420     $nbytes =~ m/^[1-9]\d{0,5}$|^0$/ or badproto \*RO, "bad byte count";
421     my $d;
422     my $got = read $fh, $d, $nbytes;
423     $got==$nbytes or badproto_badread $fh, "data block";
424     return $d;
425 }
426
427 sub protocol_receive_file ($$) {
428     my ($fh, $ourfn) = @_;
429     printdebug "() $ourfn\n";
430     open PF, ">", $ourfn or die "$ourfn: $!";
431     for (;;) {
432         my ($y,$l) = protocol_expect {
433             m/^data-block (.*)$/ ? (1,$1) :
434             m/^data-end$/ ? (0,) :
435             ();
436         } $fh;
437         last unless $y;
438         my $d = protocol_read_bytes $fh, $l;
439         print PF $d or die $!;
440     }
441     close PF or die $!;
442 }
443
444 #---------- remote protocol support, responder ----------
445
446 sub responder_send_command ($) {
447     my ($command) = @_;
448     return unless $we_are_responder;
449     # called even without $we_are_responder
450     printdebug ">> $command\n";
451     print PO $command, "\n" or die $!;
452 }    
453
454 sub responder_send_file ($$) {
455     my ($keyword, $ourfn) = @_;
456     return unless $we_are_responder;
457     printdebug "]] $keyword $ourfn\n";
458     responder_send_command "file $keyword";
459     protocol_send_file \*PO, $ourfn;
460 }
461
462 sub responder_receive_files ($@) {
463     my ($keyword, @ourfns) = @_;
464     die unless $we_are_responder;
465     printdebug "[[ $keyword @ourfns\n";
466     responder_send_command "want $keyword";
467     foreach my $fn (@ourfns) {
468         protocol_receive_file \*PI, $fn;
469     }
470     printdebug "[[\$\n";
471     protocol_expect { m/^files-end$/ } \*PI;
472 }
473
474 #---------- remote protocol support, initiator ----------
475
476 sub initiator_expect (&) {
477     my ($match) = @_;
478     protocol_expect { &$match } \*RO;
479 }
480
481 #---------- end remote code ----------
482
483 sub progress {
484     if ($we_are_responder) {
485         my $m = join '', @_;
486         responder_send_command "progress ".length($m) or die $!;
487         print PO $m or die $!;
488     } else {
489         print @_, "\n";
490     }
491 }
492
493 our $ua;
494
495 sub url_get {
496     if (!$ua) {
497         $ua = LWP::UserAgent->new();
498         $ua->env_proxy;
499     }
500     my $what = $_[$#_];
501     progress "downloading $what...";
502     my $r = $ua->get(@_) or die $!;
503     return undef if $r->code == 404;
504     $r->is_success or fail "failed to fetch $what: ".$r->status_line;
505     return $r->decoded_content(charset => 'none');
506 }
507
508 our ($dscdata,$dscurl,$dsc,$dsc_checked,$skew_warning_vsn);
509
510 sub runcmd {
511     debugcmd "+",@_;
512     $!=0; $?=-1;
513     failedcmd @_ if system @_;
514 }
515
516 sub act_local () { return $dryrun_level <= 1; }
517 sub act_scary () { return !$dryrun_level; }
518
519 sub printdone {
520     if (!$dryrun_level) {
521         progress "$us ok: @_";
522     } else {
523         progress "would be ok: @_ (but dry run only)";
524     }
525 }
526
527 sub dryrun_report {
528     printcmd(\*STDERR,$debugprefix."#",@_);
529 }
530
531 sub runcmd_ordryrun {
532     if (act_scary()) {
533         runcmd @_;
534     } else {
535         dryrun_report @_;
536     }
537 }
538
539 sub runcmd_ordryrun_local {
540     if (act_local()) {
541         runcmd @_;
542     } else {
543         dryrun_report @_;
544     }
545 }
546
547 sub shell_cmd {
548     my ($first_shell, @cmd) = @_;
549     return qw(sh -ec), $first_shell.'; exec "$@"', 'x', @cmd;
550 }
551
552 our $helpmsg = <<END;
553 main usages:
554   dgit [dgit-opts] clone [dgit-opts] package [suite] [./dir|/dir]
555   dgit [dgit-opts] fetch|pull [dgit-opts] [suite]
556   dgit [dgit-opts] build [dpkg-buildpackage-opts]
557   dgit [dgit-opts] sbuild [sbuild-opts]
558   dgit [dgit-opts] push [dgit-opts] [suite]
559   dgit [dgit-opts] rpush build-host:build-dir ...
560 important dgit options:
561   -k<keyid>           sign tag and package with <keyid> instead of default
562   --dry-run -n        do not change anything, but go through the motions
563   --damp-run -L       like --dry-run but make local changes, without signing
564   --new -N            allow introducing a new package
565   --debug -D          increase debug level
566   -c<name>=<value>    set git config option (used directly by dgit too)
567 END
568
569 our $later_warning_msg = <<END;
570 Perhaps the upload is stuck in incoming.  Using the version from git.
571 END
572
573 sub badusage {
574     print STDERR "$us: @_\n", $helpmsg or die $!;
575     exit 8;
576 }
577
578 sub nextarg {
579     @ARGV or badusage "too few arguments";
580     return scalar shift @ARGV;
581 }
582
583 sub cmd_help () {
584     print $helpmsg or die $!;
585     exit 0;
586 }
587
588 our $td = $ENV{DGIT_TEST_DUMMY_DIR} || "DGIT_TEST_DUMMY_DIR-unset";
589
590 our %defcfg = ('dgit.default.distro' => 'debian',
591                'dgit-suite.*-security.distro' => 'debian-security',
592                'dgit.default.username' => '',
593                'dgit.default.archive-query-default-component' => 'main',
594                'dgit.default.ssh' => 'ssh',
595                'dgit.default.archive-query' => 'madison:',
596                'dgit.default.sshpsql-dbname' => 'service=projectb',
597                'dgit.default.aptget-components' => 'main',
598                'dgit.default.dgit-tag-format' => 'new,old,maint',
599                # old means "repo server accepts pushes with old dgit tags"
600                # new means "repo server accepts pushes with new dgit tags"
601                # maint means "repo server accepts split brain pushes"
602                # hist means "repo server may have old pushes without new tag"
603                #   ("hist" is implied by "old")
604                'dgit-distro.debian.archive-query' => 'ftpmasterapi:',
605                'dgit-distro.debian.git-check' => 'url',
606                'dgit-distro.debian.git-check-suffix' => '/info/refs',
607                'dgit-distro.debian.new-private-pushers' => 't',
608                'dgit-distro.debian/push.git-url' => '',
609                'dgit-distro.debian/push.git-host' => 'push.dgit.debian.org',
610                'dgit-distro.debian/push.git-user-force' => 'dgit',
611                'dgit-distro.debian/push.git-proto' => 'git+ssh://',
612                'dgit-distro.debian/push.git-path' => '/dgit/debian/repos',
613                'dgit-distro.debian/push.git-create' => 'true',
614                'dgit-distro.debian/push.git-check' => 'ssh-cmd',
615  'dgit-distro.debian.archive-query-url', 'https://api.ftp-master.debian.org/',
616 # 'dgit-distro.debian.archive-query-tls-key',
617 #    '/etc/ssl/certs/%HOST%.pem:/etc/dgit/%HOST%.pem',
618 # ^ this does not work because curl is broken nowadays
619 # Fixing #790093 properly will involve providing providing the key
620 # in some pacagke and maybe updating these paths.
621 #
622 # 'dgit-distro.debian.archive-query-tls-curl-args',
623 #   '--ca-path=/etc/ssl/ca-debian',
624 # ^ this is a workaround but works (only) on DSA-administered machines
625                'dgit-distro.debian.git-url' => 'https://git.dgit.debian.org',
626                'dgit-distro.debian.git-url-suffix' => '',
627                'dgit-distro.debian.upload-host' => 'ftp-master', # for dput
628                'dgit-distro.debian.mirror' => 'http://ftp.debian.org/debian/',
629  'dgit-distro.debian-security.archive-query' => 'aptget:',
630  'dgit-distro.debian-security.mirror' => 'http://security.debian.org/debian-security/',
631  'dgit-distro.debian-security.aptget-suite-map' => 's#-security$#/updates#',
632  'dgit-distro.debian-security.aptget-suite-rmap' => 's#$#-security#',
633  'dgit-distro.debian-security.nominal-distro' => 'debian',
634  'dgit-distro.debian.backports-quirk' => '(squeeze)-backports*',
635  'dgit-distro.debian-backports.mirror' => 'http://backports.debian.org/debian-backports/',
636                'dgit-distro.ubuntu.git-check' => 'false',
637  'dgit-distro.ubuntu.mirror' => 'http://archive.ubuntu.com/ubuntu',
638                'dgit-distro.test-dummy.ssh' => "$td/ssh",
639                'dgit-distro.test-dummy.username' => "alice",
640                'dgit-distro.test-dummy.git-check' => "ssh-cmd",
641                'dgit-distro.test-dummy.git-create' => "ssh-cmd",
642                'dgit-distro.test-dummy.git-url' => "$td/git",
643                'dgit-distro.test-dummy.git-host' => "git",
644                'dgit-distro.test-dummy.git-path' => "$td/git",
645                'dgit-distro.test-dummy.archive-query' => "dummycatapi:",
646                'dgit-distro.test-dummy.archive-query-url' => "file://$td/aq/",
647                'dgit-distro.test-dummy.mirror' => "file://$td/mirror/",
648                'dgit-distro.test-dummy.upload-host' => 'test-dummy',
649                );
650
651 our %gitcfgs;
652 our @gitcfgsources = qw(cmdline local global system);
653
654 sub git_slurp_config () {
655     local ($debuglevel) = $debuglevel-2;
656     local $/="\0";
657
658     # This algoritm is a bit subtle, but this is needed so that for
659     # options which we want to be single-valued, we allow the
660     # different config sources to override properly.  See #835858.
661     foreach my $src (@gitcfgsources) {
662         next if $src eq 'cmdline';
663         # we do this ourselves since git doesn't handle it
664         
665         my @cmd = (@git, qw(config -z --get-regexp), "--$src", qw(.*));
666         debugcmd "|",@cmd;
667
668         open GITS, "-|", @cmd or die $!;
669         while (<GITS>) {
670             chomp or die;
671             printdebug "=> ", (messagequote $_), "\n";
672             m/\n/ or die "$_ ?";
673             push @{ $gitcfgs{$src}{$`} }, $'; #';
674         }
675         $!=0; $?=0;
676         close GITS
677             or ($!==0 && $?==256)
678             or failedcmd @cmd;
679     }
680 }
681
682 sub git_get_config ($) {
683     my ($c) = @_;
684     foreach my $src (@gitcfgsources) {
685         my $l = $gitcfgs{$src}{$c};
686         printdebug"C $c ".(defined $l ? messagequote "'$l'" : "undef")."\n"
687             if $debuglevel >= 4;
688         $l or next;
689         @$l==1 or badcfg "multiple values for $c".
690             " (in $src git config)" if @$l > 1;
691         return $l->[0];
692     }
693     return undef;
694 }
695
696 sub cfg {
697     foreach my $c (@_) {
698         return undef if $c =~ /RETURN-UNDEF/;
699         my $v = git_get_config($c);
700         return $v if defined $v;
701         my $dv = $defcfg{$c};
702         return $dv if defined $dv;
703     }
704     badcfg "need value for one of: @_\n".
705         "$us: distro or suite appears not to be (properly) supported";
706 }
707
708 sub access_basedistro () {
709     if (defined $idistro) {
710         return $idistro;
711     } else {    
712         my $def = cfg("dgit-suite.$isuite.distro", 'RETURN-UNDEF');
713         return $def if defined $def;
714         foreach my $src (@gitcfgsources, 'internal') {
715             my $kl = $src eq 'internal' ? \%defcfg : $gitcfgs{$src};
716             next unless $kl;
717             foreach my $k (keys %$kl) {
718                 next unless $k =~ m#^dgit-suite\.(.*)\.distro$#;
719                 my $dpat = $1;
720                 next unless match_glob $dpat, $isuite;
721                 return $kl->{$k};
722             }
723         }
724         return cfg("dgit.default.distro");
725     }
726 }
727
728 sub access_nomdistro () {
729     my $base = access_basedistro();
730     my $r = cfg("dgit-distro.$base.nominal-distro",'RETURN-UNDEF') // $base;
731     $r =~ m/^$distro_re$/ or badcfg
732  "bad syntax for (nominal) distro \`$r' (does not match /^$distro_re$/)";
733     return $r;
734 }
735
736 sub access_quirk () {
737     # returns (quirk name, distro to use instead or undef, quirk-specific info)
738     my $basedistro = access_basedistro();
739     my $backports_quirk = cfg("dgit-distro.$basedistro.backports-quirk",
740                               'RETURN-UNDEF');
741     if (defined $backports_quirk) {
742         my $re = $backports_quirk;
743         $re =~ s/[^-0-9a-z_\%*()]/\\$&/ig;
744         $re =~ s/\*/.*/g;
745         $re =~ s/\%/([-0-9a-z_]+)/
746             or $re =~ m/[()]/ or badcfg "backports-quirk needs \% or ( )";
747         if ($isuite =~ m/^$re$/) {
748             return ('backports',"$basedistro-backports",$1);
749         }
750     }
751     return ('none',undef);
752 }
753
754 our $access_forpush;
755
756 sub parse_cfg_bool ($$$) {
757     my ($what,$def,$v) = @_;
758     $v //= $def;
759     return
760         $v =~ m/^[ty1]/ ? 1 :
761         $v =~ m/^[fn0]/ ? 0 :
762         badcfg "$what needs t (true, y, 1) or f (false, n, 0) not \`$v'";
763 }       
764
765 sub access_forpush_config () {
766     my $d = access_basedistro();
767
768     return 1 if
769         $new_package &&
770         parse_cfg_bool('new-private-pushers', 0,
771                        cfg("dgit-distro.$d.new-private-pushers",
772                            'RETURN-UNDEF'));
773
774     my $v = cfg("dgit-distro.$d.readonly", 'RETURN-UNDEF');
775     $v //= 'a';
776     return
777         $v =~ m/^[ty1]/ ? 0 : # force readonly,    forpush = 0
778         $v =~ m/^[fn0]/ ? 1 : # force nonreadonly, forpush = 1
779         $v =~ m/^[a]/  ? '' : # auto,              forpush = ''
780         badcfg "readonly needs t (true, y, 1) or f (false, n, 0) or a (auto)";
781 }
782
783 sub access_forpush () {
784     $access_forpush //= access_forpush_config();
785     return $access_forpush;
786 }
787
788 sub pushing () {
789     die "$access_forpush ?" if ($access_forpush // 1) ne 1;
790     badcfg "pushing but distro is configured readonly"
791         if access_forpush_config() eq '0';
792     $access_forpush = 1;
793     $supplementary_message = <<'END' unless $we_are_responder;
794 Push failed, before we got started.
795 You can retry the push, after fixing the problem, if you like.
796 END
797     parseopts_late_defaults();
798 }
799
800 sub notpushing () {
801     parseopts_late_defaults();
802 }
803
804 sub supplementary_message ($) {
805     my ($msg) = @_;
806     if (!$we_are_responder) {
807         $supplementary_message = $msg;
808         return;
809     } elsif ($protovsn >= 3) {
810         responder_send_command "supplementary-message ".length($msg)
811             or die $!;
812         print PO $msg or die $!;
813     }
814 }
815
816 sub access_distros () {
817     # Returns list of distros to try, in order
818     #
819     # We want to try:
820     #    0. `instead of' distro name(s) we have been pointed to
821     #    1. the access_quirk distro, if any
822     #    2a. the user's specified distro, or failing that  } basedistro
823     #    2b. the distro calculated from the suite          }
824     my @l = access_basedistro();
825
826     my (undef,$quirkdistro) = access_quirk();
827     unshift @l, $quirkdistro;
828     unshift @l, $instead_distro;
829     @l = grep { defined } @l;
830
831     push @l, access_nomdistro();
832
833     if (access_forpush()) {
834         @l = map { ("$_/push", $_) } @l;
835     }
836     @l;
837 }
838
839 sub access_cfg_cfgs (@) {
840     my (@keys) = @_;
841     my @cfgs;
842     # The nesting of these loops determines the search order.  We put
843     # the key loop on the outside so that we search all the distros
844     # for each key, before going on to the next key.  That means that
845     # if access_cfg is called with a more specific, and then a less
846     # specific, key, an earlier distro can override the less specific
847     # without necessarily overriding any more specific keys.  (If the
848     # distro wants to override the more specific keys it can simply do
849     # so; whereas if we did the loop the other way around, it would be
850     # impossible to for an earlier distro to override a less specific
851     # key but not the more specific ones without restating the unknown
852     # values of the more specific keys.
853     my @realkeys;
854     my @rundef;
855     # We have to deal with RETURN-UNDEF specially, so that we don't
856     # terminate the search prematurely.
857     foreach (@keys) {
858         if (m/RETURN-UNDEF/) { push @rundef, $_; last; }
859         push @realkeys, $_
860     }
861     foreach my $d (access_distros()) {
862         push @cfgs, map { "dgit-distro.$d.$_" } @realkeys;
863     }
864     push @cfgs, map { "dgit.default.$_" } @realkeys;
865     push @cfgs, @rundef;
866     return @cfgs;
867 }
868
869 sub access_cfg (@) {
870     my (@keys) = @_;
871     my (@cfgs) = access_cfg_cfgs(@keys);
872     my $value = cfg(@cfgs);
873     return $value;
874 }
875
876 sub access_cfg_bool ($$) {
877     my ($def, @keys) = @_;
878     parse_cfg_bool($keys[0], $def, access_cfg(@keys, 'RETURN-UNDEF'));
879 }
880
881 sub string_to_ssh ($) {
882     my ($spec) = @_;
883     if ($spec =~ m/\s/) {
884         return qw(sh -ec), 'exec '.$spec.' "$@"', 'x';
885     } else {
886         return ($spec);
887     }
888 }
889
890 sub access_cfg_ssh () {
891     my $gitssh = access_cfg('ssh', 'RETURN-UNDEF');
892     if (!defined $gitssh) {
893         return @ssh;
894     } else {
895         return string_to_ssh $gitssh;
896     }
897 }
898
899 sub access_runeinfo ($) {
900     my ($info) = @_;
901     return ": dgit ".access_basedistro()." $info ;";
902 }
903
904 sub access_someuserhost ($) {
905     my ($some) = @_;
906     my $user = access_cfg("$some-user-force", 'RETURN-UNDEF');
907     defined($user) && length($user) or
908         $user = access_cfg("$some-user",'username');
909     my $host = access_cfg("$some-host");
910     return length($user) ? "$user\@$host" : $host;
911 }
912
913 sub access_gituserhost () {
914     return access_someuserhost('git');
915 }
916
917 sub access_giturl (;$) {
918     my ($optional) = @_;
919     my $url = access_cfg('git-url','RETURN-UNDEF');
920     my $suffix;
921     if (!length $url) {
922         my $proto = access_cfg('git-proto', 'RETURN-UNDEF');
923         return undef unless defined $proto;
924         $url =
925             $proto.
926             access_gituserhost().
927             access_cfg('git-path');
928     } else {
929         $suffix = access_cfg('git-url-suffix','RETURN-UNDEF');
930     }
931     $suffix //= '.git';
932     return "$url/$package$suffix";
933 }              
934
935 sub parsecontrolfh ($$;$) {
936     my ($fh, $desc, $allowsigned) = @_;
937     our $dpkgcontrolhash_noissigned;
938     my $c;
939     for (;;) {
940         my %opts = ('name' => $desc);
941         $opts{allow_pgp}= $allowsigned || !$dpkgcontrolhash_noissigned;
942         $c = Dpkg::Control::Hash->new(%opts);
943         $c->parse($fh,$desc) or die "parsing of $desc failed";
944         last if $allowsigned;
945         last if $dpkgcontrolhash_noissigned;
946         my $issigned= $c->get_option('is_pgp_signed');
947         if (!defined $issigned) {
948             $dpkgcontrolhash_noissigned= 1;
949             seek $fh, 0,0 or die "seek $desc: $!";
950         } elsif ($issigned) {
951             fail "control file $desc is (already) PGP-signed. ".
952                 " Note that dgit push needs to modify the .dsc and then".
953                 " do the signature itself";
954         } else {
955             last;
956         }
957     }
958     return $c;
959 }
960
961 sub parsecontrol {
962     my ($file, $desc, $allowsigned) = @_;
963     my $fh = new IO::Handle;
964     open $fh, '<', $file or die "$file: $!";
965     my $c = parsecontrolfh($fh,$desc,$allowsigned);
966     $fh->error and die $!;
967     close $fh;
968     return $c;
969 }
970
971 sub getfield ($$) {
972     my ($dctrl,$field) = @_;
973     my $v = $dctrl->{$field};
974     return $v if defined $v;
975     fail "missing field $field in ".$dctrl->get_option('name');
976 }
977
978 sub parsechangelog {
979     my $c = Dpkg::Control::Hash->new(name => 'parsed changelog');
980     my $p = new IO::Handle;
981     my @cmd = (qw(dpkg-parsechangelog), @_);
982     open $p, '-|', @cmd or die $!;
983     $c->parse($p);
984     $?=0; $!=0; close $p or failedcmd @cmd;
985     return $c;
986 }
987
988 sub commit_getclogp ($) {
989     # Returns the parsed changelog hashref for a particular commit
990     my ($objid) = @_;
991     our %commit_getclogp_memo;
992     my $memo = $commit_getclogp_memo{$objid};
993     return $memo if $memo;
994     mkpath '.git/dgit';
995     my $mclog = ".git/dgit/clog-$objid";
996     runcmd shell_cmd "exec >$mclog", @git, qw(cat-file blob),
997         "$objid:debian/changelog";
998     $commit_getclogp_memo{$objid} = parsechangelog("-l$mclog");
999 }
1000
1001 sub must_getcwd () {
1002     my $d = getcwd();
1003     defined $d or fail "getcwd failed: $!";
1004     return $d;
1005 }
1006
1007 sub parse_dscdata () {
1008     my $dscfh = new IO::File \$dscdata, '<' or die $!;
1009     printdebug Dumper($dscdata) if $debuglevel>1;
1010     $dsc = parsecontrolfh($dscfh,$dscurl,1);
1011     printdebug Dumper($dsc) if $debuglevel>1;
1012 }
1013
1014 our %rmad;
1015
1016 sub archive_query ($;@) {
1017     my ($method) = shift @_;
1018     fail "this operation does not support multiple comma-separated suites"
1019         if $isuite =~ m/,/;
1020     my $query = access_cfg('archive-query','RETURN-UNDEF');
1021     $query =~ s/^(\w+):// or badcfg "invalid archive-query method \`$query'";
1022     my $proto = $1;
1023     my $data = $'; #';
1024     { no strict qw(refs); &{"${method}_${proto}"}($proto,$data,@_); }
1025 }
1026
1027 sub archive_query_prepend_mirror {
1028     my $m = access_cfg('mirror');
1029     return map { [ $_->[0], $m.$_->[1], @$_[2..$#$_] ] } @_;
1030 }
1031
1032 sub pool_dsc_subpath ($$) {
1033     my ($vsn,$component) = @_; # $package is implict arg
1034     my $prefix = substr($package, 0, $package =~ m/^l/ ? 4 : 1);
1035     return "/pool/$component/$prefix/$package/".dscfn($vsn);
1036 }
1037
1038 sub cfg_apply_map ($$$) {
1039     my ($varref, $what, $mapspec) = @_;
1040     return unless $mapspec;
1041
1042     printdebug "config $what EVAL{ $mapspec; }\n";
1043     $_ = $$varref;
1044     eval "package Dgit::Config; $mapspec;";
1045     die $@ if $@;
1046     $$varref = $_;
1047 }
1048
1049 #---------- `ftpmasterapi' archive query method (nascent) ----------
1050
1051 sub archive_api_query_cmd ($) {
1052     my ($subpath) = @_;
1053     my @cmd = (@curl, qw(-sS));
1054     my $url = access_cfg('archive-query-url');
1055     if ($url =~ m#^https://([-.0-9a-z]+)/#) {
1056         my $host = $1;
1057         my $keys = access_cfg('archive-query-tls-key','RETURN-UNDEF') //'';
1058         foreach my $key (split /\:/, $keys) {
1059             $key =~ s/\%HOST\%/$host/g;
1060             if (!stat $key) {
1061                 fail "for $url: stat $key: $!" unless $!==ENOENT;
1062                 next;
1063             }
1064             fail "config requested specific TLS key but do not know".
1065                 " how to get curl to use exactly that EE key ($key)";
1066 #           push @cmd, "--cacert", $key, "--capath", "/dev/enoent";
1067 #           # Sadly the above line does not work because of changes
1068 #           # to gnutls.   The real fix for #790093 may involve
1069 #           # new curl options.
1070             last;
1071         }
1072         # Fixing #790093 properly will involve providing a value
1073         # for this on clients.
1074         my $kargs = access_cfg('archive-query-tls-curl-ca-args','RETURN-UNDEF');
1075         push @cmd, split / /, $kargs if defined $kargs;
1076     }
1077     push @cmd, $url.$subpath;
1078     return @cmd;
1079 }
1080
1081 sub api_query ($$;$) {
1082     use JSON;
1083     my ($data, $subpath, $ok404) = @_;
1084     badcfg "ftpmasterapi archive query method takes no data part"
1085         if length $data;
1086     my @cmd = archive_api_query_cmd($subpath);
1087     my $url = $cmd[$#cmd];
1088     push @cmd, qw(-w %{http_code});
1089     my $json = cmdoutput @cmd;
1090     unless ($json =~ s/\d+\d+\d$//) {
1091         failedcmd_report_cmd undef, @cmd;
1092         fail "curl failed to print 3-digit HTTP code";
1093     }
1094     my $code = $&;
1095     return undef if $code eq '404' && $ok404;
1096     fail "fetch of $url gave HTTP code $code"
1097         unless $url =~ m#^file://# or $code =~ m/^2/;
1098     return decode_json($json);
1099 }
1100
1101 sub canonicalise_suite_ftpmasterapi {
1102     my ($proto,$data) = @_;
1103     my $suites = api_query($data, 'suites');
1104     my @matched;
1105     foreach my $entry (@$suites) {
1106         next unless grep { 
1107             my $v = $entry->{$_};
1108             defined $v && $v eq $isuite;
1109         } qw(codename name);
1110         push @matched, $entry;
1111     }
1112     fail "unknown suite $isuite" unless @matched;
1113     my $cn;
1114     eval {
1115         @matched==1 or die "multiple matches for suite $isuite\n";
1116         $cn = "$matched[0]{codename}";
1117         defined $cn or die "suite $isuite info has no codename\n";
1118         $cn =~ m/^$suite_re$/ or die "suite $isuite maps to bad codename\n";
1119     };
1120     die "bad ftpmaster api response: $@\n".Dumper(\@matched)
1121         if length $@;
1122     return $cn;
1123 }
1124
1125 sub archive_query_ftpmasterapi {
1126     my ($proto,$data) = @_;
1127     my $info = api_query($data, "dsc_in_suite/$isuite/$package");
1128     my @rows;
1129     my $digester = Digest::SHA->new(256);
1130     foreach my $entry (@$info) {
1131         eval {
1132             my $vsn = "$entry->{version}";
1133             my ($ok,$msg) = version_check $vsn;
1134             die "bad version: $msg\n" unless $ok;
1135             my $component = "$entry->{component}";
1136             $component =~ m/^$component_re$/ or die "bad component";
1137             my $filename = "$entry->{filename}";
1138             $filename && $filename !~ m#[^-+:._~0-9a-zA-Z/]|^[/.]|/[/.]#
1139                 or die "bad filename";
1140             my $sha256sum = "$entry->{sha256sum}";
1141             $sha256sum =~ m/^[0-9a-f]+$/ or die "bad sha256sum";
1142             push @rows, [ $vsn, "/pool/$component/$filename",
1143                           $digester, $sha256sum ];
1144         };
1145         die "bad ftpmaster api response: $@\n".Dumper($entry)
1146             if length $@;
1147     }
1148     @rows = sort { -version_compare($a->[0],$b->[0]) } @rows;
1149     return archive_query_prepend_mirror @rows;
1150 }
1151
1152 sub file_in_archive_ftpmasterapi {
1153     my ($proto,$data,$filename) = @_;
1154     my $pat = $filename;
1155     $pat =~ s/_/\\_/g;
1156     $pat = "%/$pat";
1157     $pat =~ s#[^-+_.0-9a-z/]# sprintf '%%%02x', ord $& #ge;
1158     my $info = api_query($data, "file_in_archive/$pat", 1);
1159 }
1160
1161 #---------- `aptget' archive query method ----------
1162
1163 our $aptget_base;
1164 our $aptget_releasefile;
1165 our $aptget_configpath;
1166
1167 sub aptget_aptget   () { return @aptget,   qw(-c), $aptget_configpath; }
1168 sub aptget_aptcache () { return @aptcache, qw(-c), $aptget_configpath; }
1169
1170 sub aptget_cache_clean {
1171     runcmd_ordryrun_local qw(sh -ec),
1172         'cd "$1"; find -atime +30 -type f -print0 | xargs -0r rm --',
1173         'x', $aptget_base;
1174 }
1175
1176 sub aptget_lock_acquire () {
1177     my $lockfile = "$aptget_base/lock";
1178     open APTGET_LOCK, '>', $lockfile or die "open $lockfile: $!";
1179     flock APTGET_LOCK, LOCK_EX or die "lock $lockfile: $!";
1180 }
1181
1182 sub aptget_prep ($) {
1183     my ($data) = @_;
1184     return if defined $aptget_base;
1185
1186     badcfg "aptget archive query method takes no data part"
1187         if length $data;
1188
1189     my $cache = $ENV{XDG_CACHE_DIR} // "$ENV{HOME}/.cache";
1190
1191     ensuredir $cache;
1192     ensuredir "$cache/dgit";
1193     my $cachekey =
1194         access_cfg('aptget-cachekey','RETURN-UNDEF')
1195         // access_nomdistro();
1196
1197     $aptget_base = "$cache/dgit/aptget";
1198     ensuredir $aptget_base;
1199
1200     my $quoted_base = $aptget_base;
1201     die "$quoted_base contains bad chars, cannot continue"
1202         if $quoted_base =~ m/["\\]/; # apt.conf(5) says no escaping :-/
1203
1204     ensuredir $aptget_base;
1205
1206     aptget_lock_acquire();
1207
1208     aptget_cache_clean();
1209
1210     $aptget_configpath = "$aptget_base/apt.conf#$cachekey";
1211     my $sourceslist = "source.list#$cachekey";
1212
1213     my $aptsuites = $isuite;
1214     cfg_apply_map(\$aptsuites, 'suite map',
1215                   access_cfg('aptget-suite-map', 'RETURN-UNDEF'));
1216
1217     open SRCS, ">", "$aptget_base/$sourceslist" or die $!;
1218     printf SRCS "deb-src %s %s %s\n",
1219         access_cfg('mirror'),
1220         $aptsuites,
1221         access_cfg('aptget-components')
1222         or die $!;
1223
1224     ensuredir "$aptget_base/cache";
1225     ensuredir "$aptget_base/lists";
1226
1227     open CONF, ">", $aptget_configpath or die $!;
1228     print CONF <<END;
1229 Debug::NoLocking "true";
1230 APT::Get::List-Cleanup "false";
1231 #clear APT::Update::Post-Invoke-Success;
1232 Dir::Etc::SourceList "$quoted_base/$sourceslist";
1233 Dir::State::Lists "$quoted_base/lists";
1234 Dir::Etc::preferences "$quoted_base/preferences";
1235 Dir::Cache::srcpkgcache "$quoted_base/cache/srcs#$cachekey";
1236 Dir::Cache::pkgcache "$quoted_base/cache/pkgs#$cachekey";
1237 END
1238
1239     foreach my $key (qw(
1240                         Dir::Cache
1241                         Dir::State
1242                         Dir::Cache::Archives
1243                         Dir::Etc::SourceParts
1244                         Dir::Etc::preferencesparts
1245                       )) {
1246         ensuredir "$aptget_base/$key";
1247         print CONF "$key \"$quoted_base/$key\";\n" or die $!;
1248     };
1249
1250     my $oldatime = (time // die $!) - 1;
1251     foreach my $oldlist (<$aptget_base/lists/*Release>) {
1252         next unless stat_exists $oldlist;
1253         my ($mtime) = (stat _)[9];
1254         utime $oldatime, $mtime, $oldlist or die "$oldlist $!";
1255     }
1256
1257     runcmd_ordryrun_local aptget_aptget(), qw(update);
1258
1259     my @releasefiles;
1260     foreach my $oldlist (<$aptget_base/lists/*Release>) {
1261         next unless stat_exists $oldlist;
1262         my ($atime) = (stat _)[8];
1263         next if $atime == $oldatime;
1264         push @releasefiles, $oldlist;
1265     }
1266     my @inreleasefiles = grep { m#/InRelease$# } @releasefiles;
1267     @releasefiles = @inreleasefiles if @inreleasefiles;
1268     die "apt updated wrong number of Release files (@releasefiles), erk"
1269         unless @releasefiles == 1;
1270
1271     ($aptget_releasefile) = @releasefiles;
1272 }
1273
1274 sub canonicalise_suite_aptget {
1275     my ($proto,$data) = @_;
1276     aptget_prep($data);
1277
1278     my $release = parsecontrol $aptget_releasefile, "Release file", 1;
1279
1280     foreach my $name (qw(Codename Suite)) {
1281         my $val = $release->{$name};
1282         if (defined $val) {
1283             printdebug "release file $name: $val\n";
1284             $val =~ m/^$suite_re$/o or fail
1285  "Release file ($aptget_releasefile) specifies intolerable $name";
1286             cfg_apply_map(\$val, 'suite rmap',
1287                           access_cfg('aptget-suite-rmap', 'RETURN-UNDEF'));
1288             return $val
1289         }
1290     }
1291     return $isuite;
1292 }
1293
1294 sub archive_query_aptget {
1295     my ($proto,$data) = @_;
1296     aptget_prep($data);
1297
1298     ensuredir "$aptget_base/source";
1299     foreach my $old (<$aptget_base/source/*.dsc>) {
1300         unlink $old or die "$old: $!";
1301     }
1302
1303     my $showsrc = cmdoutput aptget_aptcache(), qw(showsrc), $package;
1304     return () unless $showsrc =~ m/^package:\s*\Q$package\E\s*$/mi;
1305     # avoids apt-get source failing with ambiguous error code
1306
1307     runcmd_ordryrun_local
1308         shell_cmd 'cd "$1"/source; shift', $aptget_base,
1309         aptget_aptget(), qw(--download-only --only-source source), $package;
1310
1311     my @dscs = <$aptget_base/source/*.dsc>;
1312     fail "apt-get source did not produce a .dsc" unless @dscs;
1313     fail "apt-get source produced several .dscs (@dscs)" unless @dscs==1;
1314
1315     my $pre_dsc = parsecontrol $dscs[0], $dscs[0], 1;
1316
1317     use URI::Escape;
1318     my $uri = "file://". uri_escape $dscs[0];
1319     $uri =~ s{\%2f}{/}gi;
1320     return [ (getfield $pre_dsc, 'Version'), $uri ];
1321 }
1322
1323 #---------- `dummyapicat' archive query method ----------
1324
1325 sub archive_query_dummycatapi { archive_query_ftpmasterapi @_; }
1326 sub canonicalise_suite_dummycatapi { canonicalise_suite_ftpmasterapi @_; }
1327
1328 sub file_in_archive_dummycatapi ($$$) {
1329     my ($proto,$data,$filename) = @_;
1330     my $mirror = access_cfg('mirror');
1331     $mirror =~ s#^file://#/# or die "$mirror ?";
1332     my @out;
1333     my @cmd = (qw(sh -ec), '
1334             cd "$1"
1335             find -name "$2" -print0 |
1336             xargs -0r sha256sum
1337         ', qw(x), $mirror, $filename);
1338     debugcmd "-|", @cmd;
1339     open FIA, "-|", @cmd or die $!;
1340     while (<FIA>) {
1341         chomp or die;
1342         printdebug "| $_\n";
1343         m/^(\w+)  (\S+)$/ or die "$_ ?";
1344         push @out, { sha256sum => $1, filename => $2 };
1345     }
1346     close FIA or die failedcmd @cmd;
1347     return \@out;
1348 }
1349
1350 #---------- `madison' archive query method ----------
1351
1352 sub archive_query_madison {
1353     return archive_query_prepend_mirror
1354         map { [ @$_[0..1] ] } madison_get_parse(@_);
1355 }
1356
1357 sub madison_get_parse {
1358     my ($proto,$data) = @_;
1359     die unless $proto eq 'madison';
1360     if (!length $data) {
1361         $data= access_cfg('madison-distro','RETURN-UNDEF');
1362         $data //= access_basedistro();
1363     }
1364     $rmad{$proto,$data,$package} ||= cmdoutput
1365         qw(rmadison -asource),"-s$isuite","-u$data",$package;
1366     my $rmad = $rmad{$proto,$data,$package};
1367
1368     my @out;
1369     foreach my $l (split /\n/, $rmad) {
1370         $l =~ m{^ \s*( [^ \t|]+ )\s* \|
1371                   \s*( [^ \t|]+ )\s* \|
1372                   \s*( [^ \t|/]+ )(?:/([^ \t|/]+))? \s* \|
1373                   \s*( [^ \t|]+ )\s* }x or die "$rmad ?";
1374         $1 eq $package or die "$rmad $package ?";
1375         my $vsn = $2;
1376         my $newsuite = $3;
1377         my $component;
1378         if (defined $4) {
1379             $component = $4;
1380         } else {
1381             $component = access_cfg('archive-query-default-component');
1382         }
1383         $5 eq 'source' or die "$rmad ?";
1384         push @out, [$vsn,pool_dsc_subpath($vsn,$component),$newsuite];
1385     }
1386     return sort { -version_compare($a->[0],$b->[0]); } @out;
1387 }
1388
1389 sub canonicalise_suite_madison {
1390     # madison canonicalises for us
1391     my @r = madison_get_parse(@_);
1392     @r or fail
1393         "unable to canonicalise suite using package $package".
1394         " which does not appear to exist in suite $isuite;".
1395         " --existing-package may help";
1396     return $r[0][2];
1397 }
1398
1399 sub file_in_archive_madison { return undef; }
1400
1401 #---------- `sshpsql' archive query method ----------
1402
1403 sub sshpsql ($$$) {
1404     my ($data,$runeinfo,$sql) = @_;
1405     if (!length $data) {
1406         $data= access_someuserhost('sshpsql').':'.
1407             access_cfg('sshpsql-dbname');
1408     }
1409     $data =~ m/:/ or badcfg "invalid sshpsql method string \`$data'";
1410     my ($userhost,$dbname) = ($`,$'); #';
1411     my @rows;
1412     my @cmd = (access_cfg_ssh, $userhost,
1413                access_runeinfo("ssh-psql $runeinfo").
1414                " export LC_MESSAGES=C; export LC_CTYPE=C;".
1415                " ".shellquote qw(psql -A), $dbname, qw(-c), $sql);
1416     debugcmd "|",@cmd;
1417     open P, "-|", @cmd or die $!;
1418     while (<P>) {
1419         chomp or die;
1420         printdebug(">|$_|\n");
1421         push @rows, $_;
1422     }
1423     $!=0; $?=0; close P or failedcmd @cmd;
1424     @rows or die;
1425     my $nrows = pop @rows;
1426     $nrows =~ s/^\((\d+) rows?\)$/$1/ or die "$nrows ?";
1427     @rows == $nrows+1 or die "$nrows ".(scalar @rows)." ?";
1428     @rows = map { [ split /\|/, $_ ] } @rows;
1429     my $ncols = scalar @{ shift @rows };
1430     die if grep { scalar @$_ != $ncols } @rows;
1431     return @rows;
1432 }
1433
1434 sub sql_injection_check {
1435     foreach (@_) { die "$_ $& ?" if m{[^-+=:_.,/0-9a-zA-Z]}; }
1436 }
1437
1438 sub archive_query_sshpsql ($$) {
1439     my ($proto,$data) = @_;
1440     sql_injection_check $isuite, $package;
1441     my @rows = sshpsql($data, "archive-query $isuite $package", <<END);
1442         SELECT source.version, component.name, files.filename, files.sha256sum
1443           FROM source
1444           JOIN src_associations ON source.id = src_associations.source
1445           JOIN suite ON suite.id = src_associations.suite
1446           JOIN dsc_files ON dsc_files.source = source.id
1447           JOIN files_archive_map ON files_archive_map.file_id = dsc_files.file
1448           JOIN component ON component.id = files_archive_map.component_id
1449           JOIN files ON files.id = dsc_files.file
1450          WHERE ( suite.suite_name='$isuite' OR suite.codename='$isuite' )
1451            AND source.source='$package'
1452            AND files.filename LIKE '%.dsc';
1453 END
1454     @rows = sort { -version_compare($a->[0],$b->[0]) } @rows;
1455     my $digester = Digest::SHA->new(256);
1456     @rows = map {
1457         my ($vsn,$component,$filename,$sha256sum) = @$_;
1458         [ $vsn, "/pool/$component/$filename",$digester,$sha256sum ];
1459     } @rows;
1460     return archive_query_prepend_mirror @rows;
1461 }
1462
1463 sub canonicalise_suite_sshpsql ($$) {
1464     my ($proto,$data) = @_;
1465     sql_injection_check $isuite;
1466     my @rows = sshpsql($data, "canonicalise-suite $isuite", <<END);
1467         SELECT suite.codename
1468           FROM suite where suite_name='$isuite' or codename='$isuite';
1469 END
1470     @rows = map { $_->[0] } @rows;
1471     fail "unknown suite $isuite" unless @rows;
1472     die "ambiguous $isuite: @rows ?" if @rows>1;
1473     return $rows[0];
1474 }
1475
1476 sub file_in_archive_sshpsql ($$$) { return undef; }
1477
1478 #---------- `dummycat' archive query method ----------
1479
1480 sub canonicalise_suite_dummycat ($$) {
1481     my ($proto,$data) = @_;
1482     my $dpath = "$data/suite.$isuite";
1483     if (!open C, "<", $dpath) {
1484         $!==ENOENT or die "$dpath: $!";
1485         printdebug "dummycat canonicalise_suite $isuite $dpath ENOENT\n";
1486         return $isuite;
1487     }
1488     $!=0; $_ = <C>;
1489     chomp or die "$dpath: $!";
1490     close C;
1491     printdebug "dummycat canonicalise_suite $isuite $dpath = $_\n";
1492     return $_;
1493 }
1494
1495 sub archive_query_dummycat ($$) {
1496     my ($proto,$data) = @_;
1497     canonicalise_suite();
1498     my $dpath = "$data/package.$csuite.$package";
1499     if (!open C, "<", $dpath) {
1500         $!==ENOENT or die "$dpath: $!";
1501         printdebug "dummycat query $csuite $package $dpath ENOENT\n";
1502         return ();
1503     }
1504     my @rows;
1505     while (<C>) {
1506         next if m/^\#/;
1507         next unless m/\S/;
1508         die unless chomp;
1509         printdebug "dummycat query $csuite $package $dpath | $_\n";
1510         my @row = split /\s+/, $_;
1511         @row==2 or die "$dpath: $_ ?";
1512         push @rows, \@row;
1513     }
1514     C->error and die "$dpath: $!";
1515     close C;
1516     return archive_query_prepend_mirror
1517         sort { -version_compare($a->[0],$b->[0]); } @rows;
1518 }
1519
1520 sub file_in_archive_dummycat () { return undef; }
1521
1522 #---------- tag format handling ----------
1523
1524 sub access_cfg_tagformats () {
1525     split /\,/, access_cfg('dgit-tag-format');
1526 }
1527
1528 sub access_cfg_tagformats_can_splitbrain () {
1529     my %y = map { $_ => 1 } access_cfg_tagformats;
1530     foreach my $needtf (qw(new maint)) {
1531         next if $y{$needtf};
1532         return 0;
1533     }
1534     return 1;
1535 }
1536
1537 sub need_tagformat ($$) {
1538     my ($fmt, $why) = @_;
1539     fail "need to use tag format $fmt ($why) but also need".
1540         " to use tag format $tagformat_want->[0] ($tagformat_want->[1])".
1541         " - no way to proceed"
1542         if $tagformat_want && $tagformat_want->[0] ne $fmt;
1543     $tagformat_want = [$fmt, $why, $tagformat_want->[2] // 0];
1544 }
1545
1546 sub select_tagformat () {
1547     # sets $tagformatfn
1548     return if $tagformatfn && !$tagformat_want;
1549     die 'bug' if $tagformatfn && $tagformat_want;
1550     # ... $tagformat_want assigned after previous select_tagformat
1551
1552     my (@supported) = grep { $_ =~ m/^(?:old|new)$/ } access_cfg_tagformats();
1553     printdebug "select_tagformat supported @supported\n";
1554
1555     $tagformat_want //= [ $supported[0], "distro access configuration", 0 ];
1556     printdebug "select_tagformat specified @$tagformat_want\n";
1557
1558     my ($fmt,$why,$override) = @$tagformat_want;
1559
1560     fail "target distro supports tag formats @supported".
1561         " but have to use $fmt ($why)"
1562         unless $override
1563             or grep { $_ eq $fmt } @supported;
1564
1565     $tagformat_want = undef;
1566     $tagformat = $fmt;
1567     $tagformatfn = ${*::}{"debiantag_$fmt"};
1568
1569     fail "trying to use unknown tag format \`$fmt' ($why) !"
1570         unless $tagformatfn;
1571 }
1572
1573 #---------- archive query entrypoints and rest of program ----------
1574
1575 sub canonicalise_suite () {
1576     return if defined $csuite;
1577     fail "cannot operate on $isuite suite" if $isuite eq 'UNRELEASED';
1578     $csuite = archive_query('canonicalise_suite');
1579     if ($isuite ne $csuite) {
1580         progress "canonical suite name for $isuite is $csuite";
1581     } else {
1582         progress "canonical suite name is $csuite";
1583     }
1584 }
1585
1586 sub get_archive_dsc () {
1587     canonicalise_suite();
1588     my @vsns = archive_query('archive_query');
1589     foreach my $vinfo (@vsns) {
1590         my ($vsn,$vsn_dscurl,$digester,$digest) = @$vinfo;
1591         $dscurl = $vsn_dscurl;
1592         $dscdata = url_get($dscurl);
1593         if (!$dscdata) {
1594             $skew_warning_vsn = $vsn if !defined $skew_warning_vsn;
1595             next;
1596         }
1597         if ($digester) {
1598             $digester->reset();
1599             $digester->add($dscdata);
1600             my $got = $digester->hexdigest();
1601             $got eq $digest or
1602                 fail "$dscurl has hash $got but".
1603                     " archive told us to expect $digest";
1604         }
1605         parse_dscdata();
1606         my $fmt = getfield $dsc, 'Format';
1607         $format_ok{$fmt} or forceable_fail [qw(unsupported-source-format)],
1608             "unsupported source format $fmt, sorry";
1609             
1610         $dsc_checked = !!$digester;
1611         printdebug "get_archive_dsc: Version ".(getfield $dsc, 'Version')."\n";
1612         return;
1613     }
1614     $dsc = undef;
1615     printdebug "get_archive_dsc: nothing in archive, returning undef\n";
1616 }
1617
1618 sub check_for_git ();
1619 sub check_for_git () {
1620     # returns 0 or 1
1621     my $how = access_cfg('git-check');
1622     if ($how eq 'ssh-cmd') {
1623         my @cmd =
1624             (access_cfg_ssh, access_gituserhost(),
1625              access_runeinfo("git-check $package").
1626              " set -e; cd ".access_cfg('git-path').";".
1627              " if test -d $package.git; then echo 1; else echo 0; fi");
1628         my $r= cmdoutput @cmd;
1629         if (defined $r and $r =~ m/^divert (\w+)$/) {
1630             my $divert=$1;
1631             my ($usedistro,) = access_distros();
1632             # NB that if we are pushing, $usedistro will be $distro/push
1633             $instead_distro= cfg("dgit-distro.$usedistro.diverts.$divert");
1634             $instead_distro =~ s{^/}{ access_basedistro()."/" }e;
1635             progress "diverting to $divert (using config for $instead_distro)";
1636             return check_for_git();
1637         }
1638         failedcmd @cmd unless defined $r and $r =~ m/^[01]$/;
1639         return $r+0;
1640     } elsif ($how eq 'url') {
1641         my $prefix = access_cfg('git-check-url','git-url');
1642         my $suffix = access_cfg('git-check-suffix','git-suffix',
1643                                 'RETURN-UNDEF') // '.git';
1644         my $url = "$prefix/$package$suffix";
1645         my @cmd = (@curl, qw(-sS -I), $url);
1646         my $result = cmdoutput @cmd;
1647         $result =~ s/^\S+ 200 .*\n\r?\n//;
1648         # curl -sS -I with https_proxy prints
1649         # HTTP/1.0 200 Connection established
1650         $result =~ m/^\S+ (404|200) /s or
1651             fail "unexpected results from git check query - ".
1652                 Dumper($prefix, $result);
1653         my $code = $1;
1654         if ($code eq '404') {
1655             return 0;
1656         } elsif ($code eq '200') {
1657             return 1;
1658         } else {
1659             die;
1660         }
1661     } elsif ($how eq 'true') {
1662         return 1;
1663     } elsif ($how eq 'false') {
1664         return 0;
1665     } else {
1666         badcfg "unknown git-check \`$how'";
1667     }
1668 }
1669
1670 sub create_remote_git_repo () {
1671     my $how = access_cfg('git-create');
1672     if ($how eq 'ssh-cmd') {
1673         runcmd_ordryrun
1674             (access_cfg_ssh, access_gituserhost(),
1675              access_runeinfo("git-create $package").
1676              "set -e; cd ".access_cfg('git-path').";".
1677              " cp -a _template $package.git");
1678     } elsif ($how eq 'true') {
1679         # nothing to do
1680     } else {
1681         badcfg "unknown git-create \`$how'";
1682     }
1683 }
1684
1685 our ($dsc_hash,$lastpush_mergeinput);
1686 our ($dsc_distro, $dsc_hint_tag, $dsc_hint_url);
1687
1688 our $ud = '.git/dgit/unpack';
1689
1690 sub prep_ud (;$) {
1691     my ($d) = @_;
1692     $d //= $ud;
1693     rmtree($d);
1694     mkpath '.git/dgit';
1695     mkdir $d or die $!;
1696 }
1697
1698 sub mktree_in_ud_here () {
1699     runcmd qw(git init -q);
1700     runcmd qw(git config gc.auto 0);
1701     rmtree('.git/objects');
1702     symlink '../../../../objects','.git/objects' or die $!;
1703 }
1704
1705 sub git_write_tree () {
1706     my $tree = cmdoutput @git, qw(write-tree);
1707     $tree =~ m/^\w+$/ or die "$tree ?";
1708     return $tree;
1709 }
1710
1711 sub git_add_write_tree () {
1712     runcmd @git, qw(add -Af .);
1713     return git_write_tree();
1714 }
1715
1716 sub remove_stray_gits ($) {
1717     my ($what) = @_;
1718     my @gitscmd = qw(find -name .git -prune -print0);
1719     debugcmd "|",@gitscmd;
1720     open GITS, "-|", @gitscmd or die $!;
1721     {
1722         local $/="\0";
1723         while (<GITS>) {
1724             chomp or die;
1725             print STDERR "$us: warning: removing from $what: ",
1726                 (messagequote $_), "\n";
1727             rmtree $_;
1728         }
1729     }
1730     $!=0; $?=0; close GITS or failedcmd @gitscmd;
1731 }
1732
1733 sub mktree_in_ud_from_only_subdir ($;$) {
1734     my ($what,$raw) = @_;
1735
1736     # changes into the subdir
1737     my (@dirs) = <*/.>;
1738     die "expected one subdir but found @dirs ?" unless @dirs==1;
1739     $dirs[0] =~ m#^([^/]+)/\.$# or die;
1740     my $dir = $1;
1741     changedir $dir;
1742
1743     remove_stray_gits($what);
1744     mktree_in_ud_here();
1745     if (!$raw) {
1746         my ($format, $fopts) = get_source_format();
1747         if (madformat($format)) {
1748             rmtree '.pc';
1749         }
1750     }
1751
1752     my $tree=git_add_write_tree();
1753     return ($tree,$dir);
1754 }
1755
1756 our @files_csum_info_fields = 
1757     (['Checksums-Sha256','Digest::SHA', 'new(256)', 'sha256sum'],
1758      ['Checksums-Sha1',  'Digest::SHA', 'new(1)',   'sha1sum'],
1759      ['Files',           'Digest::MD5', 'new()',    'md5sum']);
1760
1761 sub dsc_files_info () {
1762     foreach my $csumi (@files_csum_info_fields) {
1763         my ($fname, $module, $method) = @$csumi;
1764         my $field = $dsc->{$fname};
1765         next unless defined $field;
1766         eval "use $module; 1;" or die $@;
1767         my @out;
1768         foreach (split /\n/, $field) {
1769             next unless m/\S/;
1770             m/^(\w+) (\d+) (\S+)$/ or
1771                 fail "could not parse .dsc $fname line \`$_'";
1772             my $digester = eval "$module"."->$method;" or die $@;
1773             push @out, {
1774                 Hash => $1,
1775                 Bytes => $2,
1776                 Filename => $3,
1777                 Digester => $digester,
1778             };
1779         }
1780         return @out;
1781     }
1782     fail "missing any supported Checksums-* or Files field in ".
1783         $dsc->get_option('name');
1784 }
1785
1786 sub dsc_files () {
1787     map { $_->{Filename} } dsc_files_info();
1788 }
1789
1790 sub files_compare_inputs (@) {
1791     my $inputs = \@_;
1792     my %record;
1793     my %fchecked;
1794
1795     my $showinputs = sub {
1796         return join "; ", map { $_->get_option('name') } @$inputs;
1797     };
1798
1799     foreach my $in (@$inputs) {
1800         my $expected_files;
1801         my $in_name = $in->get_option('name');
1802
1803         printdebug "files_compare_inputs $in_name\n";
1804
1805         foreach my $csumi (@files_csum_info_fields) {
1806             my ($fname) = @$csumi;
1807             printdebug "files_compare_inputs $in_name $fname\n";
1808
1809             my $field = $in->{$fname};
1810             next unless defined $field;
1811
1812             my @files;
1813             foreach (split /\n/, $field) {
1814                 next unless m/\S/;
1815
1816                 my ($info, $f) = m/^(\w+ \d+) (?:\S+ \S+ )?(\S+)$/ or
1817                     fail "could not parse $in_name $fname line \`$_'";
1818
1819                 printdebug "files_compare_inputs $in_name $fname $f\n";
1820
1821                 push @files, $f;
1822
1823                 my $re = \ $record{$f}{$fname};
1824                 if (defined $$re) {
1825                     $fchecked{$f}{$in_name} = 1;
1826                     $$re eq $info or
1827                         fail "hash or size of $f varies in $fname fields".
1828                         " (between: ".$showinputs->().")";
1829                 } else {
1830                     $$re = $info;
1831                 }
1832             }
1833             @files = sort @files;
1834             $expected_files //= \@files;
1835             "@$expected_files" eq "@files" or
1836                 fail "file list in $in_name varies between hash fields!";
1837         }
1838         $expected_files or
1839             fail "$in_name has no files list field(s)";
1840     }
1841     printdebug "files_compare_inputs ".Dumper(\%fchecked, \%record)
1842         if $debuglevel>=2;
1843
1844     grep { keys %$_ == @$inputs-1 } values %fchecked
1845         or fail "no file appears in all file lists".
1846         " (looked in: ".$showinputs->().")";
1847 }
1848
1849 sub is_orig_file_in_dsc ($$) {
1850     my ($f, $dsc_files_info) = @_;
1851     return 0 if @$dsc_files_info <= 1;
1852     # One file means no origs, and the filename doesn't have a "what
1853     # part of dsc" component.  (Consider versions ending `.orig'.)
1854     return 0 unless $f =~ m/\.$orig_f_tail_re$/o;
1855     return 1;
1856 }
1857
1858 sub is_orig_file_of_vsn ($$) {
1859     my ($f, $upstreamvsn) = @_;
1860     my $base = srcfn $upstreamvsn, '';
1861     return 0 unless $f =~ m/^\Q$base\E\.$orig_f_tail_re$/;
1862     return 1;
1863 }
1864
1865 sub changes_update_origs_from_dsc ($$$$) {
1866     my ($dsc, $changes, $upstreamvsn, $changesfile) = @_;
1867     my %changes_f;
1868     printdebug "checking origs needed ($upstreamvsn)...\n";
1869     $_ = getfield $changes, 'Files';
1870     m/^\w+ \d+ (\S+ \S+) \S+$/m or
1871         fail "cannot find section/priority from .changes Files field";
1872     my $placementinfo = $1;
1873     my %changed;
1874     printdebug "checking origs needed placement '$placementinfo'...\n";
1875     foreach my $l (split /\n/, getfield $dsc, 'Files') {
1876         $l =~ m/\S+$/ or next;
1877         my $file = $&;
1878         printdebug "origs $file | $l\n";
1879         next unless is_orig_file_of_vsn $file, $upstreamvsn;
1880         printdebug "origs $file is_orig\n";
1881         my $have = archive_query('file_in_archive', $file);
1882         if (!defined $have) {
1883             print STDERR <<END;
1884 archive does not support .orig check; hope you used --ch:--sa/-sd if needed
1885 END
1886             return;
1887         }
1888         my $found_same = 0;
1889         my @found_differ;
1890         printdebug "origs $file \$#\$have=$#$have\n";
1891         foreach my $h (@$have) {
1892             my $same = 0;
1893             my @differ;
1894             foreach my $csumi (@files_csum_info_fields) {
1895                 my ($fname, $module, $method, $archivefield) = @$csumi;
1896                 next unless defined $h->{$archivefield};
1897                 $_ = $dsc->{$fname};
1898                 next unless defined;
1899                 m/^(\w+) .* \Q$file\E$/m or
1900                     fail ".dsc $fname missing entry for $file";
1901                 if ($h->{$archivefield} eq $1) {
1902                     $same++;
1903                 } else {
1904                     push @differ,
1905  "$archivefield: $h->{$archivefield} (archive) != $1 (local .dsc)";
1906                 }
1907             }
1908             die "$file ".Dumper($h)." ?!" if $same && @differ;
1909             $found_same++
1910                 if $same;
1911             push @found_differ, "archive $h->{filename}: ".join "; ", @differ
1912                 if @differ;
1913         }
1914         printdebug "origs $file f.same=$found_same".
1915             " #f._differ=$#found_differ\n";
1916         if (@found_differ && !$found_same) {
1917             fail join "\n",
1918                 "archive contains $file with different checksum",
1919                 @found_differ;
1920         }
1921         # Now we edit the changes file to add or remove it
1922         foreach my $csumi (@files_csum_info_fields) {
1923             my ($fname, $module, $method, $archivefield) = @$csumi;
1924             next unless defined $changes->{$fname};
1925             if ($found_same) {
1926                 # in archive, delete from .changes if it's there
1927                 $changed{$file} = "removed" if
1928                     $changes->{$fname} =~ s/^.* \Q$file\E$(?:)\n//m;
1929             } elsif ($changes->{$fname} =~ m/^.* \Q$file\E$(?:)\n/m) {
1930                 # not in archive, but it's here in the .changes
1931             } else {
1932                 my $dsc_data = getfield $dsc, $fname;
1933                 $dsc_data =~ m/^(.* \Q$file\E$)\n/m or die "$dsc_data $file ?";
1934                 my $extra = $1;
1935                 $extra =~ s/ \d+ /$&$placementinfo /
1936                     or die "$fname $extra >$dsc_data< ?"
1937                     if $fname eq 'Files';
1938                 $changes->{$fname} .= "\n". $extra;
1939                 $changed{$file} = "added";
1940             }
1941         }
1942     }
1943     if (%changed) {
1944         foreach my $file (keys %changed) {
1945             progress sprintf
1946                 "edited .changes for archive .orig contents: %s %s",
1947                 $changed{$file}, $file;
1948         }
1949         my $chtmp = "$changesfile.tmp";
1950         $changes->save($chtmp);
1951         if (act_local()) {
1952             rename $chtmp,$changesfile or die "$changesfile $!";
1953         } else {
1954             progress "[new .changes left in $changesfile]";
1955         }
1956     } else {
1957         progress "$changesfile already has appropriate .orig(s) (if any)";
1958     }
1959 }
1960
1961 sub make_commit ($) {
1962     my ($file) = @_;
1963     return cmdoutput @git, qw(hash-object -w -t commit), $file;
1964 }
1965
1966 sub make_commit_text ($) {
1967     my ($text) = @_;
1968     my ($out, $in);
1969     my @cmd = (@git, qw(hash-object -w -t commit --stdin));
1970     debugcmd "|",@cmd;
1971     print Dumper($text) if $debuglevel > 1;
1972     my $child = open2($out, $in, @cmd) or die $!;
1973     my $h;
1974     eval {
1975         print $in $text or die $!;
1976         close $in or die $!;
1977         $h = <$out>;
1978         $h =~ m/^\w+$/ or die;
1979         $h = $&;
1980         printdebug "=> $h\n";
1981     };
1982     close $out;
1983     waitpid $child, 0 == $child or die "$child $!";
1984     $? and failedcmd @cmd;
1985     return $h;
1986 }
1987
1988 sub clogp_authline ($) {
1989     my ($clogp) = @_;
1990     my $author = getfield $clogp, 'Maintainer';
1991     $author =~ s#,.*##ms;
1992     my $date = cmdoutput qw(date), '+%s %z', qw(-d), getfield($clogp,'Date');
1993     my $authline = "$author $date";
1994     $authline =~ m/$git_authline_re/o or
1995         fail "unexpected commit author line format \`$authline'".
1996         " (was generated from changelog Maintainer field)";
1997     return ($1,$2,$3) if wantarray;
1998     return $authline;
1999 }
2000
2001 sub vendor_patches_distro ($$) {
2002     my ($checkdistro, $what) = @_;
2003     return unless defined $checkdistro;
2004
2005     my $series = "debian/patches/\L$checkdistro\E.series";
2006     printdebug "checking for vendor-specific $series ($what)\n";
2007
2008     if (!open SERIES, "<", $series) {
2009         die "$series $!" unless $!==ENOENT;
2010         return;
2011     }
2012     while (<SERIES>) {
2013         next unless m/\S/;
2014         next if m/^\s+\#/;
2015
2016         print STDERR <<END;
2017
2018 Unfortunately, this source package uses a feature of dpkg-source where
2019 the same source package unpacks to different source code on different
2020 distros.  dgit cannot safely operate on such packages on affected
2021 distros, because the meaning of source packages is not stable.
2022
2023 Please ask the distro/maintainer to remove the distro-specific series
2024 files and use a different technique (if necessary, uploading actually
2025 different packages, if different distros are supposed to have
2026 different code).
2027
2028 END
2029         fail "Found active distro-specific series file for".
2030             " $checkdistro ($what): $series, cannot continue";
2031     }
2032     die "$series $!" if SERIES->error;
2033     close SERIES;
2034 }
2035
2036 sub check_for_vendor_patches () {
2037     # This dpkg-source feature doesn't seem to be documented anywhere!
2038     # But it can be found in the changelog (reformatted):
2039
2040     #   commit  4fa01b70df1dc4458daee306cfa1f987b69da58c
2041     #   Author: Raphael Hertzog <hertzog@debian.org>
2042     #   Date: Sun  Oct  3  09:36:48  2010 +0200
2043
2044     #   dpkg-source: correctly create .pc/.quilt_series with alternate
2045     #   series files
2046     #   
2047     #   If you have debian/patches/ubuntu.series and you were
2048     #   unpacking the source package on ubuntu, quilt was still
2049     #   directed to debian/patches/series instead of
2050     #   debian/patches/ubuntu.series.
2051     #   
2052     #   debian/changelog                        |    3 +++
2053     #   scripts/Dpkg/Source/Package/V3/quilt.pm |    4 +++-
2054     #   2 files changed, 6 insertions(+), 1 deletion(-)
2055
2056     use Dpkg::Vendor;
2057     vendor_patches_distro($ENV{DEB_VENDOR}, "DEB_VENDOR");
2058     vendor_patches_distro(Dpkg::Vendor::get_current_vendor(),
2059                          "Dpkg::Vendor \`current vendor'");
2060     vendor_patches_distro(access_basedistro(),
2061                           "(base) distro being accessed");
2062     vendor_patches_distro(access_nomdistro(),
2063                           "(nominal) distro being accessed");
2064 }
2065
2066 sub generate_commits_from_dsc () {
2067     # See big comment in fetch_from_archive, below.
2068     # See also README.dsc-import.
2069     prep_ud();
2070     changedir $ud;
2071
2072     my @dfi = dsc_files_info();
2073     foreach my $fi (@dfi) {
2074         my $f = $fi->{Filename};
2075         die "$f ?" if $f =~ m#/|^\.|\.dsc$|\.tmp$#;
2076
2077         printdebug "considering linking $f: ";
2078
2079         link_ltarget "../../../../$f", $f
2080             or ((printdebug "($!) "), 0)
2081             or $!==&ENOENT
2082             or die "$f $!";
2083
2084         printdebug "linked.\n";
2085
2086         complete_file_from_dsc('.', $fi)
2087             or next;
2088
2089         if (is_orig_file_in_dsc($f, \@dfi)) {
2090             link $f, "../../../../$f"
2091                 or $!==&EEXIST
2092                 or die "$f $!";
2093         }
2094     }
2095
2096     # We unpack and record the orig tarballs first, so that we only
2097     # need disk space for one private copy of the unpacked source.
2098     # But we can't make them into commits until we have the metadata
2099     # from the debian/changelog, so we record the tree objects now and
2100     # make them into commits later.
2101     my @tartrees;
2102     my $upstreamv = upstreamversion $dsc->{version};
2103     my $orig_f_base = srcfn $upstreamv, '';
2104
2105     foreach my $fi (@dfi) {
2106         # We actually import, and record as a commit, every tarball
2107         # (unless there is only one file, in which case there seems
2108         # little point.
2109
2110         my $f = $fi->{Filename};
2111         printdebug "import considering $f ";
2112         (printdebug "only one dfi\n"), next if @dfi == 1;
2113         (printdebug "not tar\n"), next unless $f =~ m/\.tar(\.\w+)?$/;
2114         (printdebug "signature\n"), next if $f =~ m/$orig_f_sig_re$/o;
2115         my $compr_ext = $1;
2116
2117         my ($orig_f_part) =
2118             $f =~ m/^\Q$orig_f_base\E\.([^._]+)?\.tar(?:\.\w+)?$/;
2119
2120         printdebug "Y ", (join ' ', map { $_//"(none)" }
2121                           $compr_ext, $orig_f_part
2122                          ), "\n";
2123
2124         my $input = new IO::File $f, '<' or die "$f $!";
2125         my $compr_pid;
2126         my @compr_cmd;
2127
2128         if (defined $compr_ext) {
2129             my $cname =
2130                 Dpkg::Compression::compression_guess_from_filename $f;
2131             fail "Dpkg::Compression cannot handle file $f in source package"
2132                 if defined $compr_ext && !defined $cname;
2133             my $compr_proc =
2134                 new Dpkg::Compression::Process compression => $cname;
2135             my @compr_cmd = $compr_proc->get_uncompress_cmdline();
2136             my $compr_fh = new IO::Handle;
2137             my $compr_pid = open $compr_fh, "-|" // die $!;
2138             if (!$compr_pid) {
2139                 open STDIN, "<&", $input or die $!;
2140                 exec @compr_cmd;
2141                 die "dgit (child): exec $compr_cmd[0]: $!\n";
2142             }
2143             $input = $compr_fh;
2144         }
2145
2146         rmtree "_unpack-tar";
2147         mkdir "_unpack-tar" or die $!;
2148         my @tarcmd = qw(tar -x -f -
2149                         --no-same-owner --no-same-permissions
2150                         --no-acls --no-xattrs --no-selinux);
2151         my $tar_pid = fork // die $!;
2152         if (!$tar_pid) {
2153             chdir "_unpack-tar" or die $!;
2154             open STDIN, "<&", $input or die $!;
2155             exec @tarcmd;
2156             die "dgit (child): exec $tarcmd[0]: $!";
2157         }
2158         $!=0; (waitpid $tar_pid, 0) == $tar_pid or die $!;
2159         !$? or failedcmd @tarcmd;
2160
2161         close $input or
2162             (@compr_cmd ? failedcmd @compr_cmd
2163              : die $!);
2164         # finally, we have the results in "tarball", but maybe
2165         # with the wrong permissions
2166
2167         runcmd qw(chmod -R +rwX _unpack-tar);
2168         changedir "_unpack-tar";
2169         remove_stray_gits($f);
2170         mktree_in_ud_here();
2171         
2172         my ($tree) = git_add_write_tree();
2173         my $tentries = cmdoutput @git, qw(ls-tree -z), $tree;
2174         if ($tentries =~ m/^\d+ tree (\w+)\t[^\000]+\000$/s) {
2175             $tree = $1;
2176             printdebug "one subtree $1\n";
2177         } else {
2178             printdebug "multiple subtrees\n";
2179         }
2180         changedir "..";
2181         rmtree "_unpack-tar";
2182
2183         my $ent = [ $f, $tree ];
2184         push @tartrees, {
2185             Orig => !!$orig_f_part,
2186             Sort => (!$orig_f_part         ? 2 :
2187                      $orig_f_part =~ m/-/g ? 1 :
2188                                              0),
2189             F => $f,
2190             Tree => $tree,
2191         };
2192     }
2193
2194     @tartrees = sort {
2195         # put any without "_" first (spec is not clear whether files
2196         # are always in the usual order).  Tarballs without "_" are
2197         # the main orig or the debian tarball.
2198         $a->{Sort} <=> $b->{Sort} or
2199         $a->{F}    cmp $b->{F}
2200     } @tartrees;
2201
2202     my $any_orig = grep { $_->{Orig} } @tartrees;
2203
2204     my $dscfn = "$package.dsc";
2205
2206     my $treeimporthow = 'package';
2207
2208     open D, ">", $dscfn or die "$dscfn: $!";
2209     print D $dscdata or die "$dscfn: $!";
2210     close D or die "$dscfn: $!";
2211     my @cmd = qw(dpkg-source);
2212     push @cmd, '--no-check' if $dsc_checked;
2213     if (madformat $dsc->{format}) {
2214         push @cmd, '--skip-patches';
2215         $treeimporthow = 'unpatched';
2216     }
2217     push @cmd, qw(-x --), $dscfn;
2218     runcmd @cmd;
2219
2220     my ($tree,$dir) = mktree_in_ud_from_only_subdir("source package");
2221     if (madformat $dsc->{format}) { 
2222         check_for_vendor_patches();
2223     }
2224
2225     my $dappliedtree;
2226     if (madformat $dsc->{format}) {
2227         my @pcmd = qw(dpkg-source --before-build .);
2228         runcmd shell_cmd 'exec >/dev/null', @pcmd;
2229         rmtree '.pc';
2230         $dappliedtree = git_add_write_tree();
2231     }
2232
2233     my @clogcmd = qw(dpkg-parsechangelog --format rfc822 --all);
2234     debugcmd "|",@clogcmd;
2235     open CLOGS, "-|", @clogcmd or die $!;
2236
2237     my $clogp;
2238     my $r1clogp;
2239
2240     printdebug "import clog search...\n";
2241
2242     for (;;) {
2243         my $stanzatext = do { local $/=""; <CLOGS>; };
2244         printdebug "import clogp ".Dumper($stanzatext) if $debuglevel>1;
2245         last if !defined $stanzatext;
2246
2247         my $desc = "package changelog, entry no.$.";
2248         open my $stanzafh, "<", \$stanzatext or die;
2249         my $thisstanza = parsecontrolfh $stanzafh, $desc, 1;
2250         $clogp //= $thisstanza;
2251
2252         printdebug "import clog $thisstanza->{version} $desc...\n";
2253
2254         last if !$any_orig; # we don't need $r1clogp
2255
2256         # We look for the first (most recent) changelog entry whose
2257         # version number is lower than the upstream version of this
2258         # package.  Then the last (least recent) previous changelog
2259         # entry is treated as the one which introduced this upstream
2260         # version and used for the synthetic commits for the upstream
2261         # tarballs.
2262
2263         # One might think that a more sophisticated algorithm would be
2264         # necessary.  But: we do not want to scan the whole changelog
2265         # file.  Stopping when we see an earlier version, which
2266         # necessarily then is an earlier upstream version, is the only
2267         # realistic way to do that.  Then, either the earliest
2268         # changelog entry we have seen so far is indeed the earliest
2269         # upload of this upstream version; or there are only changelog
2270         # entries relating to later upstream versions (which is not
2271         # possible unless the changelog and .dsc disagree about the
2272         # version).  Then it remains to choose between the physically
2273         # last entry in the file, and the one with the lowest version
2274         # number.  If these are not the same, we guess that the
2275         # versions were created in a non-monotic order rather than
2276         # that the changelog entries have been misordered.
2277
2278         printdebug "import clog $thisstanza->{version} vs $upstreamv...\n";
2279
2280         last if version_compare($thisstanza->{version}, $upstreamv) < 0;
2281         $r1clogp = $thisstanza;
2282
2283         printdebug "import clog $r1clogp->{version} becomes r1\n";
2284     }
2285     die $! if CLOGS->error;
2286     close CLOGS or $?==SIGPIPE or failedcmd @clogcmd;
2287
2288     $clogp or fail "package changelog has no entries!";
2289
2290     my $authline = clogp_authline $clogp;
2291     my $changes = getfield $clogp, 'Changes';
2292     my $cversion = getfield $clogp, 'Version';
2293
2294     if (@tartrees) {
2295         $r1clogp //= $clogp; # maybe there's only one entry;
2296         my $r1authline = clogp_authline $r1clogp;
2297         # Strictly, r1authline might now be wrong if it's going to be
2298         # unused because !$any_orig.  Whatever.
2299
2300         printdebug "import tartrees authline   $authline\n";
2301         printdebug "import tartrees r1authline $r1authline\n";
2302
2303         foreach my $tt (@tartrees) {
2304             printdebug "import tartree $tt->{F} $tt->{Tree}\n";
2305
2306             $tt->{Commit} = make_commit_text($tt->{Orig} ? <<END_O : <<END_T);
2307 tree $tt->{Tree}
2308 author $r1authline
2309 committer $r1authline
2310
2311 Import $tt->{F}
2312
2313 [dgit import orig $tt->{F}]
2314 END_O
2315 tree $tt->{Tree}
2316 author $authline
2317 committer $authline
2318
2319 Import $tt->{F}
2320
2321 [dgit import tarball $package $cversion $tt->{F}]
2322 END_T
2323         }
2324     }
2325
2326     printdebug "import main commit\n";
2327
2328     open C, ">../commit.tmp" or die $!;
2329     print C <<END or die $!;
2330 tree $tree
2331 END
2332     print C <<END or die $! foreach @tartrees;
2333 parent $_->{Commit}
2334 END
2335     print C <<END or die $!;
2336 author $authline
2337 committer $authline
2338
2339 $changes
2340
2341 [dgit import $treeimporthow $package $cversion]
2342 END
2343
2344     close C or die $!;
2345     my $rawimport_hash = make_commit qw(../commit.tmp);
2346
2347     if (madformat $dsc->{format}) {
2348         printdebug "import apply patches...\n";
2349
2350         # regularise the state of the working tree so that
2351         # the checkout of $rawimport_hash works nicely.
2352         my $dappliedcommit = make_commit_text(<<END);
2353 tree $dappliedtree
2354 author $authline
2355 committer $authline
2356
2357 [dgit dummy commit]
2358 END
2359         runcmd @git, qw(checkout -q -b dapplied), $dappliedcommit;
2360
2361         runcmd @git, qw(checkout -q -b unpa), $rawimport_hash;
2362
2363         # We need the answers to be reproducible
2364         my @authline = clogp_authline($clogp);
2365         local $ENV{GIT_COMMITTER_NAME} =  $authline[0];
2366         local $ENV{GIT_COMMITTER_EMAIL} = $authline[1];
2367         local $ENV{GIT_COMMITTER_DATE} =  $authline[2];
2368         local $ENV{GIT_AUTHOR_NAME} =  $authline[0];
2369         local $ENV{GIT_AUTHOR_EMAIL} = $authline[1];
2370         local $ENV{GIT_AUTHOR_DATE} =  $authline[2];
2371
2372         my $path = $ENV{PATH} or die;
2373
2374         foreach my $use_absurd (qw(0 1)) {
2375             runcmd @git, qw(checkout -q unpa);
2376             runcmd @git, qw(update-ref -d refs/heads/patch-queue/unpa);
2377             local $ENV{PATH} = $path;
2378             if ($use_absurd) {
2379                 chomp $@;
2380                 progress "warning: $@";
2381                 $path = "$absurdity:$path";
2382                 progress "$us: trying slow absurd-git-apply...";
2383                 rename "../../gbp-pq-output","../../gbp-pq-output.0"
2384                     or $!==ENOENT
2385                     or die $!;
2386             }
2387             eval {
2388                 die "forbid absurd git-apply\n" if $use_absurd
2389                     && forceing [qw(import-gitapply-no-absurd)];
2390                 die "only absurd git-apply!\n" if !$use_absurd
2391                     && forceing [qw(import-gitapply-absurd)];
2392
2393                 local $ENV{DGIT_ABSURD_DEBUG} = $debuglevel if $use_absurd;
2394                 local $ENV{PATH} = $path                    if $use_absurd;
2395
2396                 my @showcmd = (gbp_pq, qw(import));
2397                 my @realcmd = shell_cmd
2398                     'exec >/dev/null 2>>../../gbp-pq-output', @showcmd;
2399                 debugcmd "+",@realcmd;
2400                 if (system @realcmd) {
2401                     die +(shellquote @showcmd).
2402                         " failed: ".
2403                         failedcmd_waitstatus()."\n";
2404                 }
2405
2406                 my $gapplied = git_rev_parse('HEAD');
2407                 my $gappliedtree = cmdoutput @git, qw(rev-parse HEAD:);
2408                 $gappliedtree eq $dappliedtree or
2409                     fail <<END;
2410 gbp-pq import and dpkg-source disagree!
2411  gbp-pq import gave commit $gapplied
2412  gbp-pq import gave tree $gappliedtree
2413  dpkg-source --before-build gave tree $dappliedtree
2414 END
2415                 $rawimport_hash = $gapplied;
2416             };
2417             last unless $@;
2418         }
2419         if ($@) {
2420             { local $@; eval { runcmd qw(cat ../../gbp-pq-output); }; }
2421             die $@;
2422         }
2423     }
2424
2425     progress "synthesised git commit from .dsc $cversion";
2426
2427     my $rawimport_mergeinput = {
2428         Commit => $rawimport_hash,
2429         Info => "Import of source package",
2430     };
2431     my @output = ($rawimport_mergeinput);
2432
2433     if ($lastpush_mergeinput) {
2434         my $oldclogp = mergeinfo_getclogp($lastpush_mergeinput);
2435         my $oversion = getfield $oldclogp, 'Version';
2436         my $vcmp =
2437             version_compare($oversion, $cversion);
2438         if ($vcmp < 0) {
2439             @output = ($rawimport_mergeinput, $lastpush_mergeinput,
2440                 { Message => <<END, ReverseParents => 1 });
2441 Record $package ($cversion) in archive suite $csuite
2442 END
2443         } elsif ($vcmp > 0) {
2444             print STDERR <<END or die $!;
2445
2446 Version actually in archive:   $cversion (older)
2447 Last version pushed with dgit: $oversion (newer or same)
2448 $later_warning_msg
2449 END
2450             @output = $lastpush_mergeinput;
2451         } else {
2452             # Same version.  Use what's in the server git branch,
2453             # discarding our own import.  (This could happen if the
2454             # server automatically imports all packages into git.)
2455             @output = $lastpush_mergeinput;
2456         }
2457     }
2458     changedir '../../../..';
2459     rmtree($ud);
2460     return @output;
2461 }
2462
2463 sub complete_file_from_dsc ($$) {
2464     our ($dstdir, $fi) = @_;
2465     # Ensures that we have, in $dir, the file $fi, with the correct
2466     # contents.  (Downloading it from alongside $dscurl if necessary.)
2467
2468     my $f = $fi->{Filename};
2469     my $tf = "$dstdir/$f";
2470     my $downloaded = 0;
2471
2472     if (stat_exists $tf) {
2473         progress "using existing $f";
2474     } else {
2475         printdebug "$tf does not exist, need to fetch\n";
2476         my $furl = $dscurl;
2477         $furl =~ s{/[^/]+$}{};
2478         $furl .= "/$f";
2479         die "$f ?" unless $f =~ m/^\Q${package}\E_/;
2480         die "$f ?" if $f =~ m#/#;
2481         runcmd_ordryrun_local @curl,qw(-f -o),$tf,'--',"$furl";
2482         return 0 if !act_local();
2483         $downloaded = 1;
2484     }
2485
2486     open F, "<", "$tf" or die "$tf: $!";
2487     $fi->{Digester}->reset();
2488     $fi->{Digester}->addfile(*F);
2489     F->error and die $!;
2490     my $got = $fi->{Digester}->hexdigest();
2491     $got eq $fi->{Hash} or
2492         fail "file $f has hash $got but .dsc".
2493             " demands hash $fi->{Hash} ".
2494             ($downloaded ? "(got wrong file from archive!)"
2495              : "(perhaps you should delete this file?)");
2496
2497     return 1;
2498 }
2499
2500 sub ensure_we_have_orig () {
2501     my @dfi = dsc_files_info();
2502     foreach my $fi (@dfi) {
2503         my $f = $fi->{Filename};
2504         next unless is_orig_file_in_dsc($f, \@dfi);
2505         complete_file_from_dsc('..', $fi)
2506             or next;
2507     }
2508 }
2509
2510 sub git_fetch_us () {
2511     # Want to fetch only what we are going to use, unless
2512     # deliberately-not-ff, in which case we must fetch everything.
2513
2514     my @specs = deliberately_not_fast_forward ? qw(tags/*) :
2515         map { "tags/$_" }
2516         (quiltmode_splitbrain
2517          ? (map { $_->('*',access_nomdistro) }
2518             \&debiantag_new, \&debiantag_maintview)
2519          : debiantags('*',access_nomdistro));
2520     push @specs, server_branch($csuite);
2521     push @specs, $rewritemap;
2522     push @specs, qw(heads/*) if deliberately_not_fast_forward;
2523
2524     # This is rather miserable:
2525     # When git fetch --prune is passed a fetchspec ending with a *,
2526     # it does a plausible thing.  If there is no * then:
2527     # - it matches subpaths too, even if the supplied refspec
2528     #   starts refs, and behaves completely madly if the source
2529     #   has refs/refs/something.  (See, for example, Debian #NNNN.)
2530     # - if there is no matching remote ref, it bombs out the whole
2531     #   fetch.
2532     # We want to fetch a fixed ref, and we don't know in advance
2533     # if it exists, so this is not suitable.
2534     #
2535     # Our workaround is to use git ls-remote.  git ls-remote has its
2536     # own qairks.  Notably, it has the absurd multi-tail-matching
2537     # behaviour: git ls-remote R refs/foo can report refs/foo AND
2538     # refs/refs/foo etc.
2539     #
2540     # Also, we want an idempotent snapshot, but we have to make two
2541     # calls to the remote: one to git ls-remote and to git fetch.  The
2542     # solution is use git ls-remote to obtain a target state, and
2543     # git fetch to try to generate it.  If we don't manage to generate
2544     # the target state, we try again.
2545
2546     printdebug "git_fetch_us specs @specs\n";
2547
2548     my $specre = join '|', map {
2549         my $x = $_;
2550         $x =~ s/\W/\\$&/g;
2551         $x =~ s/\\\*$/.*/;
2552         "(?:refs/$x)";
2553     } @specs;
2554     printdebug "git_fetch_us specre=$specre\n";
2555     my $wanted_rref = sub {
2556         local ($_) = @_;
2557         return m/^(?:$specre)$/o;
2558     };
2559
2560     my $fetch_iteration = 0;
2561     FETCH_ITERATION:
2562     for (;;) {
2563         printdebug "git_fetch_us iteration $fetch_iteration\n";
2564         if (++$fetch_iteration > 10) {
2565             fail "too many iterations trying to get sane fetch!";
2566         }
2567
2568         my @look = map { "refs/$_" } @specs;
2569         my @lcmd = (@git, qw(ls-remote -q --refs), access_giturl(), @look);
2570         debugcmd "|",@lcmd;
2571
2572         my %wantr;
2573         open GITLS, "-|", @lcmd or die $!;
2574         while (<GITLS>) {
2575             printdebug "=> ", $_;
2576             m/^(\w+)\s+(\S+)\n/ or die "ls-remote $_ ?";
2577             my ($objid,$rrefname) = ($1,$2);
2578             if (!$wanted_rref->($rrefname)) {
2579                 print STDERR <<END;
2580 warning: git ls-remote @look reported $rrefname; this is silly, ignoring it.
2581 END
2582                 next;
2583             }
2584             $wantr{$rrefname} = $objid;
2585         }
2586         $!=0; $?=0;
2587         close GITLS or failedcmd @lcmd;
2588
2589         # OK, now %want is exactly what we want for refs in @specs
2590         my @fspecs = map {
2591             !m/\*$/ && !exists $wantr{"refs/$_"} ? () :
2592             "+refs/$_:".lrfetchrefs."/$_";
2593         } @specs;
2594
2595         printdebug "git_fetch_us fspecs @fspecs\n";
2596
2597         my @fcmd = (@git, qw(fetch -p -n -q), access_giturl(), @fspecs);
2598         runcmd_ordryrun_local @git, qw(fetch -p -n -q), access_giturl(),
2599             @fspecs;
2600
2601         %lrfetchrefs_f = ();
2602         my %objgot;
2603
2604         git_for_each_ref(lrfetchrefs, sub {
2605             my ($objid,$objtype,$lrefname,$reftail) = @_;
2606             $lrfetchrefs_f{$lrefname} = $objid;
2607             $objgot{$objid} = 1;
2608         });
2609
2610         foreach my $lrefname (sort keys %lrfetchrefs_f) {
2611             my $rrefname = 'refs'.substr($lrefname, length lrfetchrefs);
2612             if (!exists $wantr{$rrefname}) {
2613                 if ($wanted_rref->($rrefname)) {
2614                     printdebug <<END;
2615 git-fetch @fspecs created $lrefname which git ls-remote @look didn't list.
2616 END
2617                 } else {
2618                     print STDERR <<END
2619 warning: git fetch @fspecs created $lrefname; this is silly, deleting it.
2620 END
2621                 }
2622                 runcmd_ordryrun_local @git, qw(update-ref -d), $lrefname;
2623                 delete $lrfetchrefs_f{$lrefname};
2624                 next;
2625             }
2626         }
2627         foreach my $rrefname (sort keys %wantr) {
2628             my $lrefname = lrfetchrefs.substr($rrefname, 4);
2629             my $got = $lrfetchrefs_f{$lrefname} // '<none>';
2630             my $want = $wantr{$rrefname};
2631             next if $got eq $want;
2632             if (!defined $objgot{$want}) {
2633                 print STDERR <<END;
2634 warning: git ls-remote suggests we want $lrefname
2635 warning:  and it should refer to $want
2636 warning:  but git fetch didn't fetch that object to any relevant ref.
2637 warning:  This may be due to a race with someone updating the server.
2638 warning:  Will try again...
2639 END
2640                 next FETCH_ITERATION;
2641             }
2642             printdebug <<END;
2643 git-fetch @fspecs made $lrefname=$got but want git ls-remote @look says $want
2644 END
2645             runcmd_ordryrun_local @git, qw(update-ref -m),
2646                 "dgit fetch git fetch fixup", $lrefname, $want;
2647             $lrfetchrefs_f{$lrefname} = $want;
2648         }
2649         last;
2650     }
2651     printdebug "git_fetch_us: git fetch --no-insane emulation complete\n",
2652         Dumper(\%lrfetchrefs_f);
2653
2654     my %here;
2655     my @tagpats = debiantags('*',access_nomdistro);
2656
2657     git_for_each_ref([map { "refs/tags/$_" } @tagpats], sub {
2658         my ($objid,$objtype,$fullrefname,$reftail) = @_;
2659         printdebug "currently $fullrefname=$objid\n";
2660         $here{$fullrefname} = $objid;
2661     });
2662     git_for_each_ref([map { lrfetchrefs."/tags/".$_ } @tagpats], sub {
2663         my ($objid,$objtype,$fullrefname,$reftail) = @_;
2664         my $lref = "refs".substr($fullrefname, length(lrfetchrefs));
2665         printdebug "offered $lref=$objid\n";
2666         if (!defined $here{$lref}) {
2667             my @upd = (@git, qw(update-ref), $lref, $objid, '');
2668             runcmd_ordryrun_local @upd;
2669             lrfetchref_used $fullrefname;
2670         } elsif ($here{$lref} eq $objid) {
2671             lrfetchref_used $fullrefname;
2672         } else {
2673             print STDERR \
2674                 "Not updateting $lref from $here{$lref} to $objid.\n";
2675         }
2676     });
2677 }
2678
2679 sub mergeinfo_getclogp ($) {
2680     # Ensures thit $mi->{Clogp} exists and returns it
2681     my ($mi) = @_;
2682     $mi->{Clogp} = commit_getclogp($mi->{Commit});
2683 }
2684
2685 sub mergeinfo_version ($) {
2686     return getfield( (mergeinfo_getclogp $_[0]), 'Version' );
2687 }
2688
2689 sub fetch_from_archive_record_1 ($) {
2690     my ($hash) = @_;
2691     runcmd @git, qw(update-ref -m), "dgit fetch $csuite",
2692             'DGIT_ARCHIVE', $hash;
2693     cmdoutput @git, qw(log -n2), $hash;
2694     # ... gives git a chance to complain if our commit is malformed
2695 }
2696
2697 sub fetch_from_archive_record_2 ($) {
2698     my ($hash) = @_;
2699     my @upd_cmd = (@git, qw(update-ref -m), 'dgit fetch', lrref(), $hash);
2700     if (act_local()) {
2701         cmdoutput @upd_cmd;
2702     } else {
2703         dryrun_report @upd_cmd;
2704     }
2705 }
2706
2707 sub parse_dsc_field ($$) {
2708     my ($dsc, $what) = @_;
2709     my $f;
2710     foreach my $field (@ourdscfield) {
2711         $f = $dsc->{$field};
2712         last if defined $f;
2713     }
2714     if (!defined $f) {
2715         progress "$what: NO git hash";
2716     } elsif (($dsc_hash, $dsc_distro, $dsc_hint_tag, $dsc_hint_url)
2717              = $f =~ m/^(\w+) ($distro_re) ($versiontag_re) (\S+)(?:\s|$)/) {
2718         progress "$what: specified git info ($dsc_distro)";
2719         $dsc_hint_tag = [ $dsc_hint_tag ];
2720     } elsif ($f =~ m/^\w+\s*$/) {
2721         $dsc_hash = $&;
2722         $dsc_distro //= 'debian';
2723         $dsc_hint_tag = [ debiantags +(getfield $dsc, 'Version'),
2724                           $dsc_distro ];
2725         progress "$what: specified git hash";
2726     } else {
2727         fail "$what: invalid Dgit info";
2728     }
2729 }
2730
2731 sub fetch_from_archive () {
2732     ensure_setup_existing_tree();
2733
2734     # Ensures that lrref() is what is actually in the archive, one way
2735     # or another, according to us - ie this client's
2736     # appropritaely-updated archive view.  Also returns the commit id.
2737     # If there is nothing in the archive, leaves lrref alone and
2738     # returns undef.  git_fetch_us must have already been called.
2739     get_archive_dsc();
2740
2741     if ($dsc) {
2742         parse_dsc_field($dsc, 'last upload to archive');
2743     } else {
2744         progress "no version available from the archive";
2745     }
2746
2747     my $rewritemapdata = git_cat_file lrfetchrefs."/".$rewritemap.':map';
2748     if (defined $rewritemapdata
2749         && $rewritemapdata =~ m/^$dsc_hash(?:[ \t](\w+))/m) {
2750         progress "server's git history rewrite map contains a relevant entry!";
2751         $dsc_hash = $1;
2752         if (defined $dsc_hash) {
2753             progress "using rewritten git hash in place of .dsc value";
2754         } else {
2755             progress "server data says .dsc hash is to be disregarded";
2756         }
2757     }
2758
2759     # If the archive's .dsc has a Dgit field, there are three
2760     # relevant git commitids we need to choose between and/or merge
2761     # together:
2762     #   1. $dsc_hash: the Dgit field from the archive
2763     #   2. $lastpush_hash: the suite branch on the dgit git server
2764     #   3. $lastfetch_hash: our local tracking brach for the suite
2765     #
2766     # These may all be distinct and need not be in any fast forward
2767     # relationship:
2768     #
2769     # If the dsc was pushed to this suite, then the server suite
2770     # branch will have been updated; but it might have been pushed to
2771     # a different suite and copied by the archive.  Conversely a more
2772     # recent version may have been pushed with dgit but not appeared
2773     # in the archive (yet).
2774     #
2775     # $lastfetch_hash may be awkward because archive imports
2776     # (particularly, imports of Dgit-less .dscs) are performed only as
2777     # needed on individual clients, so different clients may perform a
2778     # different subset of them - and these imports are only made
2779     # public during push.  So $lastfetch_hash may represent a set of
2780     # imports different to a subsequent upload by a different dgit
2781     # client.
2782     #
2783     # Our approach is as follows:
2784     #
2785     # As between $dsc_hash and $lastpush_hash: if $lastpush_hash is a
2786     # descendant of $dsc_hash, then it was pushed by a dgit user who
2787     # had based their work on $dsc_hash, so we should prefer it.
2788     # Otherwise, $dsc_hash was installed into this suite in the
2789     # archive other than by a dgit push, and (necessarily) after the
2790     # last dgit push into that suite (since a dgit push would have
2791     # been descended from the dgit server git branch); thus, in that
2792     # case, we prefer the archive's version (and produce a
2793     # pseudo-merge to overwrite the dgit server git branch).
2794     #
2795     # (If there is no Dgit field in the archive's .dsc then
2796     # generate_commit_from_dsc uses the version numbers to decide
2797     # whether the suite branch or the archive is newer.  If the suite
2798     # branch is newer it ignores the archive's .dsc; otherwise it
2799     # generates an import of the .dsc, and produces a pseudo-merge to
2800     # overwrite the suite branch with the archive contents.)
2801     #
2802     # The outcome of that part of the algorithm is the `public view',
2803     # and is same for all dgit clients: it does not depend on any
2804     # unpublished history in the local tracking branch.
2805     #
2806     # As between the public view and the local tracking branch: The
2807     # local tracking branch is only updated by dgit fetch, and
2808     # whenever dgit fetch runs it includes the public view in the
2809     # local tracking branch.  Therefore if the public view is not
2810     # descended from the local tracking branch, the local tracking
2811     # branch must contain history which was imported from the archive
2812     # but never pushed; and, its tip is now out of date.  So, we make
2813     # a pseudo-merge to overwrite the old imports and stitch the old
2814     # history in.
2815     #
2816     # Finally: we do not necessarily reify the public view (as
2817     # described above).  This is so that we do not end up stacking two
2818     # pseudo-merges.  So what we actually do is figure out the inputs
2819     # to any public view pseudo-merge and put them in @mergeinputs.
2820
2821     my @mergeinputs;
2822     # $mergeinputs[]{Commit}
2823     # $mergeinputs[]{Info}
2824     # $mergeinputs[0] is the one whose tree we use
2825     # @mergeinputs is in the order we use in the actual commit)
2826     #
2827     # Also:
2828     # $mergeinputs[]{Message} is a commit message to use
2829     # $mergeinputs[]{ReverseParents} if def specifies that parent
2830     #                                list should be in opposite order
2831     # Such an entry has no Commit or Info.  It applies only when found
2832     # in the last entry.  (This ugliness is to support making
2833     # identical imports to previous dgit versions.)
2834
2835     my $lastpush_hash = git_get_ref(lrfetchref());
2836     printdebug "previous reference hash=$lastpush_hash\n";
2837     $lastpush_mergeinput = $lastpush_hash && {
2838         Commit => $lastpush_hash,
2839         Info => "dgit suite branch on dgit git server",
2840     };
2841
2842     my $lastfetch_hash = git_get_ref(lrref());
2843     printdebug "fetch_from_archive: lastfetch=$lastfetch_hash\n";
2844     my $lastfetch_mergeinput = $lastfetch_hash && {
2845         Commit => $lastfetch_hash,
2846         Info => "dgit client's archive history view",
2847     };
2848
2849     my $dsc_mergeinput = $dsc_hash && {
2850         Commit => $dsc_hash,
2851         Info => "Dgit field in .dsc from archive",
2852     };
2853
2854     my $cwd = getcwd();
2855     my $del_lrfetchrefs = sub {
2856         changedir $cwd;
2857         my $gur;
2858         printdebug "del_lrfetchrefs...\n";
2859         foreach my $fullrefname (sort keys %lrfetchrefs_d) {
2860             my $objid = $lrfetchrefs_d{$fullrefname};
2861             printdebug "del_lrfetchrefs: $objid $fullrefname\n";
2862             if (!$gur) {
2863                 $gur ||= new IO::Handle;
2864                 open $gur, "|-", qw(git update-ref --stdin) or die $!;
2865             }
2866             printf $gur "delete %s %s\n", $fullrefname, $objid;
2867         }
2868         if ($gur) {
2869             close $gur or failedcmd "git update-ref delete lrfetchrefs";
2870         }
2871     };
2872
2873     if (defined $dsc_hash) {
2874         ensure_we_have_orig();
2875         if (!$lastpush_hash || $dsc_hash eq $lastpush_hash) {
2876             @mergeinputs = $dsc_mergeinput
2877         } elsif (is_fast_fwd($dsc_hash,$lastpush_hash)) {
2878             print STDERR <<END or die $!;
2879
2880 Git commit in archive is behind the last version allegedly pushed/uploaded.
2881 Commit referred to by archive: $dsc_hash
2882 Last version pushed with dgit: $lastpush_hash
2883 $later_warning_msg
2884 END
2885             @mergeinputs = ($lastpush_mergeinput);
2886         } else {
2887             # Archive has .dsc which is not a descendant of the last dgit
2888             # push.  This can happen if the archive moves .dscs about.
2889             # Just follow its lead.
2890             if (is_fast_fwd($lastpush_hash,$dsc_hash)) {
2891                 progress "archive .dsc names newer git commit";
2892                 @mergeinputs = ($dsc_mergeinput);
2893             } else {
2894                 progress "archive .dsc names other git commit, fixing up";
2895                 @mergeinputs = ($dsc_mergeinput, $lastpush_mergeinput);
2896             }
2897         }
2898     } elsif ($dsc) {
2899         @mergeinputs = generate_commits_from_dsc();
2900         # We have just done an import.  Now, our import algorithm might
2901         # have been improved.  But even so we do not want to generate
2902         # a new different import of the same package.  So if the
2903         # version numbers are the same, just use our existing version.
2904         # If the version numbers are different, the archive has changed
2905         # (perhaps, rewound).
2906         if ($lastfetch_mergeinput &&
2907             !version_compare( (mergeinfo_version $lastfetch_mergeinput),
2908                               (mergeinfo_version $mergeinputs[0]) )) {
2909             @mergeinputs = ($lastfetch_mergeinput);
2910         }
2911     } elsif ($lastpush_hash) {
2912         # only in git, not in the archive yet
2913         @mergeinputs = ($lastpush_mergeinput);
2914         print STDERR <<END or die $!;
2915
2916 Package not found in the archive, but has allegedly been pushed using dgit.
2917 $later_warning_msg
2918 END
2919     } else {
2920         printdebug "nothing found!\n";
2921         if (defined $skew_warning_vsn) {
2922             print STDERR <<END or die $!;
2923
2924 Warning: relevant archive skew detected.
2925 Archive allegedly contains $skew_warning_vsn
2926 But we were not able to obtain any version from the archive or git.
2927
2928 END
2929         }
2930         unshift @end, $del_lrfetchrefs;
2931         return undef;
2932     }
2933
2934     if ($lastfetch_hash &&
2935         !grep {
2936             my $h = $_->{Commit};
2937             $h and is_fast_fwd($lastfetch_hash, $h);
2938             # If true, one of the existing parents of this commit
2939             # is a descendant of the $lastfetch_hash, so we'll
2940             # be ff from that automatically.
2941         } @mergeinputs
2942         ) {
2943         # Otherwise:
2944         push @mergeinputs, $lastfetch_mergeinput;
2945     }
2946
2947     printdebug "fetch mergeinfos:\n";
2948     foreach my $mi (@mergeinputs) {
2949         if ($mi->{Info}) {
2950             printdebug " commit $mi->{Commit} $mi->{Info}\n";
2951         } else {
2952             printdebug sprintf " ReverseParents=%d Message=%s",
2953                 $mi->{ReverseParents}, $mi->{Message};
2954         }
2955     }
2956
2957     my $compat_info= pop @mergeinputs
2958         if $mergeinputs[$#mergeinputs]{Message};
2959
2960     @mergeinputs = grep { defined $_->{Commit} } @mergeinputs;
2961
2962     my $hash;
2963     if (@mergeinputs > 1) {
2964         # here we go, then:
2965         my $tree_commit = $mergeinputs[0]{Commit};
2966
2967         my $tree = cmdoutput @git, qw(cat-file commit), $tree_commit;
2968         $tree =~ m/\n\n/;  $tree = $`;
2969         $tree =~ m/^tree (\w+)$/m or die "$dsc_hash tree ?";
2970         $tree = $1;
2971
2972         # We use the changelog author of the package in question the
2973         # author of this pseudo-merge.  This is (roughly) correct if
2974         # this commit is simply representing aa non-dgit upload.
2975         # (Roughly because it does not record sponsorship - but we
2976         # don't have sponsorship info because that's in the .changes,
2977         # which isn't in the archivw.)
2978         #
2979         # But, it might be that we are representing archive history
2980         # updates (including in-archive copies).  These are not really
2981         # the responsibility of the person who created the .dsc, but
2982         # there is no-one whose name we should better use.  (The
2983         # author of the .dsc-named commit is clearly worse.)
2984
2985         my $useclogp = mergeinfo_getclogp $mergeinputs[0];
2986         my $author = clogp_authline $useclogp;
2987         my $cversion = getfield $useclogp, 'Version';
2988
2989         my $mcf = ".git/dgit/mergecommit";
2990         open MC, ">", $mcf or die "$mcf $!";
2991         print MC <<END or die $!;
2992 tree $tree
2993 END
2994
2995         my @parents = grep { $_->{Commit} } @mergeinputs;
2996         @parents = reverse @parents if $compat_info->{ReverseParents};
2997         print MC <<END or die $! foreach @parents;
2998 parent $_->{Commit}
2999 END
3000
3001         print MC <<END or die $!;
3002 author $author
3003 committer $author
3004
3005 END
3006
3007         if (defined $compat_info->{Message}) {
3008             print MC $compat_info->{Message} or die $!;
3009         } else {
3010             print MC <<END or die $!;
3011 Record $package ($cversion) in archive suite $csuite
3012
3013 Record that
3014 END
3015             my $message_add_info = sub {
3016                 my ($mi) = (@_);
3017                 my $mversion = mergeinfo_version $mi;
3018                 printf MC "  %-20s %s\n", $mversion, $mi->{Info}
3019                     or die $!;
3020             };
3021
3022             $message_add_info->($mergeinputs[0]);
3023             print MC <<END or die $!;
3024 should be treated as descended from
3025 END
3026             $message_add_info->($_) foreach @mergeinputs[1..$#mergeinputs];
3027         }
3028
3029         close MC or die $!;
3030         $hash = make_commit $mcf;
3031     } else {
3032         $hash = $mergeinputs[0]{Commit};
3033     }
3034     printdebug "fetch hash=$hash\n";
3035
3036     my $chkff = sub {
3037         my ($lasth, $what) = @_;
3038         return unless $lasth;
3039         die "$lasth $hash $what ?" unless is_fast_fwd($lasth, $hash);
3040     };
3041
3042     $chkff->($lastpush_hash, 'dgit repo server tip (last push)')
3043         if $lastpush_hash;
3044     $chkff->($lastfetch_hash, 'local tracking tip (last fetch)');
3045
3046     fetch_from_archive_record_1($hash);
3047
3048     if (defined $skew_warning_vsn) {
3049         mkpath '.git/dgit';
3050         printdebug "SKEW CHECK WANT $skew_warning_vsn\n";
3051         my $gotclogp = commit_getclogp($hash);
3052         my $got_vsn = getfield $gotclogp, 'Version';
3053         printdebug "SKEW CHECK GOT $got_vsn\n";
3054         if (version_compare($got_vsn, $skew_warning_vsn) < 0) {
3055             print STDERR <<END or die $!;
3056
3057 Warning: archive skew detected.  Using the available version:
3058 Archive allegedly contains    $skew_warning_vsn
3059 We were able to obtain only   $got_vsn
3060
3061 END
3062         }
3063     }
3064
3065     if ($lastfetch_hash ne $hash) {
3066         fetch_from_archive_record_2($hash);
3067     }
3068
3069     lrfetchref_used lrfetchref();
3070
3071     unshift @end, $del_lrfetchrefs;
3072     return $hash;
3073 }
3074
3075 sub set_local_git_config ($$) {
3076     my ($k, $v) = @_;
3077     runcmd @git, qw(config), $k, $v;
3078 }
3079
3080 sub setup_mergechangelogs (;$) {
3081     my ($always) = @_;
3082     return unless $always || access_cfg_bool(1, 'setup-mergechangelogs');
3083
3084     my $driver = 'dpkg-mergechangelogs';
3085     my $cb = "merge.$driver";
3086     my $attrs = '.git/info/attributes';
3087     ensuredir '.git/info';
3088
3089     open NATTRS, ">", "$attrs.new" or die "$attrs.new $!";
3090     if (!open ATTRS, "<", $attrs) {
3091         $!==ENOENT or die "$attrs: $!";
3092     } else {
3093         while (<ATTRS>) {
3094             chomp;
3095             next if m{^debian/changelog\s};
3096             print NATTRS $_, "\n" or die $!;
3097         }
3098         ATTRS->error and die $!;
3099         close ATTRS;
3100     }
3101     print NATTRS "debian/changelog merge=$driver\n" or die $!;
3102     close NATTRS;
3103
3104     set_local_git_config "$cb.name", 'debian/changelog merge driver';
3105     set_local_git_config "$cb.driver", 'dpkg-mergechangelogs -m %O %A %B %A';
3106
3107     rename "$attrs.new", "$attrs" or die "$attrs: $!";
3108 }
3109
3110 sub setup_useremail (;$) {
3111     my ($always) = @_;
3112     return unless $always || access_cfg_bool(1, 'setup-useremail');
3113
3114     my $setup = sub {
3115         my ($k, $envvar) = @_;
3116         my $v = access_cfg("user-$k", 'RETURN-UNDEF') // $ENV{$envvar};
3117         return unless defined $v;
3118         set_local_git_config "user.$k", $v;
3119     };
3120
3121     $setup->('email', 'DEBEMAIL');
3122     $setup->('name', 'DEBFULLNAME');
3123 }
3124
3125 sub ensure_setup_existing_tree () {
3126     my $k = "remote.$remotename.skipdefaultupdate";
3127     my $c = git_get_config $k;
3128     return if defined $c;
3129     set_local_git_config $k, 'true';
3130 }
3131
3132 sub setup_new_tree () {
3133     setup_mergechangelogs();
3134     setup_useremail();
3135 }
3136
3137 sub multisuite_suite_child ($$$) {
3138     my ($tsuite, $merginputs, $fn) = @_;
3139     # in child, sets things up, calls $fn->(), and returns undef
3140     # in parent, returns canonical suite name for $tsuite
3141     my $canonsuitefh = IO::File::new_tmpfile;
3142     my $pid = fork // die $!;
3143     if (!$pid) {
3144         $isuite = $tsuite;
3145         $us .= " [$isuite]";
3146         $debugprefix .= " ";
3147         progress "fetching $tsuite...";
3148         canonicalise_suite();
3149         print $canonsuitefh $csuite, "\n" or die $!;
3150         close $canonsuitefh or die $!;
3151         $fn->();
3152         return undef;
3153     }
3154     waitpid $pid,0 == $pid or die $!;
3155     fail "failed to obtain $tsuite: ".waitstatusmsg() if $? && $?!=256*4;
3156     seek $canonsuitefh,0,0 or die $!;
3157     local $csuite = <$canonsuitefh>;
3158     die $! unless defined $csuite && chomp $csuite;
3159     if ($? == 256*4) {
3160         printdebug "multisuite $tsuite missing\n";
3161         return $csuite;
3162     }
3163     printdebug "multisuite $tsuite ok (canon=$csuite)\n";
3164     push @$merginputs, {
3165         Ref => lrref,
3166         Info => $csuite,
3167     };
3168     return $csuite;
3169 }
3170
3171 sub fork_for_multisuite ($) {
3172     my ($before_fetch_merge) = @_;
3173     # if nothing unusual, just returns ''
3174     #
3175     # if multisuite:
3176     # returns 0 to caller in child, to do first of the specified suites
3177     # in child, $csuite is not yet set
3178     #
3179     # returns 1 to caller in parent, to finish up anything needed after
3180     # in parent, $csuite is set to canonicalised portmanteau
3181
3182     my $org_isuite = $isuite;
3183     my @suites = split /\,/, $isuite;
3184     return '' unless @suites > 1;
3185     printdebug "fork_for_multisuite: @suites\n";
3186
3187     my @mergeinputs;
3188
3189     my $cbasesuite = multisuite_suite_child($suites[0], \@mergeinputs,
3190                                             sub { });
3191     return 0 unless defined $cbasesuite;
3192
3193     fail "package $package missing in (base suite) $cbasesuite"
3194         unless @mergeinputs;
3195
3196     my @csuites = ($cbasesuite);
3197
3198     $before_fetch_merge->();
3199
3200     foreach my $tsuite (@suites[1..$#suites]) {
3201         my $csubsuite = multisuite_suite_child($tsuite, \@mergeinputs,
3202                                                sub {
3203             @end = ();
3204             fetch();
3205             exit 0;
3206         });
3207         # xxx collecte the ref here
3208
3209         $csubsuite =~ s/^\Q$cbasesuite\E-/-/;
3210         push @csuites, $csubsuite;
3211     }
3212
3213     foreach my $mi (@mergeinputs) {
3214         my $ref = git_get_ref $mi->{Ref};
3215         die "$mi->{Ref} ?" unless length $ref;
3216         $mi->{Commit} = $ref;
3217     }
3218
3219     $csuite = join ",", @csuites;
3220
3221     my $previous = git_get_ref lrref;
3222     if ($previous) {
3223         unshift @mergeinputs, {
3224             Commit => $previous,
3225             Info => "local combined tracking branch",
3226             Warning =>
3227  "archive seems to have rewound: local tracking branch is ahead!",
3228         };
3229     }
3230
3231     foreach my $ix (0..$#mergeinputs) {
3232         $mergeinputs[$ix]{Index} = $ix;
3233     }
3234
3235     @mergeinputs = sort {
3236         -version_compare(mergeinfo_version $a,
3237                          mergeinfo_version $b) # highest version first
3238             or
3239         $a->{Index} <=> $b->{Index}; # earliest in spec first
3240     } @mergeinputs;
3241
3242     my @needed;
3243
3244   NEEDED:
3245     foreach my $mi (@mergeinputs) {
3246         printdebug "multisuite merge check $mi->{Info}\n";
3247         foreach my $previous (@needed) {
3248             next unless is_fast_fwd $mi->{Commit}, $previous->{Commit};
3249             printdebug "multisuite merge un-needed $previous->{Info}\n";
3250             next NEEDED;
3251         }
3252         push @needed, $mi;
3253         printdebug "multisuite merge this-needed\n";
3254         $mi->{Character} = '+';
3255     }
3256
3257     $needed[0]{Character} = '*';
3258
3259     my $output = $needed[0]{Commit};
3260
3261     if (@needed > 1) {
3262         printdebug "multisuite merge nontrivial\n";
3263         my $tree = cmdoutput qw(git rev-parse), $needed[0]{Commit}.':';
3264
3265         my $commit = "tree $tree\n";
3266         my $msg = "Combine archive branches $csuite [dgit]\n\n".
3267             "Input branches:\n";
3268
3269         foreach my $mi (sort { $a->{Index} <=> $b->{Index} } @mergeinputs) {
3270             printdebug "multisuite merge include $mi->{Info}\n";
3271             $mi->{Character} //= ' ';
3272             $commit .= "parent $mi->{Commit}\n";
3273             $msg .= sprintf " %s  %-25s %s\n",
3274                 $mi->{Character},
3275                 (mergeinfo_version $mi),
3276                 $mi->{Info};
3277         }
3278         my $authline = clogp_authline mergeinfo_getclogp $needed[0];
3279         $msg .= "\nKey\n".
3280             " * marks the highest version branch, which choose to use\n".
3281             " + marks each branch which was not already an ancestor\n\n".
3282             "[dgit multi-suite $csuite]\n";
3283         $commit .=
3284             "author $authline\n".
3285             "committer $authline\n\n";
3286         $output = make_commit_text $commit.$msg;
3287         printdebug "multisuite merge generated $output\n";
3288     }
3289
3290     fetch_from_archive_record_1($output);
3291     fetch_from_archive_record_2($output);
3292
3293     progress "calculated combined tracking suite $csuite";
3294
3295     return 1;
3296 }
3297
3298 sub clone_set_head () {
3299     open H, "> .git/HEAD" or die $!;
3300     print H "ref: ".lref()."\n" or die $!;
3301     close H or die $!;
3302 }
3303 sub clone_finish ($) {
3304     my ($dstdir) = @_;
3305     runcmd @git, qw(reset --hard), lrref();
3306     runcmd qw(bash -ec), <<'END';
3307         set -o pipefail
3308         git ls-tree -r --name-only -z HEAD | \
3309         xargs -0r touch -h -r . --
3310 END
3311     printdone "ready for work in $dstdir";
3312 }
3313
3314 sub clone ($) {
3315     my ($dstdir) = @_;
3316     badusage "dry run makes no sense with clone" unless act_local();
3317
3318     my $multi_fetched = fork_for_multisuite(sub {
3319         printdebug "multi clone before fetch merge\n";
3320         changedir $dstdir;
3321     });
3322     if ($multi_fetched) {
3323         printdebug "multi clone after fetch merge\n";
3324         clone_set_head();
3325         clone_finish($dstdir);
3326         exit 0;
3327     }
3328     printdebug "clone main body\n";
3329
3330     canonicalise_suite();
3331     my $hasgit = check_for_git();
3332     mkdir $dstdir or fail "create \`$dstdir': $!";
3333     changedir $dstdir;
3334     runcmd @git, qw(init -q);
3335     clone_set_head();
3336     my $giturl = access_giturl(1);
3337     if (defined $giturl) {
3338         runcmd @git, qw(remote add), 'origin', $giturl;
3339     }
3340     if ($hasgit) {
3341         progress "fetching existing git history";
3342         git_fetch_us();
3343         runcmd_ordryrun_local @git, qw(fetch origin);
3344     } else {
3345         progress "starting new git history";
3346     }
3347     fetch_from_archive() or no_such_package;
3348     my $vcsgiturl = $dsc->{'Vcs-Git'};
3349     if (length $vcsgiturl) {
3350         $vcsgiturl =~ s/\s+-b\s+\S+//g;
3351         runcmd @git, qw(remote add vcs-git), $vcsgiturl;
3352     }
3353     setup_new_tree();
3354     clone_finish($dstdir);
3355 }
3356
3357 sub fetch () {
3358     canonicalise_suite();
3359     if (check_for_git()) {
3360         git_fetch_us();
3361     }
3362     fetch_from_archive() or no_such_package();
3363     printdone "fetched into ".lrref();
3364 }
3365
3366 sub pull () {
3367     my $multi_fetched = fork_for_multisuite(sub { });
3368     fetch() unless $multi_fetched; # parent
3369     return if $multi_fetched eq '0'; # child
3370     runcmd_ordryrun_local @git, qw(merge -m),"Merge from $csuite [dgit]",
3371         lrref();
3372     printdone "fetched to ".lrref()." and merged into HEAD";
3373 }
3374
3375 sub check_not_dirty () {
3376     foreach my $f (qw(local-options local-patch-header)) {
3377         if (stat_exists "debian/source/$f") {
3378             fail "git tree contains debian/source/$f";
3379         }
3380     }
3381
3382     return if $ignoredirty;
3383
3384     my @cmd = (@git, qw(diff --quiet HEAD));
3385     debugcmd "+",@cmd;
3386     $!=0; $?=-1; system @cmd;
3387     return if !$?;
3388     if ($?==256) {
3389         fail "working tree is dirty (does not match HEAD)";
3390     } else {
3391         failedcmd @cmd;
3392     }
3393 }
3394
3395 sub commit_admin ($) {
3396     my ($m) = @_;
3397     progress "$m";
3398     runcmd_ordryrun_local @git, qw(commit -m), $m;
3399 }
3400
3401 sub commit_quilty_patch () {
3402     my $output = cmdoutput @git, qw(status --porcelain);
3403     my %adds;
3404     foreach my $l (split /\n/, $output) {
3405         next unless $l =~ m/\S/;
3406         if ($l =~ m{^(?:\?\?| M) (.pc|debian/patches)}) {
3407             $adds{$1}++;
3408         }
3409     }
3410     delete $adds{'.pc'}; # if there wasn't one before, don't add it
3411     if (!%adds) {
3412         progress "nothing quilty to commit, ok.";
3413         return;
3414     }
3415     my @adds = map { s/[][*?\\]/\\$&/g; $_; } sort keys %adds;
3416     runcmd_ordryrun_local @git, qw(add -f), @adds;
3417     commit_admin <<END
3418 Commit Debian 3.0 (quilt) metadata
3419
3420 [dgit ($our_version) quilt-fixup]
3421 END
3422 }
3423
3424 sub get_source_format () {
3425     my %options;
3426     if (open F, "debian/source/options") {
3427         while (<F>) {
3428             next if m/^\s*\#/;
3429             next unless m/\S/;
3430             s/\s+$//; # ignore missing final newline
3431             if (m/\s*\#\s*/) {
3432                 my ($k, $v) = ($`, $'); #');
3433                 $v =~ s/^"(.*)"$/$1/;
3434                 $options{$k} = $v;
3435             } else {
3436                 $options{$_} = 1;
3437             }
3438         }
3439         F->error and die $!;
3440         close F;
3441     } else {
3442         die $! unless $!==&ENOENT;
3443     }
3444
3445     if (!open F, "debian/source/format") {
3446         die $! unless $!==&ENOENT;
3447         return '';
3448     }
3449     $_ = <F>;
3450     F->error and die $!;
3451     chomp;
3452     return ($_, \%options);
3453 }
3454
3455 sub madformat_wantfixup ($) {
3456     my ($format) = @_;
3457     return 0 unless $format eq '3.0 (quilt)';
3458     our $quilt_mode_warned;
3459     if ($quilt_mode eq 'nocheck') {
3460         progress "Not doing any fixup of \`$format' due to".
3461             " ----no-quilt-fixup or --quilt=nocheck"
3462             unless $quilt_mode_warned++;
3463         return 0;
3464     }
3465     progress "Format \`$format', need to check/update patch stack"
3466         unless $quilt_mode_warned++;
3467     return 1;
3468 }
3469
3470 sub maybe_split_brain_save ($$$) {
3471     my ($headref, $dgitview, $msg) = @_;
3472     # => message fragment "$saved" describing disposition of $dgitview
3473     return "commit id $dgitview" unless defined $split_brain_save;
3474     my @cmd = (shell_cmd "cd ../../../..",
3475                @git, qw(update-ref -m),
3476                "dgit --dgit-view-save $msg HEAD=$headref",
3477                $split_brain_save, $dgitview);
3478     runcmd @cmd;
3479     return "and left in $split_brain_save";
3480 }
3481
3482 # An "infopair" is a tuple [ $thing, $what ]
3483 # (often $thing is a commit hash; $what is a description)
3484
3485 sub infopair_cond_equal ($$) {
3486     my ($x,$y) = @_;
3487     $x->[0] eq $y->[0] or fail <<END;
3488 $x->[1] ($x->[0]) not equal to $y->[1] ($y->[0])
3489 END
3490 };
3491
3492 sub infopair_lrf_tag_lookup ($$) {
3493     my ($tagnames, $what) = @_;
3494     # $tagname may be an array ref
3495     my @tagnames = ref $tagnames ? @$tagnames : ($tagnames);
3496     printdebug "infopair_lrfetchref_tag_lookup $what @tagnames\n";
3497     foreach my $tagname (@tagnames) {
3498         my $lrefname = lrfetchrefs."/tags/$tagname";
3499         my $tagobj = $lrfetchrefs_f{$lrefname};
3500         next unless defined $tagobj;
3501         printdebug "infopair_lrfetchref_tag_lookup $tagobj $tagname $what\n";
3502         return [ git_rev_parse($tagobj), $what ];
3503     }
3504     fail @tagnames==1 ? <<END : <<END;
3505 Wanted tag $what (@tagnames) on dgit server, but not found
3506 END
3507 Wanted tag $what (one of: @tagnames) on dgit server, but not found
3508 END
3509 }
3510
3511 sub infopair_cond_ff ($$) {
3512     my ($anc,$desc) = @_;
3513     is_fast_fwd($anc->[0], $desc->[0]) or fail <<END;
3514 $anc->[1] ($anc->[0]) .. $desc->[1] ($desc->[0]) is not fast forward
3515 END
3516 };
3517
3518 sub pseudomerge_version_check ($$) {
3519     my ($clogp, $archive_hash) = @_;
3520
3521     my $arch_clogp = commit_getclogp $archive_hash;
3522     my $i_arch_v = [ (getfield $arch_clogp, 'Version'),
3523                      'version currently in archive' ];
3524     if (defined $overwrite_version) {
3525         if (length $overwrite_version) {
3526             infopair_cond_equal([ $overwrite_version,
3527                                   '--overwrite= version' ],
3528                                 $i_arch_v);
3529         } else {
3530             my $v = $i_arch_v->[0];
3531             progress "Checking package changelog for archive version $v ...";
3532             eval {
3533                 my @xa = ("-f$v", "-t$v");
3534                 my $vclogp = parsechangelog @xa;
3535                 my $cv = [ (getfield $vclogp, 'Version'),
3536                            "Version field from dpkg-parsechangelog @xa" ];
3537                 infopair_cond_equal($i_arch_v, $cv);
3538             };
3539             if ($@) {
3540                 $@ =~ s/^dgit: //gm;
3541                 fail "$@".
3542                     "Perhaps debian/changelog does not mention $v ?";
3543             }
3544         }
3545     }
3546     
3547     printdebug "pseudomerge_version_check i_arch_v @$i_arch_v\n";
3548     return $i_arch_v;
3549 }
3550
3551 sub pseudomerge_make_commit ($$$$ $$) {
3552     my ($clogp, $dgitview, $archive_hash, $i_arch_v,
3553         $msg_cmd, $msg_msg) = @_;
3554     progress "Declaring that HEAD inciudes all changes in $i_arch_v->[0]...";
3555
3556     my $tree = cmdoutput qw(git rev-parse), "${dgitview}:";
3557     my $authline = clogp_authline $clogp;
3558
3559     chomp $msg_msg;
3560     $msg_cmd .=
3561         !defined $overwrite_version ? ""
3562         : !length  $overwrite_version ? " --overwrite"
3563         : " --overwrite=".$overwrite_version;
3564
3565     mkpath '.git/dgit';
3566     my $pmf = ".git/dgit/pseudomerge";
3567     open MC, ">", $pmf or die "$pmf $!";
3568     print MC <<END or die $!;
3569 tree $tree
3570 parent $dgitview
3571 parent $archive_hash
3572 author $authline
3573 committer $authline
3574
3575 $msg_msg
3576
3577 [$msg_cmd]
3578 END
3579     close MC or die $!;
3580
3581     return make_commit($pmf);
3582 }
3583
3584 sub splitbrain_pseudomerge ($$$$) {
3585     my ($clogp, $maintview, $dgitview, $archive_hash) = @_;
3586     # => $merged_dgitview
3587     printdebug "splitbrain_pseudomerge...\n";
3588     #
3589     #     We:      debian/PREVIOUS    HEAD($maintview)
3590     # expect:          o ----------------- o
3591     #                    \                   \
3592     #                     o                   o
3593     #                 a/d/PREVIOUS        $dgitview
3594     #                $archive_hash              \
3595     #  If so,                \                   \
3596     #  we do:                 `------------------ o
3597     #   this:                                   $dgitview'
3598     #
3599
3600     return $dgitview unless defined $archive_hash;
3601
3602     printdebug "splitbrain_pseudomerge...\n";
3603
3604     my $i_arch_v = pseudomerge_version_check($clogp, $archive_hash);
3605
3606     if (!defined $overwrite_version) {
3607         progress "Checking that HEAD inciudes all changes in archive...";
3608     }
3609
3610     return $dgitview if is_fast_fwd $archive_hash, $dgitview;
3611
3612     if (defined $overwrite_version) {
3613     } elsif (!eval {
3614         my $t_dep14 = debiantag_maintview $i_arch_v->[0], access_nomdistro;
3615         my $i_dep14 = infopair_lrf_tag_lookup($t_dep14, "maintainer view tag");
3616         my $t_dgit = debiantag_new $i_arch_v->[0], access_nomdistro;
3617         my $i_dgit = infopair_lrf_tag_lookup($t_dgit, "dgit view tag");
3618         my $i_archive = [ $archive_hash, "current archive contents" ];
3619
3620         printdebug "splitbrain_pseudomerge i_archive @$i_archive\n";
3621
3622         infopair_cond_equal($i_dgit, $i_archive);
3623         infopair_cond_ff($i_dep14, $i_dgit);
3624         infopair_cond_ff($i_dep14, [ $maintview, 'HEAD' ]);
3625         1;
3626     }) {
3627         print STDERR <<END;
3628 $us: check failed (maybe --overwrite is needed, consult documentation)
3629 END
3630         die "$@";
3631     }
3632
3633     my $r = pseudomerge_make_commit
3634         $clogp, $dgitview, $archive_hash, $i_arch_v,
3635         "dgit --quilt=$quilt_mode",
3636         (defined $overwrite_version ? <<END_OVERWR : <<END_MAKEFF);
3637 Declare fast forward from $i_arch_v->[0]
3638 END_OVERWR
3639 Make fast forward from $i_arch_v->[0]
3640 END_MAKEFF
3641
3642     maybe_split_brain_save $maintview, $r, "pseudomerge";
3643
3644     progress "Made pseudo-merge of $i_arch_v->[0] into dgit view.";
3645     return $r;
3646 }       
3647
3648 sub plain_overwrite_pseudomerge ($$$) {
3649     my ($clogp, $head, $archive_hash) = @_;
3650
3651     printdebug "plain_overwrite_pseudomerge...";
3652
3653     my $i_arch_v = pseudomerge_version_check($clogp, $archive_hash);
3654
3655     return $head if is_fast_fwd $archive_hash, $head;
3656
3657     my $m = "Declare fast forward from $i_arch_v->[0]";
3658
3659     my $r = pseudomerge_make_commit
3660         $clogp, $head, $archive_hash, $i_arch_v,
3661         "dgit", $m;
3662
3663     runcmd @git, qw(update-ref -m), $m, 'HEAD', $r, $head;
3664
3665     progress "Make pseudo-merge of $i_arch_v->[0] into your HEAD.";
3666     return $r;
3667 }
3668
3669 sub push_parse_changelog ($) {
3670     my ($clogpfn) = @_;
3671
3672     my $clogp = Dpkg::Control::Hash->new();
3673     $clogp->load($clogpfn) or die;
3674
3675     my $clogpackage = getfield $clogp, 'Source';
3676     $package //= $clogpackage;
3677     fail "-p specified $package but changelog specified $clogpackage"
3678         unless $package eq $clogpackage;
3679     my $cversion = getfield $clogp, 'Version';
3680     my $tag = debiantag($cversion, access_nomdistro);
3681     runcmd @git, qw(check-ref-format), $tag;
3682
3683     my $dscfn = dscfn($cversion);
3684
3685     return ($clogp, $cversion, $dscfn);
3686 }
3687
3688 sub push_parse_dsc ($$$) {
3689     my ($dscfn,$dscfnwhat, $cversion) = @_;
3690     $dsc = parsecontrol($dscfn,$dscfnwhat);
3691     my $dversion = getfield $dsc, 'Version';
3692     my $dscpackage = getfield $dsc, 'Source';
3693     ($dscpackage eq $package && $dversion eq $cversion) or
3694         fail "$dscfn is for $dscpackage $dversion".
3695             " but debian/changelog is for $package $cversion";
3696 }
3697
3698 sub push_tagwants ($$$$) {
3699     my ($cversion, $dgithead, $maintviewhead, $tfbase) = @_;
3700     my @tagwants;
3701     push @tagwants, {
3702         TagFn => \&debiantag,
3703         Objid => $dgithead,
3704         TfSuffix => '',
3705         View => 'dgit',
3706     };
3707     if (defined $maintviewhead) {
3708         push @tagwants, {
3709             TagFn => \&debiantag_maintview,
3710             Objid => $maintviewhead,
3711             TfSuffix => '-maintview',
3712             View => 'maint',
3713         };
3714     } elsif ($dodep14tag eq 'no' ? 0
3715              : $dodep14tag eq 'want' ? access_cfg_tagformats_can_splitbrain
3716              : $dodep14tag eq 'always'
3717              ? (access_cfg_tagformats_can_splitbrain or fail <<END)
3718 --dep14tag-always (or equivalent in config) means server must support
3719  both "new" and "maint" tag formats, but config says it doesn't.
3720 END
3721             : die "$dodep14tag ?") {
3722         push @tagwants, {