chiark / gitweb /
directory refactoring: Rename no_local_git_cfg
[dgit.git] / dgit
1 #!/usr/bin/perl -w
2 # dgit
3 # Integration between git and Debian-style archives
4 #
5 # Copyright (C)2013-2016 Ian Jackson
6 #
7 # This program is free software: you can redistribute it and/or modify
8 # it under the terms of the GNU General Public License as published by
9 # the Free Software Foundation, either version 3 of the License, or
10 # (at your option) any later version.
11 #
12 # This program is distributed in the hope that it will be useful,
13 # but WITHOUT ANY WARRANTY; without even the implied warranty of
14 # MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
15 # GNU General Public License for more details.
16 #
17 # You should have received a copy of the GNU General Public License
18 # along with this program.  If not, see <http://www.gnu.org/licenses/>.
19
20 use strict;
21
22 use Debian::Dgit qw(:DEFAULT :playground);
23 setup_sigwarn();
24
25 use IO::Handle;
26 use Data::Dumper;
27 use LWP::UserAgent;
28 use Dpkg::Control::Hash;
29 use File::Path;
30 use File::Temp qw(tempdir);
31 use File::Basename;
32 use Dpkg::Version;
33 use POSIX;
34 use IPC::Open2;
35 use Digest::SHA;
36 use Digest::MD5;
37 use List::MoreUtils qw(pairwise);
38 use Text::Glob qw(match_glob);
39 use Fcntl qw(:DEFAULT :flock);
40 use Carp;
41
42 use Debian::Dgit;
43
44 our $our_version = 'UNRELEASED'; ###substituted###
45 our $absurdity = undef; ###substituted###
46
47 our @rpushprotovsn_support = qw(4 3 2); # 4 is new tag format
48 our $protovsn;
49
50 our $cmd;
51 our $subcommand;
52 our $isuite;
53 our $idistro;
54 our $package;
55 our @ropts;
56
57 our $sign = 1;
58 our $dryrun_level = 0;
59 our $changesfile;
60 our $buildproductsdir = '..';
61 our $new_package = 0;
62 our $ignoredirty = 0;
63 our $rmonerror = 1;
64 our @deliberatelies;
65 our %previously;
66 our $existing_package = 'dpkg';
67 our $cleanmode;
68 our $changes_since_version;
69 our $rmchanges;
70 our $overwrite_version; # undef: not specified; '': check changelog
71 our $quilt_mode;
72 our $quilt_modes_re = 'linear|smash|auto|nofix|nocheck|gbp|dpm|unapplied';
73 our $dodep14tag;
74 our $split_brain_save;
75 our $we_are_responder;
76 our $we_are_initiator;
77 our $initiator_tempdir;
78 our $patches_applied_dirtily = 00;
79 our $tagformat_want;
80 our $tagformat;
81 our $tagformatfn;
82 our $chase_dsc_distro=1;
83
84 our %forceopts = map { $_=>0 }
85     qw(unrepresentable unsupported-source-format
86        dsc-changes-mismatch changes-origs-exactly
87        import-gitapply-absurd
88        import-gitapply-no-absurd
89        import-dsc-with-dgit-field);
90
91 our %format_ok = map { $_=>1 } ("1.0","3.0 (native)","3.0 (quilt)");
92
93 our $suite_re = '[-+.0-9a-z]+';
94 our $cleanmode_re = 'dpkg-source(?:-d)?|git|git-ff|check|none';
95 our $orig_f_comp_re = 'orig(?:-[-0-9a-z]+)?';
96 our $orig_f_sig_re = '\\.(?:asc|gpg|pgp)';
97 our $orig_f_tail_re = "$orig_f_comp_re\\.tar(?:\\.\\w+)?(?:$orig_f_sig_re)?";
98
99 our $git_authline_re = '^([^<>]+) \<(\S+)\> (\d+ [-+]\d+)$';
100 our $splitbraincache = 'dgit-intern/quilt-cache';
101 our $rewritemap = 'dgit-rewrite/map';
102
103 our (@git) = qw(git);
104 our (@dget) = qw(dget);
105 our (@curl) = (qw(curl --proto-redir), '-all,http,https', qw(-L));
106 our (@dput) = qw(dput);
107 our (@debsign) = qw(debsign);
108 our (@gpg) = qw(gpg);
109 our (@sbuild) = qw(sbuild);
110 our (@ssh) = 'ssh';
111 our (@dgit) = qw(dgit);
112 our (@aptget) = qw(apt-get);
113 our (@aptcache) = qw(apt-cache);
114 our (@dpkgbuildpackage) = qw(dpkg-buildpackage -i\.git/ -I.git);
115 our (@dpkgsource) = qw(dpkg-source -i\.git/ -I.git);
116 our (@dpkggenchanges) = qw(dpkg-genchanges);
117 our (@mergechanges) = qw(mergechanges -f);
118 our (@gbp_build) = ('');
119 our (@gbp_pq) = ('gbp pq');
120 our (@changesopts) = ('');
121
122 our %opts_opt_map = ('dget' => \@dget, # accept for compatibility
123                      'curl' => \@curl,
124                      'dput' => \@dput,
125                      'debsign' => \@debsign,
126                      'gpg' => \@gpg,
127                      'sbuild' => \@sbuild,
128                      'ssh' => \@ssh,
129                      'dgit' => \@dgit,
130                      'git' => \@git,
131                      'apt-get' => \@aptget,
132                      'apt-cache' => \@aptcache,
133                      'dpkg-source' => \@dpkgsource,
134                      'dpkg-buildpackage' => \@dpkgbuildpackage,
135                      'dpkg-genchanges' => \@dpkggenchanges,
136                      'gbp-build' => \@gbp_build,
137                      'gbp-pq' => \@gbp_pq,
138                      'ch' => \@changesopts,
139                      'mergechanges' => \@mergechanges);
140
141 our %opts_opt_cmdonly = ('gpg' => 1, 'git' => 1);
142 our %opts_cfg_insertpos = map {
143     $_,
144     scalar @{ $opts_opt_map{$_} }
145 } keys %opts_opt_map;
146
147 sub parseopts_late_defaults();
148 sub setup_gitattrs(;$);
149 sub check_gitattrs($$);
150
151 our $keyid;
152
153 autoflush STDOUT 1;
154
155 our $supplementary_message = '';
156 our $need_split_build_invocation = 0;
157 our $split_brain = 0;
158
159 END {
160     local ($@, $?);
161     return unless forkcheck_mainprocess();
162     print STDERR "! $_\n" foreach $supplementary_message =~ m/^.+$/mg;
163 }
164
165 our $remotename = 'dgit';
166 our @ourdscfield = qw(Dgit Vcs-Dgit-Master);
167 our $csuite;
168 our $instead_distro;
169
170 if (!defined $absurdity) {
171     $absurdity = $0;
172     $absurdity =~ s{/[^/]+$}{/absurd} or die;
173 }
174
175 sub debiantag ($$) {
176     my ($v,$distro) = @_;
177     return $tagformatfn->($v, $distro);
178 }
179
180 sub debiantag_maintview ($$) { 
181     my ($v,$distro) = @_;
182     return "$distro/".dep14_version_mangle $v;
183 }
184
185 sub madformat ($) { $_[0] eq '3.0 (quilt)' }
186
187 sub lbranch () { return "$branchprefix/$csuite"; }
188 my $lbranch_re = '^refs/heads/'.$branchprefix.'/([^/.]+)$';
189 sub lref () { return "refs/heads/".lbranch(); }
190 sub lrref () { return "refs/remotes/$remotename/".server_branch($csuite); }
191 sub rrref () { return server_ref($csuite); }
192
193 sub stripepoch ($) {
194     my ($vsn) = @_;
195     $vsn =~ s/^\d+\://;
196     return $vsn;
197 }
198
199 sub srcfn ($$) {
200     my ($vsn,$sfx) = @_;
201     return "${package}_".(stripepoch $vsn).$sfx
202 }
203
204 sub dscfn ($) {
205     my ($vsn) = @_;
206     return srcfn($vsn,".dsc");
207 }
208
209 sub changespat ($;$) {
210     my ($vsn, $arch) = @_;
211     return "${package}_".(stripepoch $vsn)."_".($arch//'*').".changes";
212 }
213
214 sub upstreamversion ($) {
215     my ($vsn) = @_;
216     $vsn =~ s/-[^-]+$//;
217     return $vsn;
218 }
219
220 our $us = 'dgit';
221 initdebug('');
222
223 our @end;
224 END { 
225     local ($?);
226     return unless forkcheck_mainprocess();
227     foreach my $f (@end) {
228         eval { $f->(); };
229         print STDERR "$us: cleanup: $@" if length $@;
230     }
231 };
232
233 sub badcfg { print STDERR "$us: invalid configuration: @_\n"; exit 12; }
234
235 sub forceable_fail ($$) {
236     my ($forceoptsl, $msg) = @_;
237     fail $msg unless grep { $forceopts{$_} } @$forceoptsl;
238     print STDERR "warning: overriding problem due to --force:\n". $msg;
239 }
240
241 sub forceing ($) {
242     my ($forceoptsl) = @_;
243     my @got = grep { $forceopts{$_} } @$forceoptsl;
244     return 0 unless @got;
245     print STDERR
246  "warning: skipping checks or functionality due to --force-$got[0]\n";
247 }
248
249 sub no_such_package () {
250     print STDERR "$us: package $package does not exist in suite $isuite\n";
251     exit 4;
252 }
253
254 sub deliberately ($) {
255     my ($enquiry) = @_;
256     return !!grep { $_ eq "--deliberately-$enquiry" } @deliberatelies;
257 }
258
259 sub deliberately_not_fast_forward () {
260     foreach (qw(not-fast-forward fresh-repo)) {
261         return 1 if deliberately($_) || deliberately("TEST-dgit-only-$_");
262     }
263 }
264
265 sub quiltmode_splitbrain () {
266     $quilt_mode =~ m/gbp|dpm|unapplied/;
267 }
268
269 sub opts_opt_multi_cmd {
270     my @cmd;
271     push @cmd, split /\s+/, shift @_;
272     push @cmd, @_;
273     @cmd;
274 }
275
276 sub gbp_pq {
277     return opts_opt_multi_cmd @gbp_pq;
278 }
279
280 #---------- remote protocol support, common ----------
281
282 # remote push initiator/responder protocol:
283 #  $ dgit remote-push-build-host <n-rargs> <rargs>... <push-args>...
284 #  where <rargs> is <push-host-dir> <supported-proto-vsn>,... ...
285 #  < dgit-remote-push-ready <actual-proto-vsn>
286 #
287 # occasionally:
288 #
289 #  > progress NBYTES
290 #  [NBYTES message]
291 #
292 #  > supplementary-message NBYTES          # $protovsn >= 3
293 #  [NBYTES message]
294 #
295 # main sequence:
296 #
297 #  > file parsed-changelog
298 #  [indicates that output of dpkg-parsechangelog follows]
299 #  > data-block NBYTES
300 #  > [NBYTES bytes of data (no newline)]
301 #  [maybe some more blocks]
302 #  > data-end
303 #
304 #  > file dsc
305 #  [etc]
306 #
307 #  > file changes
308 #  [etc]
309 #
310 #  > param head DGIT-VIEW-HEAD
311 #  > param csuite SUITE
312 #  > param tagformat old|new
313 #  > param maint-view MAINT-VIEW-HEAD
314 #
315 #  > param buildinfo-filename P_V_X.buildinfo   # zero or more times
316 #  > file buildinfo                             # for buildinfos to sign
317 #
318 #  > previously REFNAME=OBJNAME       # if --deliberately-not-fast-forward
319 #                                     # goes into tag, for replay prevention
320 #
321 #  > want signed-tag
322 #  [indicates that signed tag is wanted]
323 #  < data-block NBYTES
324 #  < [NBYTES bytes of data (no newline)]
325 #  [maybe some more blocks]
326 #  < data-end
327 #  < files-end
328 #
329 #  > want signed-dsc-changes
330 #  < data-block NBYTES    [transfer of signed dsc]
331 #  [etc]
332 #  < data-block NBYTES    [transfer of signed changes]
333 #  [etc]
334 #  < data-block NBYTES    [transfer of each signed buildinfo
335 #  [etc]                   same number and order as "file buildinfo"]
336 #  ...
337 #  < files-end
338 #
339 #  > complete
340
341 our $i_child_pid;
342
343 sub i_child_report () {
344     # Sees if our child has died, and reap it if so.  Returns a string
345     # describing how it died if it failed, or undef otherwise.
346     return undef unless $i_child_pid;
347     my $got = waitpid $i_child_pid, WNOHANG;
348     return undef if $got <= 0;
349     die unless $got == $i_child_pid;
350     $i_child_pid = undef;
351     return undef unless $?;
352     return "build host child ".waitstatusmsg();
353 }
354
355 sub badproto ($$) {
356     my ($fh, $m) = @_;
357     fail "connection lost: $!" if $fh->error;
358     fail "protocol violation; $m not expected";
359 }
360
361 sub badproto_badread ($$) {
362     my ($fh, $wh) = @_;
363     fail "connection lost: $!" if $!;
364     my $report = i_child_report();
365     fail $report if defined $report;
366     badproto $fh, "eof (reading $wh)";
367 }
368
369 sub protocol_expect (&$) {
370     my ($match, $fh) = @_;
371     local $_;
372     $_ = <$fh>;
373     defined && chomp or badproto_badread $fh, "protocol message";
374     if (wantarray) {
375         my @r = &$match;
376         return @r if @r;
377     } else {
378         my $r = &$match;
379         return $r if $r;
380     }
381     badproto $fh, "\`$_'";
382 }
383
384 sub protocol_send_file ($$) {
385     my ($fh, $ourfn) = @_;
386     open PF, "<", $ourfn or die "$ourfn: $!";
387     for (;;) {
388         my $d;
389         my $got = read PF, $d, 65536;
390         die "$ourfn: $!" unless defined $got;
391         last if !$got;
392         print $fh "data-block ".length($d)."\n" or die $!;
393         print $fh $d or die $!;
394     }
395     PF->error and die "$ourfn $!";
396     print $fh "data-end\n" or die $!;
397     close PF;
398 }
399
400 sub protocol_read_bytes ($$) {
401     my ($fh, $nbytes) = @_;
402     $nbytes =~ m/^[1-9]\d{0,5}$|^0$/ or badproto \*RO, "bad byte count";
403     my $d;
404     my $got = read $fh, $d, $nbytes;
405     $got==$nbytes or badproto_badread $fh, "data block";
406     return $d;
407 }
408
409 sub protocol_receive_file ($$) {
410     my ($fh, $ourfn) = @_;
411     printdebug "() $ourfn\n";
412     open PF, ">", $ourfn or die "$ourfn: $!";
413     for (;;) {
414         my ($y,$l) = protocol_expect {
415             m/^data-block (.*)$/ ? (1,$1) :
416             m/^data-end$/ ? (0,) :
417             ();
418         } $fh;
419         last unless $y;
420         my $d = protocol_read_bytes $fh, $l;
421         print PF $d or die $!;
422     }
423     close PF or die $!;
424 }
425
426 #---------- remote protocol support, responder ----------
427
428 sub responder_send_command ($) {
429     my ($command) = @_;
430     return unless $we_are_responder;
431     # called even without $we_are_responder
432     printdebug ">> $command\n";
433     print PO $command, "\n" or die $!;
434 }    
435
436 sub responder_send_file ($$) {
437     my ($keyword, $ourfn) = @_;
438     return unless $we_are_responder;
439     printdebug "]] $keyword $ourfn\n";
440     responder_send_command "file $keyword";
441     protocol_send_file \*PO, $ourfn;
442 }
443
444 sub responder_receive_files ($@) {
445     my ($keyword, @ourfns) = @_;
446     die unless $we_are_responder;
447     printdebug "[[ $keyword @ourfns\n";
448     responder_send_command "want $keyword";
449     foreach my $fn (@ourfns) {
450         protocol_receive_file \*PI, $fn;
451     }
452     printdebug "[[\$\n";
453     protocol_expect { m/^files-end$/ } \*PI;
454 }
455
456 #---------- remote protocol support, initiator ----------
457
458 sub initiator_expect (&) {
459     my ($match) = @_;
460     protocol_expect { &$match } \*RO;
461 }
462
463 #---------- end remote code ----------
464
465 sub progress {
466     if ($we_are_responder) {
467         my $m = join '', @_;
468         responder_send_command "progress ".length($m) or die $!;
469         print PO $m or die $!;
470     } else {
471         print @_, "\n";
472     }
473 }
474
475 our $ua;
476
477 sub url_get {
478     if (!$ua) {
479         $ua = LWP::UserAgent->new();
480         $ua->env_proxy;
481     }
482     my $what = $_[$#_];
483     progress "downloading $what...";
484     my $r = $ua->get(@_) or die $!;
485     return undef if $r->code == 404;
486     $r->is_success or fail "failed to fetch $what: ".$r->status_line;
487     return $r->decoded_content(charset => 'none');
488 }
489
490 our ($dscdata,$dscurl,$dsc,$dsc_checked,$skew_warning_vsn);
491
492 sub act_local () { return $dryrun_level <= 1; }
493 sub act_scary () { return !$dryrun_level; }
494
495 sub printdone {
496     if (!$dryrun_level) {
497         progress "$us ok: @_";
498     } else {
499         progress "would be ok: @_ (but dry run only)";
500     }
501 }
502
503 sub dryrun_report {
504     printcmd(\*STDERR,$debugprefix."#",@_);
505 }
506
507 sub runcmd_ordryrun {
508     if (act_scary()) {
509         runcmd @_;
510     } else {
511         dryrun_report @_;
512     }
513 }
514
515 sub runcmd_ordryrun_local {
516     if (act_local()) {
517         runcmd @_;
518     } else {
519         dryrun_report @_;
520     }
521 }
522
523 sub shell_cmd {
524     my ($first_shell, @cmd) = @_;
525     return qw(sh -ec), $first_shell.'; exec "$@"', 'x', @cmd;
526 }
527
528 our $helpmsg = <<END;
529 main usages:
530   dgit [dgit-opts] clone [dgit-opts] package [suite] [./dir|/dir]
531   dgit [dgit-opts] fetch|pull [dgit-opts] [suite]
532   dgit [dgit-opts] build [dpkg-buildpackage-opts]
533   dgit [dgit-opts] sbuild [sbuild-opts]
534   dgit [dgit-opts] push [dgit-opts] [suite]
535   dgit [dgit-opts] rpush build-host:build-dir ...
536 important dgit options:
537   -k<keyid>           sign tag and package with <keyid> instead of default
538   --dry-run -n        do not change anything, but go through the motions
539   --damp-run -L       like --dry-run but make local changes, without signing
540   --new -N            allow introducing a new package
541   --debug -D          increase debug level
542   -c<name>=<value>    set git config option (used directly by dgit too)
543 END
544
545 our $later_warning_msg = <<END;
546 Perhaps the upload is stuck in incoming.  Using the version from git.
547 END
548
549 sub badusage {
550     print STDERR "$us: @_\n", $helpmsg or die $!;
551     exit 8;
552 }
553
554 sub nextarg {
555     @ARGV or badusage "too few arguments";
556     return scalar shift @ARGV;
557 }
558
559 sub pre_help () {
560     not_necessarily_a_tree();
561 }
562 sub cmd_help () {
563     print $helpmsg or die $!;
564     exit 0;
565 }
566
567 our $td = $ENV{DGIT_TEST_DUMMY_DIR} || "DGIT_TEST_DUMMY_DIR-unset";
568
569 our %defcfg = ('dgit.default.distro' => 'debian',
570                'dgit.default.default-suite' => 'unstable',
571                'dgit.default.old-dsc-distro' => 'debian',
572                'dgit-suite.*-security.distro' => 'debian-security',
573                'dgit.default.username' => '',
574                'dgit.default.archive-query-default-component' => 'main',
575                'dgit.default.ssh' => 'ssh',
576                'dgit.default.archive-query' => 'madison:',
577                'dgit.default.sshpsql-dbname' => 'service=projectb',
578                'dgit.default.aptget-components' => 'main',
579                'dgit.default.dgit-tag-format' => 'new,old,maint',
580                'dgit.dsc-url-proto-ok.http'    => 'true',
581                'dgit.dsc-url-proto-ok.https'   => 'true',
582                'dgit.dsc-url-proto-ok.git'     => 'true',
583                'dgit.default.dsc-url-proto-ok' => 'false',
584                # old means "repo server accepts pushes with old dgit tags"
585                # new means "repo server accepts pushes with new dgit tags"
586                # maint means "repo server accepts split brain pushes"
587                # hist means "repo server may have old pushes without new tag"
588                #   ("hist" is implied by "old")
589                'dgit-distro.debian.archive-query' => 'ftpmasterapi:',
590                'dgit-distro.debian.git-check' => 'url',
591                'dgit-distro.debian.git-check-suffix' => '/info/refs',
592                'dgit-distro.debian.new-private-pushers' => 't',
593                'dgit-distro.debian/push.git-url' => '',
594                'dgit-distro.debian/push.git-host' => 'push.dgit.debian.org',
595                'dgit-distro.debian/push.git-user-force' => 'dgit',
596                'dgit-distro.debian/push.git-proto' => 'git+ssh://',
597                'dgit-distro.debian/push.git-path' => '/dgit/debian/repos',
598                'dgit-distro.debian/push.git-create' => 'true',
599                'dgit-distro.debian/push.git-check' => 'ssh-cmd',
600  'dgit-distro.debian.archive-query-url', 'https://api.ftp-master.debian.org/',
601 # 'dgit-distro.debian.archive-query-tls-key',
602 #    '/etc/ssl/certs/%HOST%.pem:/etc/dgit/%HOST%.pem',
603 # ^ this does not work because curl is broken nowadays
604 # Fixing #790093 properly will involve providing providing the key
605 # in some pacagke and maybe updating these paths.
606 #
607 # 'dgit-distro.debian.archive-query-tls-curl-args',
608 #   '--ca-path=/etc/ssl/ca-debian',
609 # ^ this is a workaround but works (only) on DSA-administered machines
610                'dgit-distro.debian.git-url' => 'https://git.dgit.debian.org',
611                'dgit-distro.debian.git-url-suffix' => '',
612                'dgit-distro.debian.upload-host' => 'ftp-master', # for dput
613                'dgit-distro.debian.mirror' => 'http://ftp.debian.org/debian/',
614  'dgit-distro.debian-security.archive-query' => 'aptget:',
615  'dgit-distro.debian-security.mirror' => 'http://security.debian.org/debian-security/',
616  'dgit-distro.debian-security.aptget-suite-map' => 's#-security$#/updates#',
617  'dgit-distro.debian-security.aptget-suite-rmap' => 's#$#-security#',
618  'dgit-distro.debian-security.nominal-distro' => 'debian',
619  'dgit-distro.debian.backports-quirk' => '(squeeze)-backports*',
620  'dgit-distro.debian-backports.mirror' => 'http://backports.debian.org/debian-backports/',
621                'dgit-distro.ubuntu.git-check' => 'false',
622  'dgit-distro.ubuntu.mirror' => 'http://archive.ubuntu.com/ubuntu',
623                'dgit-distro.test-dummy.ssh' => "$td/ssh",
624                'dgit-distro.test-dummy.username' => "alice",
625                'dgit-distro.test-dummy.git-check' => "ssh-cmd",
626                'dgit-distro.test-dummy.git-create' => "ssh-cmd",
627                'dgit-distro.test-dummy.git-url' => "$td/git",
628                'dgit-distro.test-dummy.git-host' => "git",
629                'dgit-distro.test-dummy.git-path' => "$td/git",
630                'dgit-distro.test-dummy.archive-query' => "dummycatapi:",
631                'dgit-distro.test-dummy.archive-query-url' => "file://$td/aq/",
632                'dgit-distro.test-dummy.mirror' => "file://$td/mirror/",
633                'dgit-distro.test-dummy.upload-host' => 'test-dummy',
634                );
635
636 our %gitcfgs;
637 our @gitcfgsources = qw(cmdline local global system);
638
639 sub git_slurp_config () {
640     # This algoritm is a bit subtle, but this is needed so that for
641     # options which we want to be single-valued, we allow the
642     # different config sources to override properly.  See #835858.
643     foreach my $src (@gitcfgsources) {
644         next if $src eq 'cmdline';
645         # we do this ourselves since git doesn't handle it
646
647         $gitcfgs{$src} = git_slurp_config_src $src;
648     }
649 }
650
651 sub git_get_config ($) {
652     my ($c) = @_;
653     foreach my $src (@gitcfgsources) {
654         my $l = $gitcfgs{$src}{$c};
655         confess "internal error ($l $c)" if $l && !ref $l;
656         printdebug"C $c ".(defined $l ?
657                            join " ", map { messagequote "'$_'" } @$l :
658                            "undef")."\n"
659             if $debuglevel >= 4;
660         $l or next;
661         @$l==1 or badcfg "multiple values for $c".
662             " (in $src git config)" if @$l > 1;
663         return $l->[0];
664     }
665     return undef;
666 }
667
668 sub cfg {
669     foreach my $c (@_) {
670         return undef if $c =~ /RETURN-UNDEF/;
671         printdebug "C? $c\n" if $debuglevel >= 5;
672         my $v = git_get_config($c);
673         return $v if defined $v;
674         my $dv = $defcfg{$c};
675         if (defined $dv) {
676             printdebug "CD $c $dv\n" if $debuglevel >= 4;
677             return $dv;
678         }
679     }
680     badcfg "need value for one of: @_\n".
681         "$us: distro or suite appears not to be (properly) supported";
682 }
683
684 sub not_necessarily_a_tree () {
685     # needs to be called from pre_*
686     @gitcfgsources = grep { $_ ne 'local' } @gitcfgsources;
687 }
688
689 sub access_basedistro__noalias () {
690     if (defined $idistro) {
691         return $idistro;
692     } else {    
693         my $def = cfg("dgit-suite.$isuite.distro", 'RETURN-UNDEF');
694         return $def if defined $def;
695         foreach my $src (@gitcfgsources, 'internal') {
696             my $kl = $src eq 'internal' ? \%defcfg : $gitcfgs{$src};
697             next unless $kl;
698             foreach my $k (keys %$kl) {
699                 next unless $k =~ m#^dgit-suite\.(.*)\.distro$#;
700                 my $dpat = $1;
701                 next unless match_glob $dpat, $isuite;
702                 return $kl->{$k};
703             }
704         }
705         return cfg("dgit.default.distro");
706     }
707 }
708
709 sub access_basedistro () {
710     my $noalias = access_basedistro__noalias();
711     my $canon = cfg("dgit-distro.$noalias.alias-canon",'RETURN-UNDEF');
712     return $canon // $noalias;
713 }
714
715 sub access_nomdistro () {
716     my $base = access_basedistro();
717     my $r = cfg("dgit-distro.$base.nominal-distro",'RETURN-UNDEF') // $base;
718     $r =~ m/^$distro_re$/ or badcfg
719  "bad syntax for (nominal) distro \`$r' (does not match /^$distro_re$/)";
720     return $r;
721 }
722
723 sub access_quirk () {
724     # returns (quirk name, distro to use instead or undef, quirk-specific info)
725     my $basedistro = access_basedistro();
726     my $backports_quirk = cfg("dgit-distro.$basedistro.backports-quirk",
727                               'RETURN-UNDEF');
728     if (defined $backports_quirk) {
729         my $re = $backports_quirk;
730         $re =~ s/[^-0-9a-z_\%*()]/\\$&/ig;
731         $re =~ s/\*/.*/g;
732         $re =~ s/\%/([-0-9a-z_]+)/
733             or $re =~ m/[()]/ or badcfg "backports-quirk needs \% or ( )";
734         if ($isuite =~ m/^$re$/) {
735             return ('backports',"$basedistro-backports",$1);
736         }
737     }
738     return ('none',undef);
739 }
740
741 our $access_forpush;
742
743 sub parse_cfg_bool ($$$) {
744     my ($what,$def,$v) = @_;
745     $v //= $def;
746     return
747         $v =~ m/^[ty1]/ ? 1 :
748         $v =~ m/^[fn0]/ ? 0 :
749         badcfg "$what needs t (true, y, 1) or f (false, n, 0) not \`$v'";
750 }       
751
752 sub access_forpush_config () {
753     my $d = access_basedistro();
754
755     return 1 if
756         $new_package &&
757         parse_cfg_bool('new-private-pushers', 0,
758                        cfg("dgit-distro.$d.new-private-pushers",
759                            'RETURN-UNDEF'));
760
761     my $v = cfg("dgit-distro.$d.readonly", 'RETURN-UNDEF');
762     $v //= 'a';
763     return
764         $v =~ m/^[ty1]/ ? 0 : # force readonly,    forpush = 0
765         $v =~ m/^[fn0]/ ? 1 : # force nonreadonly, forpush = 1
766         $v =~ m/^[a]/  ? '' : # auto,              forpush = ''
767         badcfg "readonly needs t (true, y, 1) or f (false, n, 0) or a (auto)";
768 }
769
770 sub access_forpush () {
771     $access_forpush //= access_forpush_config();
772     return $access_forpush;
773 }
774
775 sub pushing () {
776     die "$access_forpush ?" if ($access_forpush // 1) ne 1;
777     badcfg "pushing but distro is configured readonly"
778         if access_forpush_config() eq '0';
779     $access_forpush = 1;
780     $supplementary_message = <<'END' unless $we_are_responder;
781 Push failed, before we got started.
782 You can retry the push, after fixing the problem, if you like.
783 END
784     parseopts_late_defaults();
785 }
786
787 sub notpushing () {
788     parseopts_late_defaults();
789 }
790
791 sub supplementary_message ($) {
792     my ($msg) = @_;
793     if (!$we_are_responder) {
794         $supplementary_message = $msg;
795         return;
796     } elsif ($protovsn >= 3) {
797         responder_send_command "supplementary-message ".length($msg)
798             or die $!;
799         print PO $msg or die $!;
800     }
801 }
802
803 sub access_distros () {
804     # Returns list of distros to try, in order
805     #
806     # We want to try:
807     #    0. `instead of' distro name(s) we have been pointed to
808     #    1. the access_quirk distro, if any
809     #    2a. the user's specified distro, or failing that  } basedistro
810     #    2b. the distro calculated from the suite          }
811     my @l = access_basedistro();
812
813     my (undef,$quirkdistro) = access_quirk();
814     unshift @l, $quirkdistro;
815     unshift @l, $instead_distro;
816     @l = grep { defined } @l;
817
818     push @l, access_nomdistro();
819
820     if (access_forpush()) {
821         @l = map { ("$_/push", $_) } @l;
822     }
823     @l;
824 }
825
826 sub access_cfg_cfgs (@) {
827     my (@keys) = @_;
828     my @cfgs;
829     # The nesting of these loops determines the search order.  We put
830     # the key loop on the outside so that we search all the distros
831     # for each key, before going on to the next key.  That means that
832     # if access_cfg is called with a more specific, and then a less
833     # specific, key, an earlier distro can override the less specific
834     # without necessarily overriding any more specific keys.  (If the
835     # distro wants to override the more specific keys it can simply do
836     # so; whereas if we did the loop the other way around, it would be
837     # impossible to for an earlier distro to override a less specific
838     # key but not the more specific ones without restating the unknown
839     # values of the more specific keys.
840     my @realkeys;
841     my @rundef;
842     # We have to deal with RETURN-UNDEF specially, so that we don't
843     # terminate the search prematurely.
844     foreach (@keys) {
845         if (m/RETURN-UNDEF/) { push @rundef, $_; last; }
846         push @realkeys, $_
847     }
848     foreach my $d (access_distros()) {
849         push @cfgs, map { "dgit-distro.$d.$_" } @realkeys;
850     }
851     push @cfgs, map { "dgit.default.$_" } @realkeys;
852     push @cfgs, @rundef;
853     return @cfgs;
854 }
855
856 sub access_cfg (@) {
857     my (@keys) = @_;
858     my (@cfgs) = access_cfg_cfgs(@keys);
859     my $value = cfg(@cfgs);
860     return $value;
861 }
862
863 sub access_cfg_bool ($$) {
864     my ($def, @keys) = @_;
865     parse_cfg_bool($keys[0], $def, access_cfg(@keys, 'RETURN-UNDEF'));
866 }
867
868 sub string_to_ssh ($) {
869     my ($spec) = @_;
870     if ($spec =~ m/\s/) {
871         return qw(sh -ec), 'exec '.$spec.' "$@"', 'x';
872     } else {
873         return ($spec);
874     }
875 }
876
877 sub access_cfg_ssh () {
878     my $gitssh = access_cfg('ssh', 'RETURN-UNDEF');
879     if (!defined $gitssh) {
880         return @ssh;
881     } else {
882         return string_to_ssh $gitssh;
883     }
884 }
885
886 sub access_runeinfo ($) {
887     my ($info) = @_;
888     return ": dgit ".access_basedistro()." $info ;";
889 }
890
891 sub access_someuserhost ($) {
892     my ($some) = @_;
893     my $user = access_cfg("$some-user-force", 'RETURN-UNDEF');
894     defined($user) && length($user) or
895         $user = access_cfg("$some-user",'username');
896     my $host = access_cfg("$some-host");
897     return length($user) ? "$user\@$host" : $host;
898 }
899
900 sub access_gituserhost () {
901     return access_someuserhost('git');
902 }
903
904 sub access_giturl (;$) {
905     my ($optional) = @_;
906     my $url = access_cfg('git-url','RETURN-UNDEF');
907     my $suffix;
908     if (!length $url) {
909         my $proto = access_cfg('git-proto', 'RETURN-UNDEF');
910         return undef unless defined $proto;
911         $url =
912             $proto.
913             access_gituserhost().
914             access_cfg('git-path');
915     } else {
916         $suffix = access_cfg('git-url-suffix','RETURN-UNDEF');
917     }
918     $suffix //= '.git';
919     return "$url/$package$suffix";
920 }              
921
922 sub parsecontrolfh ($$;$) {
923     my ($fh, $desc, $allowsigned) = @_;
924     our $dpkgcontrolhash_noissigned;
925     my $c;
926     for (;;) {
927         my %opts = ('name' => $desc);
928         $opts{allow_pgp}= $allowsigned || !$dpkgcontrolhash_noissigned;
929         $c = Dpkg::Control::Hash->new(%opts);
930         $c->parse($fh,$desc) or die "parsing of $desc failed";
931         last if $allowsigned;
932         last if $dpkgcontrolhash_noissigned;
933         my $issigned= $c->get_option('is_pgp_signed');
934         if (!defined $issigned) {
935             $dpkgcontrolhash_noissigned= 1;
936             seek $fh, 0,0 or die "seek $desc: $!";
937         } elsif ($issigned) {
938             fail "control file $desc is (already) PGP-signed. ".
939                 " Note that dgit push needs to modify the .dsc and then".
940                 " do the signature itself";
941         } else {
942             last;
943         }
944     }
945     return $c;
946 }
947
948 sub parsecontrol {
949     my ($file, $desc, $allowsigned) = @_;
950     my $fh = new IO::Handle;
951     open $fh, '<', $file or die "$file: $!";
952     my $c = parsecontrolfh($fh,$desc,$allowsigned);
953     $fh->error and die $!;
954     close $fh;
955     return $c;
956 }
957
958 sub getfield ($$) {
959     my ($dctrl,$field) = @_;
960     my $v = $dctrl->{$field};
961     return $v if defined $v;
962     fail "missing field $field in ".$dctrl->get_option('name');
963 }
964
965 sub parsechangelog {
966     my $c = Dpkg::Control::Hash->new(name => 'parsed changelog');
967     my $p = new IO::Handle;
968     my @cmd = (qw(dpkg-parsechangelog), @_);
969     open $p, '-|', @cmd or die $!;
970     $c->parse($p);
971     $?=0; $!=0; close $p or failedcmd @cmd;
972     return $c;
973 }
974
975 sub commit_getclogp ($) {
976     # Returns the parsed changelog hashref for a particular commit
977     my ($objid) = @_;
978     our %commit_getclogp_memo;
979     my $memo = $commit_getclogp_memo{$objid};
980     return $memo if $memo;
981     mkpath '.git/dgit';
982     my $mclog = ".git/dgit/clog-$objid";
983     runcmd shell_cmd "exec >$mclog", @git, qw(cat-file blob),
984         "$objid:debian/changelog";
985     $commit_getclogp_memo{$objid} = parsechangelog("-l$mclog");
986 }
987
988 sub parse_dscdata () {
989     my $dscfh = new IO::File \$dscdata, '<' or die $!;
990     printdebug Dumper($dscdata) if $debuglevel>1;
991     $dsc = parsecontrolfh($dscfh,$dscurl,1);
992     printdebug Dumper($dsc) if $debuglevel>1;
993 }
994
995 our %rmad;
996
997 sub archive_query ($;@) {
998     my ($method) = shift @_;
999     fail "this operation does not support multiple comma-separated suites"
1000         if $isuite =~ m/,/;
1001     my $query = access_cfg('archive-query','RETURN-UNDEF');
1002     $query =~ s/^(\w+):// or badcfg "invalid archive-query method \`$query'";
1003     my $proto = $1;
1004     my $data = $'; #';
1005     { no strict qw(refs); &{"${method}_${proto}"}($proto,$data,@_); }
1006 }
1007
1008 sub archive_query_prepend_mirror {
1009     my $m = access_cfg('mirror');
1010     return map { [ $_->[0], $m.$_->[1], @$_[2..$#$_] ] } @_;
1011 }
1012
1013 sub pool_dsc_subpath ($$) {
1014     my ($vsn,$component) = @_; # $package is implict arg
1015     my $prefix = substr($package, 0, $package =~ m/^l/ ? 4 : 1);
1016     return "/pool/$component/$prefix/$package/".dscfn($vsn);
1017 }
1018
1019 sub cfg_apply_map ($$$) {
1020     my ($varref, $what, $mapspec) = @_;
1021     return unless $mapspec;
1022
1023     printdebug "config $what EVAL{ $mapspec; }\n";
1024     $_ = $$varref;
1025     eval "package Dgit::Config; $mapspec;";
1026     die $@ if $@;
1027     $$varref = $_;
1028 }
1029
1030 #---------- `ftpmasterapi' archive query method (nascent) ----------
1031
1032 sub archive_api_query_cmd ($) {
1033     my ($subpath) = @_;
1034     my @cmd = (@curl, qw(-sS));
1035     my $url = access_cfg('archive-query-url');
1036     if ($url =~ m#^https://([-.0-9a-z]+)/#) {
1037         my $host = $1;
1038         my $keys = access_cfg('archive-query-tls-key','RETURN-UNDEF') //'';
1039         foreach my $key (split /\:/, $keys) {
1040             $key =~ s/\%HOST\%/$host/g;
1041             if (!stat $key) {
1042                 fail "for $url: stat $key: $!" unless $!==ENOENT;
1043                 next;
1044             }
1045             fail "config requested specific TLS key but do not know".
1046                 " how to get curl to use exactly that EE key ($key)";
1047 #           push @cmd, "--cacert", $key, "--capath", "/dev/enoent";
1048 #           # Sadly the above line does not work because of changes
1049 #           # to gnutls.   The real fix for #790093 may involve
1050 #           # new curl options.
1051             last;
1052         }
1053         # Fixing #790093 properly will involve providing a value
1054         # for this on clients.
1055         my $kargs = access_cfg('archive-query-tls-curl-ca-args','RETURN-UNDEF');
1056         push @cmd, split / /, $kargs if defined $kargs;
1057     }
1058     push @cmd, $url.$subpath;
1059     return @cmd;
1060 }
1061
1062 sub api_query ($$;$) {
1063     use JSON;
1064     my ($data, $subpath, $ok404) = @_;
1065     badcfg "ftpmasterapi archive query method takes no data part"
1066         if length $data;
1067     my @cmd = archive_api_query_cmd($subpath);
1068     my $url = $cmd[$#cmd];
1069     push @cmd, qw(-w %{http_code});
1070     my $json = cmdoutput @cmd;
1071     unless ($json =~ s/\d+\d+\d$//) {
1072         failedcmd_report_cmd undef, @cmd;
1073         fail "curl failed to print 3-digit HTTP code";
1074     }
1075     my $code = $&;
1076     return undef if $code eq '404' && $ok404;
1077     fail "fetch of $url gave HTTP code $code"
1078         unless $url =~ m#^file://# or $code =~ m/^2/;
1079     return decode_json($json);
1080 }
1081
1082 sub canonicalise_suite_ftpmasterapi {
1083     my ($proto,$data) = @_;
1084     my $suites = api_query($data, 'suites');
1085     my @matched;
1086     foreach my $entry (@$suites) {
1087         next unless grep { 
1088             my $v = $entry->{$_};
1089             defined $v && $v eq $isuite;
1090         } qw(codename name);
1091         push @matched, $entry;
1092     }
1093     fail "unknown suite $isuite" unless @matched;
1094     my $cn;
1095     eval {
1096         @matched==1 or die "multiple matches for suite $isuite\n";
1097         $cn = "$matched[0]{codename}";
1098         defined $cn or die "suite $isuite info has no codename\n";
1099         $cn =~ m/^$suite_re$/ or die "suite $isuite maps to bad codename\n";
1100     };
1101     die "bad ftpmaster api response: $@\n".Dumper(\@matched)
1102         if length $@;
1103     return $cn;
1104 }
1105
1106 sub archive_query_ftpmasterapi {
1107     my ($proto,$data) = @_;
1108     my $info = api_query($data, "dsc_in_suite/$isuite/$package");
1109     my @rows;
1110     my $digester = Digest::SHA->new(256);
1111     foreach my $entry (@$info) {
1112         eval {
1113             my $vsn = "$entry->{version}";
1114             my ($ok,$msg) = version_check $vsn;
1115             die "bad version: $msg\n" unless $ok;
1116             my $component = "$entry->{component}";
1117             $component =~ m/^$component_re$/ or die "bad component";
1118             my $filename = "$entry->{filename}";
1119             $filename && $filename !~ m#[^-+:._~0-9a-zA-Z/]|^[/.]|/[/.]#
1120                 or die "bad filename";
1121             my $sha256sum = "$entry->{sha256sum}";
1122             $sha256sum =~ m/^[0-9a-f]+$/ or die "bad sha256sum";
1123             push @rows, [ $vsn, "/pool/$component/$filename",
1124                           $digester, $sha256sum ];
1125         };
1126         die "bad ftpmaster api response: $@\n".Dumper($entry)
1127             if length $@;
1128     }
1129     @rows = sort { -version_compare($a->[0],$b->[0]) } @rows;
1130     return archive_query_prepend_mirror @rows;
1131 }
1132
1133 sub file_in_archive_ftpmasterapi {
1134     my ($proto,$data,$filename) = @_;
1135     my $pat = $filename;
1136     $pat =~ s/_/\\_/g;
1137     $pat = "%/$pat";
1138     $pat =~ s#[^-+_.0-9a-z/]# sprintf '%%%02x', ord $& #ge;
1139     my $info = api_query($data, "file_in_archive/$pat", 1);
1140 }
1141
1142 #---------- `aptget' archive query method ----------
1143
1144 our $aptget_base;
1145 our $aptget_releasefile;
1146 our $aptget_configpath;
1147
1148 sub aptget_aptget   () { return @aptget,   qw(-c), $aptget_configpath; }
1149 sub aptget_aptcache () { return @aptcache, qw(-c), $aptget_configpath; }
1150
1151 sub aptget_cache_clean {
1152     runcmd_ordryrun_local qw(sh -ec),
1153         'cd "$1"; find -atime +30 -type f -print0 | xargs -0r rm --',
1154         'x', $aptget_base;
1155 }
1156
1157 sub aptget_lock_acquire () {
1158     my $lockfile = "$aptget_base/lock";
1159     open APTGET_LOCK, '>', $lockfile or die "open $lockfile: $!";
1160     flock APTGET_LOCK, LOCK_EX or die "lock $lockfile: $!";
1161 }
1162
1163 sub aptget_prep ($) {
1164     my ($data) = @_;
1165     return if defined $aptget_base;
1166
1167     badcfg "aptget archive query method takes no data part"
1168         if length $data;
1169
1170     my $cache = $ENV{XDG_CACHE_DIR} // "$ENV{HOME}/.cache";
1171
1172     ensuredir $cache;
1173     ensuredir "$cache/dgit";
1174     my $cachekey =
1175         access_cfg('aptget-cachekey','RETURN-UNDEF')
1176         // access_nomdistro();
1177
1178     $aptget_base = "$cache/dgit/aptget";
1179     ensuredir $aptget_base;
1180
1181     my $quoted_base = $aptget_base;
1182     die "$quoted_base contains bad chars, cannot continue"
1183         if $quoted_base =~ m/["\\]/; # apt.conf(5) says no escaping :-/
1184
1185     ensuredir $aptget_base;
1186
1187     aptget_lock_acquire();
1188
1189     aptget_cache_clean();
1190
1191     $aptget_configpath = "$aptget_base/apt.conf#$cachekey";
1192     my $sourceslist = "source.list#$cachekey";
1193
1194     my $aptsuites = $isuite;
1195     cfg_apply_map(\$aptsuites, 'suite map',
1196                   access_cfg('aptget-suite-map', 'RETURN-UNDEF'));
1197
1198     open SRCS, ">", "$aptget_base/$sourceslist" or die $!;
1199     printf SRCS "deb-src %s %s %s\n",
1200         access_cfg('mirror'),
1201         $aptsuites,
1202         access_cfg('aptget-components')
1203         or die $!;
1204
1205     ensuredir "$aptget_base/cache";
1206     ensuredir "$aptget_base/lists";
1207
1208     open CONF, ">", $aptget_configpath or die $!;
1209     print CONF <<END;
1210 Debug::NoLocking "true";
1211 APT::Get::List-Cleanup "false";
1212 #clear APT::Update::Post-Invoke-Success;
1213 Dir::Etc::SourceList "$quoted_base/$sourceslist";
1214 Dir::State::Lists "$quoted_base/lists";
1215 Dir::Etc::preferences "$quoted_base/preferences";
1216 Dir::Cache::srcpkgcache "$quoted_base/cache/srcs#$cachekey";
1217 Dir::Cache::pkgcache "$quoted_base/cache/pkgs#$cachekey";
1218 END
1219
1220     foreach my $key (qw(
1221                         Dir::Cache
1222                         Dir::State
1223                         Dir::Cache::Archives
1224                         Dir::Etc::SourceParts
1225                         Dir::Etc::preferencesparts
1226                       )) {
1227         ensuredir "$aptget_base/$key";
1228         print CONF "$key \"$quoted_base/$key\";\n" or die $!;
1229     };
1230
1231     my $oldatime = (time // die $!) - 1;
1232     foreach my $oldlist (<$aptget_base/lists/*Release>) {
1233         next unless stat_exists $oldlist;
1234         my ($mtime) = (stat _)[9];
1235         utime $oldatime, $mtime, $oldlist or die "$oldlist $!";
1236     }
1237
1238     runcmd_ordryrun_local aptget_aptget(), qw(update);
1239
1240     my @releasefiles;
1241     foreach my $oldlist (<$aptget_base/lists/*Release>) {
1242         next unless stat_exists $oldlist;
1243         my ($atime) = (stat _)[8];
1244         next if $atime == $oldatime;
1245         push @releasefiles, $oldlist;
1246     }
1247     my @inreleasefiles = grep { m#/InRelease$# } @releasefiles;
1248     @releasefiles = @inreleasefiles if @inreleasefiles;
1249     die "apt updated wrong number of Release files (@releasefiles), erk"
1250         unless @releasefiles == 1;
1251
1252     ($aptget_releasefile) = @releasefiles;
1253 }
1254
1255 sub canonicalise_suite_aptget {
1256     my ($proto,$data) = @_;
1257     aptget_prep($data);
1258
1259     my $release = parsecontrol $aptget_releasefile, "Release file", 1;
1260
1261     foreach my $name (qw(Codename Suite)) {
1262         my $val = $release->{$name};
1263         if (defined $val) {
1264             printdebug "release file $name: $val\n";
1265             $val =~ m/^$suite_re$/o or fail
1266  "Release file ($aptget_releasefile) specifies intolerable $name";
1267             cfg_apply_map(\$val, 'suite rmap',
1268                           access_cfg('aptget-suite-rmap', 'RETURN-UNDEF'));
1269             return $val
1270         }
1271     }
1272     return $isuite;
1273 }
1274
1275 sub archive_query_aptget {
1276     my ($proto,$data) = @_;
1277     aptget_prep($data);
1278
1279     ensuredir "$aptget_base/source";
1280     foreach my $old (<$aptget_base/source/*.dsc>) {
1281         unlink $old or die "$old: $!";
1282     }
1283
1284     my $showsrc = cmdoutput aptget_aptcache(), qw(showsrc), $package;
1285     return () unless $showsrc =~ m/^package:\s*\Q$package\E\s*$/mi;
1286     # avoids apt-get source failing with ambiguous error code
1287
1288     runcmd_ordryrun_local
1289         shell_cmd 'cd "$1"/source; shift', $aptget_base,
1290         aptget_aptget(), qw(--download-only --only-source source), $package;
1291
1292     my @dscs = <$aptget_base/source/*.dsc>;
1293     fail "apt-get source did not produce a .dsc" unless @dscs;
1294     fail "apt-get source produced several .dscs (@dscs)" unless @dscs==1;
1295
1296     my $pre_dsc = parsecontrol $dscs[0], $dscs[0], 1;
1297
1298     use URI::Escape;
1299     my $uri = "file://". uri_escape $dscs[0];
1300     $uri =~ s{\%2f}{/}gi;
1301     return [ (getfield $pre_dsc, 'Version'), $uri ];
1302 }
1303
1304 sub file_in_archive_aptget () { return undef; }
1305
1306 #---------- `dummyapicat' archive query method ----------
1307
1308 sub archive_query_dummycatapi { archive_query_ftpmasterapi @_; }
1309 sub canonicalise_suite_dummycatapi { canonicalise_suite_ftpmasterapi @_; }
1310
1311 sub file_in_archive_dummycatapi ($$$) {
1312     my ($proto,$data,$filename) = @_;
1313     my $mirror = access_cfg('mirror');
1314     $mirror =~ s#^file://#/# or die "$mirror ?";
1315     my @out;
1316     my @cmd = (qw(sh -ec), '
1317             cd "$1"
1318             find -name "$2" -print0 |
1319             xargs -0r sha256sum
1320         ', qw(x), $mirror, $filename);
1321     debugcmd "-|", @cmd;
1322     open FIA, "-|", @cmd or die $!;
1323     while (<FIA>) {
1324         chomp or die;
1325         printdebug "| $_\n";
1326         m/^(\w+)  (\S+)$/ or die "$_ ?";
1327         push @out, { sha256sum => $1, filename => $2 };
1328     }
1329     close FIA or die failedcmd @cmd;
1330     return \@out;
1331 }
1332
1333 #---------- `madison' archive query method ----------
1334
1335 sub archive_query_madison {
1336     return archive_query_prepend_mirror
1337         map { [ @$_[0..1] ] } madison_get_parse(@_);
1338 }
1339
1340 sub madison_get_parse {
1341     my ($proto,$data) = @_;
1342     die unless $proto eq 'madison';
1343     if (!length $data) {
1344         $data= access_cfg('madison-distro','RETURN-UNDEF');
1345         $data //= access_basedistro();
1346     }
1347     $rmad{$proto,$data,$package} ||= cmdoutput
1348         qw(rmadison -asource),"-s$isuite","-u$data",$package;
1349     my $rmad = $rmad{$proto,$data,$package};
1350
1351     my @out;
1352     foreach my $l (split /\n/, $rmad) {
1353         $l =~ m{^ \s*( [^ \t|]+ )\s* \|
1354                   \s*( [^ \t|]+ )\s* \|
1355                   \s*( [^ \t|/]+ )(?:/([^ \t|/]+))? \s* \|
1356                   \s*( [^ \t|]+ )\s* }x or die "$rmad ?";
1357         $1 eq $package or die "$rmad $package ?";
1358         my $vsn = $2;
1359         my $newsuite = $3;
1360         my $component;
1361         if (defined $4) {
1362             $component = $4;
1363         } else {
1364             $component = access_cfg('archive-query-default-component');
1365         }
1366         $5 eq 'source' or die "$rmad ?";
1367         push @out, [$vsn,pool_dsc_subpath($vsn,$component),$newsuite];
1368     }
1369     return sort { -version_compare($a->[0],$b->[0]); } @out;
1370 }
1371
1372 sub canonicalise_suite_madison {
1373     # madison canonicalises for us
1374     my @r = madison_get_parse(@_);
1375     @r or fail
1376         "unable to canonicalise suite using package $package".
1377         " which does not appear to exist in suite $isuite;".
1378         " --existing-package may help";
1379     return $r[0][2];
1380 }
1381
1382 sub file_in_archive_madison { return undef; }
1383
1384 #---------- `sshpsql' archive query method ----------
1385
1386 sub sshpsql ($$$) {
1387     my ($data,$runeinfo,$sql) = @_;
1388     if (!length $data) {
1389         $data= access_someuserhost('sshpsql').':'.
1390             access_cfg('sshpsql-dbname');
1391     }
1392     $data =~ m/:/ or badcfg "invalid sshpsql method string \`$data'";
1393     my ($userhost,$dbname) = ($`,$'); #';
1394     my @rows;
1395     my @cmd = (access_cfg_ssh, $userhost,
1396                access_runeinfo("ssh-psql $runeinfo").
1397                " export LC_MESSAGES=C; export LC_CTYPE=C;".
1398                " ".shellquote qw(psql -A), $dbname, qw(-c), $sql);
1399     debugcmd "|",@cmd;
1400     open P, "-|", @cmd or die $!;
1401     while (<P>) {
1402         chomp or die;
1403         printdebug(">|$_|\n");
1404         push @rows, $_;
1405     }
1406     $!=0; $?=0; close P or failedcmd @cmd;
1407     @rows or die;
1408     my $nrows = pop @rows;
1409     $nrows =~ s/^\((\d+) rows?\)$/$1/ or die "$nrows ?";
1410     @rows == $nrows+1 or die "$nrows ".(scalar @rows)." ?";
1411     @rows = map { [ split /\|/, $_ ] } @rows;
1412     my $ncols = scalar @{ shift @rows };
1413     die if grep { scalar @$_ != $ncols } @rows;
1414     return @rows;
1415 }
1416
1417 sub sql_injection_check {
1418     foreach (@_) { die "$_ $& ?" if m{[^-+=:_.,/0-9a-zA-Z]}; }
1419 }
1420
1421 sub archive_query_sshpsql ($$) {
1422     my ($proto,$data) = @_;
1423     sql_injection_check $isuite, $package;
1424     my @rows = sshpsql($data, "archive-query $isuite $package", <<END);
1425         SELECT source.version, component.name, files.filename, files.sha256sum
1426           FROM source
1427           JOIN src_associations ON source.id = src_associations.source
1428           JOIN suite ON suite.id = src_associations.suite
1429           JOIN dsc_files ON dsc_files.source = source.id
1430           JOIN files_archive_map ON files_archive_map.file_id = dsc_files.file
1431           JOIN component ON component.id = files_archive_map.component_id
1432           JOIN files ON files.id = dsc_files.file
1433          WHERE ( suite.suite_name='$isuite' OR suite.codename='$isuite' )
1434            AND source.source='$package'
1435            AND files.filename LIKE '%.dsc';
1436 END
1437     @rows = sort { -version_compare($a->[0],$b->[0]) } @rows;
1438     my $digester = Digest::SHA->new(256);
1439     @rows = map {
1440         my ($vsn,$component,$filename,$sha256sum) = @$_;
1441         [ $vsn, "/pool/$component/$filename",$digester,$sha256sum ];
1442     } @rows;
1443     return archive_query_prepend_mirror @rows;
1444 }
1445
1446 sub canonicalise_suite_sshpsql ($$) {
1447     my ($proto,$data) = @_;
1448     sql_injection_check $isuite;
1449     my @rows = sshpsql($data, "canonicalise-suite $isuite", <<END);
1450         SELECT suite.codename
1451           FROM suite where suite_name='$isuite' or codename='$isuite';
1452 END
1453     @rows = map { $_->[0] } @rows;
1454     fail "unknown suite $isuite" unless @rows;
1455     die "ambiguous $isuite: @rows ?" if @rows>1;
1456     return $rows[0];
1457 }
1458
1459 sub file_in_archive_sshpsql ($$$) { return undef; }
1460
1461 #---------- `dummycat' archive query method ----------
1462
1463 sub canonicalise_suite_dummycat ($$) {
1464     my ($proto,$data) = @_;
1465     my $dpath = "$data/suite.$isuite";
1466     if (!open C, "<", $dpath) {
1467         $!==ENOENT or die "$dpath: $!";
1468         printdebug "dummycat canonicalise_suite $isuite $dpath ENOENT\n";
1469         return $isuite;
1470     }
1471     $!=0; $_ = <C>;
1472     chomp or die "$dpath: $!";
1473     close C;
1474     printdebug "dummycat canonicalise_suite $isuite $dpath = $_\n";
1475     return $_;
1476 }
1477
1478 sub archive_query_dummycat ($$) {
1479     my ($proto,$data) = @_;
1480     canonicalise_suite();
1481     my $dpath = "$data/package.$csuite.$package";
1482     if (!open C, "<", $dpath) {
1483         $!==ENOENT or die "$dpath: $!";
1484         printdebug "dummycat query $csuite $package $dpath ENOENT\n";
1485         return ();
1486     }
1487     my @rows;
1488     while (<C>) {
1489         next if m/^\#/;
1490         next unless m/\S/;
1491         die unless chomp;
1492         printdebug "dummycat query $csuite $package $dpath | $_\n";
1493         my @row = split /\s+/, $_;
1494         @row==2 or die "$dpath: $_ ?";
1495         push @rows, \@row;
1496     }
1497     C->error and die "$dpath: $!";
1498     close C;
1499     return archive_query_prepend_mirror
1500         sort { -version_compare($a->[0],$b->[0]); } @rows;
1501 }
1502
1503 sub file_in_archive_dummycat () { return undef; }
1504
1505 #---------- tag format handling ----------
1506
1507 sub access_cfg_tagformats () {
1508     split /\,/, access_cfg('dgit-tag-format');
1509 }
1510
1511 sub access_cfg_tagformats_can_splitbrain () {
1512     my %y = map { $_ => 1 } access_cfg_tagformats;
1513     foreach my $needtf (qw(new maint)) {
1514         next if $y{$needtf};
1515         return 0;
1516     }
1517     return 1;
1518 }
1519
1520 sub need_tagformat ($$) {
1521     my ($fmt, $why) = @_;
1522     fail "need to use tag format $fmt ($why) but also need".
1523         " to use tag format $tagformat_want->[0] ($tagformat_want->[1])".
1524         " - no way to proceed"
1525         if $tagformat_want && $tagformat_want->[0] ne $fmt;
1526     $tagformat_want = [$fmt, $why, $tagformat_want->[2] // 0];
1527 }
1528
1529 sub select_tagformat () {
1530     # sets $tagformatfn
1531     return if $tagformatfn && !$tagformat_want;
1532     die 'bug' if $tagformatfn && $tagformat_want;
1533     # ... $tagformat_want assigned after previous select_tagformat
1534
1535     my (@supported) = grep { $_ =~ m/^(?:old|new)$/ } access_cfg_tagformats();
1536     printdebug "select_tagformat supported @supported\n";
1537
1538     $tagformat_want //= [ $supported[0], "distro access configuration", 0 ];
1539     printdebug "select_tagformat specified @$tagformat_want\n";
1540
1541     my ($fmt,$why,$override) = @$tagformat_want;
1542
1543     fail "target distro supports tag formats @supported".
1544         " but have to use $fmt ($why)"
1545         unless $override
1546             or grep { $_ eq $fmt } @supported;
1547
1548     $tagformat_want = undef;
1549     $tagformat = $fmt;
1550     $tagformatfn = ${*::}{"debiantag_$fmt"};
1551
1552     fail "trying to use unknown tag format \`$fmt' ($why) !"
1553         unless $tagformatfn;
1554 }
1555
1556 #---------- archive query entrypoints and rest of program ----------
1557
1558 sub canonicalise_suite () {
1559     return if defined $csuite;
1560     fail "cannot operate on $isuite suite" if $isuite eq 'UNRELEASED';
1561     $csuite = archive_query('canonicalise_suite');
1562     if ($isuite ne $csuite) {
1563         progress "canonical suite name for $isuite is $csuite";
1564     } else {
1565         progress "canonical suite name is $csuite";
1566     }
1567 }
1568
1569 sub get_archive_dsc () {
1570     canonicalise_suite();
1571     my @vsns = archive_query('archive_query');
1572     foreach my $vinfo (@vsns) {
1573         my ($vsn,$vsn_dscurl,$digester,$digest) = @$vinfo;
1574         $dscurl = $vsn_dscurl;
1575         $dscdata = url_get($dscurl);
1576         if (!$dscdata) {
1577             $skew_warning_vsn = $vsn if !defined $skew_warning_vsn;
1578             next;
1579         }
1580         if ($digester) {
1581             $digester->reset();
1582             $digester->add($dscdata);
1583             my $got = $digester->hexdigest();
1584             $got eq $digest or
1585                 fail "$dscurl has hash $got but".
1586                     " archive told us to expect $digest";
1587         }
1588         parse_dscdata();
1589         my $fmt = getfield $dsc, 'Format';
1590         $format_ok{$fmt} or forceable_fail [qw(unsupported-source-format)],
1591             "unsupported source format $fmt, sorry";
1592             
1593         $dsc_checked = !!$digester;
1594         printdebug "get_archive_dsc: Version ".(getfield $dsc, 'Version')."\n";
1595         return;
1596     }
1597     $dsc = undef;
1598     printdebug "get_archive_dsc: nothing in archive, returning undef\n";
1599 }
1600
1601 sub check_for_git ();
1602 sub check_for_git () {
1603     # returns 0 or 1
1604     my $how = access_cfg('git-check');
1605     if ($how eq 'ssh-cmd') {
1606         my @cmd =
1607             (access_cfg_ssh, access_gituserhost(),
1608              access_runeinfo("git-check $package").
1609              " set -e; cd ".access_cfg('git-path').";".
1610              " if test -d $package.git; then echo 1; else echo 0; fi");
1611         my $r= cmdoutput @cmd;
1612         if (defined $r and $r =~ m/^divert (\w+)$/) {
1613             my $divert=$1;
1614             my ($usedistro,) = access_distros();
1615             # NB that if we are pushing, $usedistro will be $distro/push
1616             $instead_distro= cfg("dgit-distro.$usedistro.diverts.$divert");
1617             $instead_distro =~ s{^/}{ access_basedistro()."/" }e;
1618             progress "diverting to $divert (using config for $instead_distro)";
1619             return check_for_git();
1620         }
1621         failedcmd @cmd unless defined $r and $r =~ m/^[01]$/;
1622         return $r+0;
1623     } elsif ($how eq 'url') {
1624         my $prefix = access_cfg('git-check-url','git-url');
1625         my $suffix = access_cfg('git-check-suffix','git-suffix',
1626                                 'RETURN-UNDEF') // '.git';
1627         my $url = "$prefix/$package$suffix";
1628         my @cmd = (@curl, qw(-sS -I), $url);
1629         my $result = cmdoutput @cmd;
1630         $result =~ s/^\S+ 200 .*\n\r?\n//;
1631         # curl -sS -I with https_proxy prints
1632         # HTTP/1.0 200 Connection established
1633         $result =~ m/^\S+ (404|200) /s or
1634             fail "unexpected results from git check query - ".
1635                 Dumper($prefix, $result);
1636         my $code = $1;
1637         if ($code eq '404') {
1638             return 0;
1639         } elsif ($code eq '200') {
1640             return 1;
1641         } else {
1642             die;
1643         }
1644     } elsif ($how eq 'true') {
1645         return 1;
1646     } elsif ($how eq 'false') {
1647         return 0;
1648     } else {
1649         badcfg "unknown git-check \`$how'";
1650     }
1651 }
1652
1653 sub create_remote_git_repo () {
1654     my $how = access_cfg('git-create');
1655     if ($how eq 'ssh-cmd') {
1656         runcmd_ordryrun
1657             (access_cfg_ssh, access_gituserhost(),
1658              access_runeinfo("git-create $package").
1659              "set -e; cd ".access_cfg('git-path').";".
1660              " cp -a _template $package.git");
1661     } elsif ($how eq 'true') {
1662         # nothing to do
1663     } else {
1664         badcfg "unknown git-create \`$how'";
1665     }
1666 }
1667
1668 our ($dsc_hash,$lastpush_mergeinput);
1669 our ($dsc_distro, $dsc_hint_tag, $dsc_hint_url);
1670
1671
1672 sub prep_ud () {
1673     fresh_playground 'dgit/unpack';
1674 }
1675
1676 sub mktree_in_ud_here () {
1677     playtree_setup $gitcfgs{local};
1678 }
1679
1680 sub git_write_tree () {
1681     my $tree = cmdoutput @git, qw(write-tree);
1682     $tree =~ m/^\w+$/ or die "$tree ?";
1683     return $tree;
1684 }
1685
1686 sub git_add_write_tree () {
1687     runcmd @git, qw(add -Af .);
1688     return git_write_tree();
1689 }
1690
1691 sub remove_stray_gits ($) {
1692     my ($what) = @_;
1693     my @gitscmd = qw(find -name .git -prune -print0);
1694     debugcmd "|",@gitscmd;
1695     open GITS, "-|", @gitscmd or die $!;
1696     {
1697         local $/="\0";
1698         while (<GITS>) {
1699             chomp or die;
1700             print STDERR "$us: warning: removing from $what: ",
1701                 (messagequote $_), "\n";
1702             rmtree $_;
1703         }
1704     }
1705     $!=0; $?=0; close GITS or failedcmd @gitscmd;
1706 }
1707
1708 sub mktree_in_ud_from_only_subdir ($;$) {
1709     my ($what,$raw) = @_;
1710
1711     # changes into the subdir
1712     my (@dirs) = <*/.>;
1713     die "expected one subdir but found @dirs ?" unless @dirs==1;
1714     $dirs[0] =~ m#^([^/]+)/\.$# or die;
1715     my $dir = $1;
1716     changedir $dir;
1717
1718     remove_stray_gits($what);
1719     mktree_in_ud_here();
1720     if (!$raw) {
1721         my ($format, $fopts) = get_source_format();
1722         if (madformat($format)) {
1723             rmtree '.pc';
1724         }
1725     }
1726
1727     my $tree=git_add_write_tree();
1728     return ($tree,$dir);
1729 }
1730
1731 our @files_csum_info_fields = 
1732     (['Checksums-Sha256','Digest::SHA', 'new(256)', 'sha256sum'],
1733      ['Checksums-Sha1',  'Digest::SHA', 'new(1)',   'sha1sum'],
1734      ['Files',           'Digest::MD5', 'new()',    'md5sum']);
1735
1736 sub dsc_files_info () {
1737     foreach my $csumi (@files_csum_info_fields) {
1738         my ($fname, $module, $method) = @$csumi;
1739         my $field = $dsc->{$fname};
1740         next unless defined $field;
1741         eval "use $module; 1;" or die $@;
1742         my @out;
1743         foreach (split /\n/, $field) {
1744             next unless m/\S/;
1745             m/^(\w+) (\d+) (\S+)$/ or
1746                 fail "could not parse .dsc $fname line \`$_'";
1747             my $digester = eval "$module"."->$method;" or die $@;
1748             push @out, {
1749                 Hash => $1,
1750                 Bytes => $2,
1751                 Filename => $3,
1752                 Digester => $digester,
1753             };
1754         }
1755         return @out;
1756     }
1757     fail "missing any supported Checksums-* or Files field in ".
1758         $dsc->get_option('name');
1759 }
1760
1761 sub dsc_files () {
1762     map { $_->{Filename} } dsc_files_info();
1763 }
1764
1765 sub files_compare_inputs (@) {
1766     my $inputs = \@_;
1767     my %record;
1768     my %fchecked;
1769
1770     my $showinputs = sub {
1771         return join "; ", map { $_->get_option('name') } @$inputs;
1772     };
1773
1774     foreach my $in (@$inputs) {
1775         my $expected_files;
1776         my $in_name = $in->get_option('name');
1777
1778         printdebug "files_compare_inputs $in_name\n";
1779
1780         foreach my $csumi (@files_csum_info_fields) {
1781             my ($fname) = @$csumi;
1782             printdebug "files_compare_inputs $in_name $fname\n";
1783
1784             my $field = $in->{$fname};
1785             next unless defined $field;
1786
1787             my @files;
1788             foreach (split /\n/, $field) {
1789                 next unless m/\S/;
1790
1791                 my ($info, $f) = m/^(\w+ \d+) (?:\S+ \S+ )?(\S+)$/ or
1792                     fail "could not parse $in_name $fname line \`$_'";
1793
1794                 printdebug "files_compare_inputs $in_name $fname $f\n";
1795
1796                 push @files, $f;
1797
1798                 my $re = \ $record{$f}{$fname};
1799                 if (defined $$re) {
1800                     $fchecked{$f}{$in_name} = 1;
1801                     $$re eq $info or
1802                         fail "hash or size of $f varies in $fname fields".
1803                         " (between: ".$showinputs->().")";
1804                 } else {
1805                     $$re = $info;
1806                 }
1807             }
1808             @files = sort @files;
1809             $expected_files //= \@files;
1810             "@$expected_files" eq "@files" or
1811                 fail "file list in $in_name varies between hash fields!";
1812         }
1813         $expected_files or
1814             fail "$in_name has no files list field(s)";
1815     }
1816     printdebug "files_compare_inputs ".Dumper(\%fchecked, \%record)
1817         if $debuglevel>=2;
1818
1819     grep { keys %$_ == @$inputs-1 } values %fchecked
1820         or fail "no file appears in all file lists".
1821         " (looked in: ".$showinputs->().")";
1822 }
1823
1824 sub is_orig_file_in_dsc ($$) {
1825     my ($f, $dsc_files_info) = @_;
1826     return 0 if @$dsc_files_info <= 1;
1827     # One file means no origs, and the filename doesn't have a "what
1828     # part of dsc" component.  (Consider versions ending `.orig'.)
1829     return 0 unless $f =~ m/\.$orig_f_tail_re$/o;
1830     return 1;
1831 }
1832
1833 sub is_orig_file_of_vsn ($$) {
1834     my ($f, $upstreamvsn) = @_;
1835     my $base = srcfn $upstreamvsn, '';
1836     return 0 unless $f =~ m/^\Q$base\E\.$orig_f_tail_re$/;
1837     return 1;
1838 }
1839
1840 sub changes_update_origs_from_dsc ($$$$) {
1841     my ($dsc, $changes, $upstreamvsn, $changesfile) = @_;
1842     my %changes_f;
1843     printdebug "checking origs needed ($upstreamvsn)...\n";
1844     $_ = getfield $changes, 'Files';
1845     m/^\w+ \d+ (\S+ \S+) \S+$/m or
1846         fail "cannot find section/priority from .changes Files field";
1847     my $placementinfo = $1;
1848     my %changed;
1849     printdebug "checking origs needed placement '$placementinfo'...\n";
1850     foreach my $l (split /\n/, getfield $dsc, 'Files') {
1851         $l =~ m/\S+$/ or next;
1852         my $file = $&;
1853         printdebug "origs $file | $l\n";
1854         next unless is_orig_file_of_vsn $file, $upstreamvsn;
1855         printdebug "origs $file is_orig\n";
1856         my $have = archive_query('file_in_archive', $file);
1857         if (!defined $have) {
1858             print STDERR <<END;
1859 archive does not support .orig check; hope you used --ch:--sa/-sd if needed
1860 END
1861             return;
1862         }
1863         my $found_same = 0;
1864         my @found_differ;
1865         printdebug "origs $file \$#\$have=$#$have\n";
1866         foreach my $h (@$have) {
1867             my $same = 0;
1868             my @differ;
1869             foreach my $csumi (@files_csum_info_fields) {
1870                 my ($fname, $module, $method, $archivefield) = @$csumi;
1871                 next unless defined $h->{$archivefield};
1872                 $_ = $dsc->{$fname};
1873                 next unless defined;
1874                 m/^(\w+) .* \Q$file\E$/m or
1875                     fail ".dsc $fname missing entry for $file";
1876                 if ($h->{$archivefield} eq $1) {
1877                     $same++;
1878                 } else {
1879                     push @differ,
1880  "$archivefield: $h->{$archivefield} (archive) != $1 (local .dsc)";
1881                 }
1882             }
1883             die "$file ".Dumper($h)." ?!" if $same && @differ;
1884             $found_same++
1885                 if $same;
1886             push @found_differ, "archive $h->{filename}: ".join "; ", @differ
1887                 if @differ;
1888         }
1889         printdebug "origs $file f.same=$found_same".
1890             " #f._differ=$#found_differ\n";
1891         if (@found_differ && !$found_same) {
1892             fail join "\n",
1893                 "archive contains $file with different checksum",
1894                 @found_differ;
1895         }
1896         # Now we edit the changes file to add or remove it
1897         foreach my $csumi (@files_csum_info_fields) {
1898             my ($fname, $module, $method, $archivefield) = @$csumi;
1899             next unless defined $changes->{$fname};
1900             if ($found_same) {
1901                 # in archive, delete from .changes if it's there
1902                 $changed{$file} = "removed" if
1903                     $changes->{$fname} =~ s/^.* \Q$file\E$(?:)\n//m;
1904             } elsif ($changes->{$fname} =~ m/^.* \Q$file\E$(?:)\n/m) {
1905                 # not in archive, but it's here in the .changes
1906             } else {
1907                 my $dsc_data = getfield $dsc, $fname;
1908                 $dsc_data =~ m/^(.* \Q$file\E$)\n/m or die "$dsc_data $file ?";
1909                 my $extra = $1;
1910                 $extra =~ s/ \d+ /$&$placementinfo /
1911                     or die "$fname $extra >$dsc_data< ?"
1912                     if $fname eq 'Files';
1913                 $changes->{$fname} .= "\n". $extra;
1914                 $changed{$file} = "added";
1915             }
1916         }
1917     }
1918     if (%changed) {
1919         foreach my $file (keys %changed) {
1920             progress sprintf
1921                 "edited .changes for archive .orig contents: %s %s",
1922                 $changed{$file}, $file;
1923         }
1924         my $chtmp = "$changesfile.tmp";
1925         $changes->save($chtmp);
1926         if (act_local()) {
1927             rename $chtmp,$changesfile or die "$changesfile $!";
1928         } else {
1929             progress "[new .changes left in $changesfile]";
1930         }
1931     } else {
1932         progress "$changesfile already has appropriate .orig(s) (if any)";
1933     }
1934 }
1935
1936 sub make_commit ($) {
1937     my ($file) = @_;
1938     return cmdoutput @git, qw(hash-object -w -t commit), $file;
1939 }
1940
1941 sub make_commit_text ($) {
1942     my ($text) = @_;
1943     my ($out, $in);
1944     my @cmd = (@git, qw(hash-object -w -t commit --stdin));
1945     debugcmd "|",@cmd;
1946     print Dumper($text) if $debuglevel > 1;
1947     my $child = open2($out, $in, @cmd) or die $!;
1948     my $h;
1949     eval {
1950         print $in $text or die $!;
1951         close $in or die $!;
1952         $h = <$out>;
1953         $h =~ m/^\w+$/ or die;
1954         $h = $&;
1955         printdebug "=> $h\n";
1956     };
1957     close $out;
1958     waitpid $child, 0 == $child or die "$child $!";
1959     $? and failedcmd @cmd;
1960     return $h;
1961 }
1962
1963 sub clogp_authline ($) {
1964     my ($clogp) = @_;
1965     my $author = getfield $clogp, 'Maintainer';
1966     if ($author =~ m/^[^"\@]+\,/) {
1967         # single entry Maintainer field with unquoted comma
1968         $author = ($& =~ y/,//rd).$'; # strip the comma
1969     }
1970     # git wants a single author; any remaining commas in $author
1971     # are by now preceded by @ (or ").  It seems safer to punt on
1972     # "..." for now rather than attempting to dequote or something.
1973     $author =~ s#,.*##ms unless $author =~ m/"/;
1974     my $date = cmdoutput qw(date), '+%s %z', qw(-d), getfield($clogp,'Date');
1975     my $authline = "$author $date";
1976     $authline =~ m/$git_authline_re/o or
1977         fail "unexpected commit author line format \`$authline'".
1978         " (was generated from changelog Maintainer field)";
1979     return ($1,$2,$3) if wantarray;
1980     return $authline;
1981 }
1982
1983 sub vendor_patches_distro ($$) {
1984     my ($checkdistro, $what) = @_;
1985     return unless defined $checkdistro;
1986
1987     my $series = "debian/patches/\L$checkdistro\E.series";
1988     printdebug "checking for vendor-specific $series ($what)\n";
1989
1990     if (!open SERIES, "<", $series) {
1991         die "$series $!" unless $!==ENOENT;
1992         return;
1993     }
1994     while (<SERIES>) {
1995         next unless m/\S/;
1996         next if m/^\s+\#/;
1997
1998         print STDERR <<END;
1999
2000 Unfortunately, this source package uses a feature of dpkg-source where
2001 the same source package unpacks to different source code on different
2002 distros.  dgit cannot safely operate on such packages on affected
2003 distros, because the meaning of source packages is not stable.
2004
2005 Please ask the distro/maintainer to remove the distro-specific series
2006 files and use a different technique (if necessary, uploading actually
2007 different packages, if different distros are supposed to have
2008 different code).
2009
2010 END
2011         fail "Found active distro-specific series file for".
2012             " $checkdistro ($what): $series, cannot continue";
2013     }
2014     die "$series $!" if SERIES->error;
2015     close SERIES;
2016 }
2017
2018 sub check_for_vendor_patches () {
2019     # This dpkg-source feature doesn't seem to be documented anywhere!
2020     # But it can be found in the changelog (reformatted):
2021
2022     #   commit  4fa01b70df1dc4458daee306cfa1f987b69da58c
2023     #   Author: Raphael Hertzog <hertzog@debian.org>
2024     #   Date: Sun  Oct  3  09:36:48  2010 +0200
2025
2026     #   dpkg-source: correctly create .pc/.quilt_series with alternate
2027     #   series files
2028     #   
2029     #   If you have debian/patches/ubuntu.series and you were
2030     #   unpacking the source package on ubuntu, quilt was still
2031     #   directed to debian/patches/series instead of
2032     #   debian/patches/ubuntu.series.
2033     #   
2034     #   debian/changelog                        |    3 +++
2035     #   scripts/Dpkg/Source/Package/V3/quilt.pm |    4 +++-
2036     #   2 files changed, 6 insertions(+), 1 deletion(-)
2037
2038     use Dpkg::Vendor;
2039     vendor_patches_distro($ENV{DEB_VENDOR}, "DEB_VENDOR");
2040     vendor_patches_distro(Dpkg::Vendor::get_current_vendor(),
2041                          "Dpkg::Vendor \`current vendor'");
2042     vendor_patches_distro(access_basedistro(),
2043                           "(base) distro being accessed");
2044     vendor_patches_distro(access_nomdistro(),
2045                           "(nominal) distro being accessed");
2046 }
2047
2048 sub generate_commits_from_dsc () {
2049     # See big comment in fetch_from_archive, below.
2050     # See also README.dsc-import.
2051     prep_ud();
2052     changedir $playground;
2053
2054     my @dfi = dsc_files_info();
2055     foreach my $fi (@dfi) {
2056         my $f = $fi->{Filename};
2057         die "$f ?" if $f =~ m#/|^\.|\.dsc$|\.tmp$#;
2058         my $upper_f = "../../../../$f";
2059
2060         printdebug "considering reusing $f: ";
2061
2062         if (link_ltarget "$upper_f,fetch", $f) {
2063             printdebug "linked (using ...,fetch).\n";
2064         } elsif ((printdebug "($!) "),
2065                  $! != ENOENT) {
2066             fail "accessing ../$f,fetch: $!";
2067         } elsif (link_ltarget $upper_f, $f) {
2068             printdebug "linked.\n";
2069         } elsif ((printdebug "($!) "),
2070                  $! != ENOENT) {
2071             fail "accessing ../$f: $!";
2072         } else {
2073             printdebug "absent.\n";
2074         }
2075
2076         my $refetched;
2077         complete_file_from_dsc('.', $fi, \$refetched)
2078             or next;
2079
2080         printdebug "considering saving $f: ";
2081
2082         if (link $f, $upper_f) {
2083             printdebug "linked.\n";
2084         } elsif ((printdebug "($!) "),
2085                  $! != EEXIST) {
2086             fail "saving ../$f: $!";
2087         } elsif (!$refetched) {
2088             printdebug "no need.\n";
2089         } elsif (link $f, "$upper_f,fetch") {
2090             printdebug "linked (using ...,fetch).\n";
2091         } elsif ((printdebug "($!) "),
2092                  $! != EEXIST) {
2093             fail "saving ../$f,fetch: $!";
2094         } else {
2095             printdebug "cannot.\n";
2096         }
2097     }
2098
2099     # We unpack and record the orig tarballs first, so that we only
2100     # need disk space for one private copy of the unpacked source.
2101     # But we can't make them into commits until we have the metadata
2102     # from the debian/changelog, so we record the tree objects now and
2103     # make them into commits later.
2104     my @tartrees;
2105     my $upstreamv = upstreamversion $dsc->{version};
2106     my $orig_f_base = srcfn $upstreamv, '';
2107
2108     foreach my $fi (@dfi) {
2109         # We actually import, and record as a commit, every tarball
2110         # (unless there is only one file, in which case there seems
2111         # little point.
2112
2113         my $f = $fi->{Filename};
2114         printdebug "import considering $f ";
2115         (printdebug "only one dfi\n"), next if @dfi == 1;
2116         (printdebug "not tar\n"), next unless $f =~ m/\.tar(\.\w+)?$/;
2117         (printdebug "signature\n"), next if $f =~ m/$orig_f_sig_re$/o;
2118         my $compr_ext = $1;
2119
2120         my ($orig_f_part) =
2121             $f =~ m/^\Q$orig_f_base\E\.([^._]+)?\.tar(?:\.\w+)?$/;
2122
2123         printdebug "Y ", (join ' ', map { $_//"(none)" }
2124                           $compr_ext, $orig_f_part
2125                          ), "\n";
2126
2127         my $input = new IO::File $f, '<' or die "$f $!";
2128         my $compr_pid;
2129         my @compr_cmd;
2130
2131         if (defined $compr_ext) {
2132             my $cname =
2133                 Dpkg::Compression::compression_guess_from_filename $f;
2134             fail "Dpkg::Compression cannot handle file $f in source package"
2135                 if defined $compr_ext && !defined $cname;
2136             my $compr_proc =
2137                 new Dpkg::Compression::Process compression => $cname;
2138             @compr_cmd = $compr_proc->get_uncompress_cmdline();
2139             my $compr_fh = new IO::Handle;
2140             my $compr_pid = open $compr_fh, "-|" // die $!;
2141             if (!$compr_pid) {
2142                 open STDIN, "<&", $input or die $!;
2143                 exec @compr_cmd;
2144                 die "dgit (child): exec $compr_cmd[0]: $!\n";
2145             }
2146             $input = $compr_fh;
2147         }
2148
2149         rmtree "_unpack-tar";
2150         mkdir "_unpack-tar" or die $!;
2151         my @tarcmd = qw(tar -x -f -
2152                         --no-same-owner --no-same-permissions
2153                         --no-acls --no-xattrs --no-selinux);
2154         my $tar_pid = fork // die $!;
2155         if (!$tar_pid) {
2156             chdir "_unpack-tar" or die $!;
2157             open STDIN, "<&", $input or die $!;
2158             exec @tarcmd;
2159             die "dgit (child): exec $tarcmd[0]: $!";
2160         }
2161         $!=0; (waitpid $tar_pid, 0) == $tar_pid or die $!;
2162         !$? or failedcmd @tarcmd;
2163
2164         close $input or
2165             (@compr_cmd ? ($?==SIGPIPE || failedcmd @compr_cmd)
2166              : die $!);
2167         # finally, we have the results in "tarball", but maybe
2168         # with the wrong permissions
2169
2170         runcmd qw(chmod -R +rwX _unpack-tar);
2171         changedir "_unpack-tar";
2172         remove_stray_gits($f);
2173         mktree_in_ud_here();
2174         
2175         my ($tree) = git_add_write_tree();
2176         my $tentries = cmdoutput @git, qw(ls-tree -z), $tree;
2177         if ($tentries =~ m/^\d+ tree (\w+)\t[^\000]+\000$/s) {
2178             $tree = $1;
2179             printdebug "one subtree $1\n";
2180         } else {
2181             printdebug "multiple subtrees\n";
2182         }
2183         changedir "..";
2184         rmtree "_unpack-tar";
2185
2186         my $ent = [ $f, $tree ];
2187         push @tartrees, {
2188             Orig => !!$orig_f_part,
2189             Sort => (!$orig_f_part         ? 2 :
2190                      $orig_f_part =~ m/-/g ? 1 :
2191                                              0),
2192             F => $f,
2193             Tree => $tree,
2194         };
2195     }
2196
2197     @tartrees = sort {
2198         # put any without "_" first (spec is not clear whether files
2199         # are always in the usual order).  Tarballs without "_" are
2200         # the main orig or the debian tarball.
2201         $a->{Sort} <=> $b->{Sort} or
2202         $a->{F}    cmp $b->{F}
2203     } @tartrees;
2204
2205     my $any_orig = grep { $_->{Orig} } @tartrees;
2206
2207     my $dscfn = "$package.dsc";
2208
2209     my $treeimporthow = 'package';
2210
2211     open D, ">", $dscfn or die "$dscfn: $!";
2212     print D $dscdata or die "$dscfn: $!";
2213     close D or die "$dscfn: $!";
2214     my @cmd = qw(dpkg-source);
2215     push @cmd, '--no-check' if $dsc_checked;
2216     if (madformat $dsc->{format}) {
2217         push @cmd, '--skip-patches';
2218         $treeimporthow = 'unpatched';
2219     }
2220     push @cmd, qw(-x --), $dscfn;
2221     runcmd @cmd;
2222
2223     my ($tree,$dir) = mktree_in_ud_from_only_subdir("source package");
2224     if (madformat $dsc->{format}) { 
2225         check_for_vendor_patches();
2226     }
2227
2228     my $dappliedtree;
2229     if (madformat $dsc->{format}) {
2230         my @pcmd = qw(dpkg-source --before-build .);
2231         runcmd shell_cmd 'exec >/dev/null', @pcmd;
2232         rmtree '.pc';
2233         $dappliedtree = git_add_write_tree();
2234     }
2235
2236     my @clogcmd = qw(dpkg-parsechangelog --format rfc822 --all);
2237     debugcmd "|",@clogcmd;
2238     open CLOGS, "-|", @clogcmd or die $!;
2239
2240     my $clogp;
2241     my $r1clogp;
2242
2243     printdebug "import clog search...\n";
2244
2245     for (;;) {
2246         my $stanzatext = do { local $/=""; <CLOGS>; };
2247         printdebug "import clogp ".Dumper($stanzatext) if $debuglevel>1;
2248         last if !defined $stanzatext;
2249
2250         my $desc = "package changelog, entry no.$.";
2251         open my $stanzafh, "<", \$stanzatext or die;
2252         my $thisstanza = parsecontrolfh $stanzafh, $desc, 1;
2253         $clogp //= $thisstanza;
2254
2255         printdebug "import clog $thisstanza->{version} $desc...\n";
2256
2257         last if !$any_orig; # we don't need $r1clogp
2258
2259         # We look for the first (most recent) changelog entry whose
2260         # version number is lower than the upstream version of this
2261         # package.  Then the last (least recent) previous changelog
2262         # entry is treated as the one which introduced this upstream
2263         # version and used for the synthetic commits for the upstream
2264         # tarballs.
2265
2266         # One might think that a more sophisticated algorithm would be
2267         # necessary.  But: we do not want to scan the whole changelog
2268         # file.  Stopping when we see an earlier version, which
2269         # necessarily then is an earlier upstream version, is the only
2270         # realistic way to do that.  Then, either the earliest
2271         # changelog entry we have seen so far is indeed the earliest
2272         # upload of this upstream version; or there are only changelog
2273         # entries relating to later upstream versions (which is not
2274         # possible unless the changelog and .dsc disagree about the
2275         # version).  Then it remains to choose between the physically
2276         # last entry in the file, and the one with the lowest version
2277         # number.  If these are not the same, we guess that the
2278         # versions were created in a non-monotic order rather than
2279         # that the changelog entries have been misordered.
2280
2281         printdebug "import clog $thisstanza->{version} vs $upstreamv...\n";
2282
2283         last if version_compare($thisstanza->{version}, $upstreamv) < 0;
2284         $r1clogp = $thisstanza;
2285
2286         printdebug "import clog $r1clogp->{version} becomes r1\n";
2287     }
2288     die $! if CLOGS->error;
2289     close CLOGS or $?==SIGPIPE or failedcmd @clogcmd;
2290
2291     $clogp or fail "package changelog has no entries!";
2292
2293     my $authline = clogp_authline $clogp;
2294     my $changes = getfield $clogp, 'Changes';
2295     $changes =~ s/^\n//; # Changes: \n
2296     my $cversion = getfield $clogp, 'Version';
2297
2298     if (@tartrees) {
2299         $r1clogp //= $clogp; # maybe there's only one entry;
2300         my $r1authline = clogp_authline $r1clogp;
2301         # Strictly, r1authline might now be wrong if it's going to be
2302         # unused because !$any_orig.  Whatever.
2303
2304         printdebug "import tartrees authline   $authline\n";
2305         printdebug "import tartrees r1authline $r1authline\n";
2306
2307         foreach my $tt (@tartrees) {
2308             printdebug "import tartree $tt->{F} $tt->{Tree}\n";
2309
2310             $tt->{Commit} = make_commit_text($tt->{Orig} ? <<END_O : <<END_T);
2311 tree $tt->{Tree}
2312 author $r1authline
2313 committer $r1authline
2314
2315 Import $tt->{F}
2316
2317 [dgit import orig $tt->{F}]
2318 END_O
2319 tree $tt->{Tree}
2320 author $authline
2321 committer $authline
2322
2323 Import $tt->{F}
2324
2325 [dgit import tarball $package $cversion $tt->{F}]
2326 END_T
2327         }
2328     }
2329
2330     printdebug "import main commit\n";
2331
2332     open C, ">../commit.tmp" or die $!;
2333     print C <<END or die $!;
2334 tree $tree
2335 END
2336     print C <<END or die $! foreach @tartrees;
2337 parent $_->{Commit}
2338 END
2339     print C <<END or die $!;
2340 author $authline
2341 committer $authline
2342
2343 $changes
2344
2345 [dgit import $treeimporthow $package $cversion]
2346 END
2347
2348     close C or die $!;
2349     my $rawimport_hash = make_commit qw(../commit.tmp);
2350
2351     if (madformat $dsc->{format}) {
2352         printdebug "import apply patches...\n";
2353
2354         # regularise the state of the working tree so that
2355         # the checkout of $rawimport_hash works nicely.
2356         my $dappliedcommit = make_commit_text(<<END);
2357 tree $dappliedtree
2358 author $authline
2359 committer $authline
2360
2361 [dgit dummy commit]
2362 END
2363         runcmd @git, qw(checkout -q -b dapplied), $dappliedcommit;
2364
2365         runcmd @git, qw(checkout -q -b unpa), $rawimport_hash;
2366
2367         # We need the answers to be reproducible
2368         my @authline = clogp_authline($clogp);
2369         local $ENV{GIT_COMMITTER_NAME} =  $authline[0];
2370         local $ENV{GIT_COMMITTER_EMAIL} = $authline[1];
2371         local $ENV{GIT_COMMITTER_DATE} =  $authline[2];
2372         local $ENV{GIT_AUTHOR_NAME} =  $authline[0];
2373         local $ENV{GIT_AUTHOR_EMAIL} = $authline[1];
2374         local $ENV{GIT_AUTHOR_DATE} =  $authline[2];
2375
2376         my $path = $ENV{PATH} or die;
2377
2378         foreach my $use_absurd (qw(0 1)) {
2379             runcmd @git, qw(checkout -q unpa);
2380             runcmd @git, qw(update-ref -d refs/heads/patch-queue/unpa);
2381             local $ENV{PATH} = $path;
2382             if ($use_absurd) {
2383                 chomp $@;
2384                 progress "warning: $@";
2385                 $path = "$absurdity:$path";
2386                 progress "$us: trying slow absurd-git-apply...";
2387                 rename "../../gbp-pq-output","../../gbp-pq-output.0"
2388                     or $!==ENOENT
2389                     or die $!;
2390             }
2391             eval {
2392                 die "forbid absurd git-apply\n" if $use_absurd
2393                     && forceing [qw(import-gitapply-no-absurd)];
2394                 die "only absurd git-apply!\n" if !$use_absurd
2395                     && forceing [qw(import-gitapply-absurd)];
2396
2397                 local $ENV{DGIT_ABSURD_DEBUG} = $debuglevel if $use_absurd;
2398                 local $ENV{PATH} = $path                    if $use_absurd;
2399
2400                 my @showcmd = (gbp_pq, qw(import));
2401                 my @realcmd = shell_cmd
2402                     'exec >/dev/null 2>>../../gbp-pq-output', @showcmd;
2403                 debugcmd "+",@realcmd;
2404                 if (system @realcmd) {
2405                     die +(shellquote @showcmd).
2406                         " failed: ".
2407                         failedcmd_waitstatus()."\n";
2408                 }
2409
2410                 my $gapplied = git_rev_parse('HEAD');
2411                 my $gappliedtree = cmdoutput @git, qw(rev-parse HEAD:);
2412                 $gappliedtree eq $dappliedtree or
2413                     fail <<END;
2414 gbp-pq import and dpkg-source disagree!
2415  gbp-pq import gave commit $gapplied
2416  gbp-pq import gave tree $gappliedtree
2417  dpkg-source --before-build gave tree $dappliedtree
2418 END
2419                 $rawimport_hash = $gapplied;
2420             };
2421             last unless $@;
2422         }
2423         if ($@) {
2424             { local $@; eval { runcmd qw(cat ../../gbp-pq-output); }; }
2425             die $@;
2426         }
2427     }
2428
2429     progress "synthesised git commit from .dsc $cversion";
2430
2431     my $rawimport_mergeinput = {
2432         Commit => $rawimport_hash,
2433         Info => "Import of source package",
2434     };
2435     my @output = ($rawimport_mergeinput);
2436
2437     if ($lastpush_mergeinput) {
2438         my $oldclogp = mergeinfo_getclogp($lastpush_mergeinput);
2439         my $oversion = getfield $oldclogp, 'Version';
2440         my $vcmp =
2441             version_compare($oversion, $cversion);
2442         if ($vcmp < 0) {
2443             @output = ($rawimport_mergeinput, $lastpush_mergeinput,
2444                 { Message => <<END, ReverseParents => 1 });
2445 Record $package ($cversion) in archive suite $csuite
2446 END
2447         } elsif ($vcmp > 0) {
2448             print STDERR <<END or die $!;
2449
2450 Version actually in archive:   $cversion (older)
2451 Last version pushed with dgit: $oversion (newer or same)
2452 $later_warning_msg
2453 END
2454             @output = $lastpush_mergeinput;
2455         } else {
2456             # Same version.  Use what's in the server git branch,
2457             # discarding our own import.  (This could happen if the
2458             # server automatically imports all packages into git.)
2459             @output = $lastpush_mergeinput;
2460         }
2461     }
2462     changedir $maindir;
2463     rmtree $playground;
2464     return @output;
2465 }
2466
2467 sub complete_file_from_dsc ($$;$) {
2468     our ($dstdir, $fi, $refetched) = @_;
2469     # Ensures that we have, in $dstdir, the file $fi, with the correct
2470     # contents.  (Downloading it from alongside $dscurl if necessary.)
2471     # If $refetched is defined, can overwrite "$dstdir/$fi->{Filename}"
2472     # and will set $$refetched=1 if it did so (or tried to).
2473
2474     my $f = $fi->{Filename};
2475     my $tf = "$dstdir/$f";
2476     my $downloaded = 0;
2477
2478     my $got;
2479     my $checkhash = sub {
2480         open F, "<", "$tf" or die "$tf: $!";
2481         $fi->{Digester}->reset();
2482         $fi->{Digester}->addfile(*F);
2483         F->error and die $!;
2484         $got = $fi->{Digester}->hexdigest();
2485         return $got eq $fi->{Hash};
2486     };
2487
2488     if (stat_exists $tf) {
2489         if ($checkhash->()) {
2490             progress "using existing $f";
2491             return 1;
2492         }
2493         if (!$refetched) {
2494             fail "file $f has hash $got but .dsc".
2495                 " demands hash $fi->{Hash} ".
2496                 "(perhaps you should delete this file?)";
2497         }
2498         progress "need to fetch correct version of $f";
2499         unlink $tf or die "$tf $!";
2500         $$refetched = 1;
2501     } else {
2502         printdebug "$tf does not exist, need to fetch\n";
2503     }
2504
2505     my $furl = $dscurl;
2506     $furl =~ s{/[^/]+$}{};
2507     $furl .= "/$f";
2508     die "$f ?" unless $f =~ m/^\Q${package}\E_/;
2509     die "$f ?" if $f =~ m#/#;
2510     runcmd_ordryrun_local @curl,qw(-f -o),$tf,'--',"$furl";
2511     return 0 if !act_local();
2512
2513     $checkhash->() or
2514         fail "file $f has hash $got but .dsc".
2515             " demands hash $fi->{Hash} ".
2516             "(got wrong file from archive!)";
2517
2518     return 1;
2519 }
2520
2521 sub ensure_we_have_orig () {
2522     my @dfi = dsc_files_info();
2523     foreach my $fi (@dfi) {
2524         my $f = $fi->{Filename};
2525         next unless is_orig_file_in_dsc($f, \@dfi);
2526         complete_file_from_dsc('..', $fi)
2527             or next;
2528     }
2529 }
2530
2531 #---------- git fetch ----------
2532
2533 sub lrfetchrefs () { return "refs/dgit-fetch/".access_basedistro(); }
2534 sub lrfetchref () { return lrfetchrefs.'/'.server_branch($csuite); }
2535
2536 # We fetch some parts of lrfetchrefs/*.  Ideally we delete these
2537 # locally fetched refs because they have unhelpful names and clutter
2538 # up gitk etc.  So we track whether we have "used up" head ref (ie,
2539 # whether we have made another local ref which refers to this object).
2540 #
2541 # (If we deleted them unconditionally, then we might end up
2542 # re-fetching the same git objects each time dgit fetch was run.)
2543 #
2544 # So, each use of lrfetchrefs needs to be accompanied by arrangements
2545 # in git_fetch_us to fetch the refs in question, and possibly a call
2546 # to lrfetchref_used.
2547
2548 our (%lrfetchrefs_f, %lrfetchrefs_d);
2549 # $lrfetchrefs_X{lrfetchrefs."/heads/whatever"} = $objid
2550
2551 sub lrfetchref_used ($) {
2552     my ($fullrefname) = @_;
2553     my $objid = $lrfetchrefs_f{$fullrefname};
2554     $lrfetchrefs_d{$fullrefname} = $objid if defined $objid;
2555 }
2556
2557 sub git_lrfetch_sane {
2558     my ($url, $supplementary, @specs) = @_;
2559     # Make a 'refs/'.lrfetchrefs.'/*' be just like on server,
2560     # at least as regards @specs.  Also leave the results in
2561     # %lrfetchrefs_f, and arrange for lrfetchref_used to be
2562     # able to clean these up.
2563     #
2564     # With $supplementary==1, @specs must not contain wildcards
2565     # and we add to our previous fetches (non-atomically).
2566
2567     # This is rather miserable:
2568     # When git fetch --prune is passed a fetchspec ending with a *,
2569     # it does a plausible thing.  If there is no * then:
2570     # - it matches subpaths too, even if the supplied refspec
2571     #   starts refs, and behaves completely madly if the source
2572     #   has refs/refs/something.  (See, for example, Debian #NNNN.)
2573     # - if there is no matching remote ref, it bombs out the whole
2574     #   fetch.
2575     # We want to fetch a fixed ref, and we don't know in advance
2576     # if it exists, so this is not suitable.
2577     #
2578     # Our workaround is to use git ls-remote.  git ls-remote has its
2579     # own qairks.  Notably, it has the absurd multi-tail-matching
2580     # behaviour: git ls-remote R refs/foo can report refs/foo AND
2581     # refs/refs/foo etc.
2582     #
2583     # Also, we want an idempotent snapshot, but we have to make two
2584     # calls to the remote: one to git ls-remote and to git fetch.  The
2585     # solution is use git ls-remote to obtain a target state, and
2586     # git fetch to try to generate it.  If we don't manage to generate
2587     # the target state, we try again.
2588
2589     printdebug "git_lrfetch_sane suppl=$supplementary specs @specs\n";
2590
2591     my $specre = join '|', map {
2592         my $x = $_;
2593         $x =~ s/\W/\\$&/g;
2594         my $wildcard = $x =~ s/\\\*$/.*/;
2595         die if $wildcard && $supplementary;
2596         "(?:refs/$x)";
2597     } @specs;
2598     printdebug "git_lrfetch_sane specre=$specre\n";
2599     my $wanted_rref = sub {
2600         local ($_) = @_;
2601         return m/^(?:$specre)$/;
2602     };
2603
2604     my $fetch_iteration = 0;
2605     FETCH_ITERATION:
2606     for (;;) {
2607         printdebug "git_lrfetch_sane iteration $fetch_iteration\n";
2608         if (++$fetch_iteration > 10) {
2609             fail "too many iterations trying to get sane fetch!";
2610         }
2611
2612         my @look = map { "refs/$_" } @specs;
2613         my @lcmd = (@git, qw(ls-remote -q --refs), $url, @look);
2614         debugcmd "|",@lcmd;
2615
2616         my %wantr;
2617         open GITLS, "-|", @lcmd or die $!;
2618         while (<GITLS>) {
2619             printdebug "=> ", $_;
2620             m/^(\w+)\s+(\S+)\n/ or die "ls-remote $_ ?";
2621             my ($objid,$rrefname) = ($1,$2);
2622             if (!$wanted_rref->($rrefname)) {
2623                 print STDERR <<END;
2624 warning: git ls-remote @look reported $rrefname; this is silly, ignoring it.
2625 END
2626                 next;
2627             }
2628             $wantr{$rrefname} = $objid;
2629         }
2630         $!=0; $?=0;
2631         close GITLS or failedcmd @lcmd;
2632
2633         # OK, now %want is exactly what we want for refs in @specs
2634         my @fspecs = map {
2635             !m/\*$/ && !exists $wantr{"refs/$_"} ? () :
2636             "+refs/$_:".lrfetchrefs."/$_";
2637         } @specs;
2638
2639         printdebug "git_lrfetch_sane fspecs @fspecs\n";
2640
2641         my @fcmd = (@git, qw(fetch -p -n -q), $url, @fspecs);
2642         runcmd_ordryrun_local @fcmd if @fspecs;
2643
2644         if (!$supplementary) {
2645             %lrfetchrefs_f = ();
2646         }
2647         my %objgot;
2648
2649         git_for_each_ref(lrfetchrefs, sub {
2650             my ($objid,$objtype,$lrefname,$reftail) = @_;
2651             $lrfetchrefs_f{$lrefname} = $objid;
2652             $objgot{$objid} = 1;
2653         });
2654
2655         if ($supplementary) {
2656             last;
2657         }
2658
2659         foreach my $lrefname (sort keys %lrfetchrefs_f) {
2660             my $rrefname = 'refs'.substr($lrefname, length lrfetchrefs);
2661             if (!exists $wantr{$rrefname}) {
2662                 if ($wanted_rref->($rrefname)) {
2663                     printdebug <<END;
2664 git-fetch @fspecs created $lrefname which git ls-remote @look didn't list.
2665 END
2666                 } else {
2667                     print STDERR <<END
2668 warning: git fetch @fspecs created $lrefname; this is silly, deleting it.
2669 END
2670                 }
2671                 runcmd_ordryrun_local @git, qw(update-ref -d), $lrefname;
2672                 delete $lrfetchrefs_f{$lrefname};
2673                 next;
2674             }
2675         }
2676         foreach my $rrefname (sort keys %wantr) {
2677             my $lrefname = lrfetchrefs.substr($rrefname, 4);
2678             my $got = $lrfetchrefs_f{$lrefname} // '<none>';
2679             my $want = $wantr{$rrefname};
2680             next if $got eq $want;
2681             if (!defined $objgot{$want}) {
2682                 print STDERR <<END;
2683 warning: git ls-remote suggests we want $lrefname
2684 warning:  and it should refer to $want
2685 warning:  but git fetch didn't fetch that object to any relevant ref.
2686 warning:  This may be due to a race with someone updating the server.
2687 warning:  Will try again...
2688 END
2689                 next FETCH_ITERATION;
2690             }
2691             printdebug <<END;
2692 git-fetch @fspecs made $lrefname=$got but want git ls-remote @look says $want
2693 END
2694             runcmd_ordryrun_local @git, qw(update-ref -m),
2695                 "dgit fetch git fetch fixup", $lrefname, $want;
2696             $lrfetchrefs_f{$lrefname} = $want;
2697         }
2698         last;
2699     }
2700
2701     if (defined $csuite) {
2702         printdebug "git_lrfetch_sane: tidying any old suite lrfetchrefs\n";
2703         git_for_each_ref("refs/dgit-fetch/$csuite", sub {
2704             my ($objid,$objtype,$lrefname,$reftail) = @_;
2705             next if $lrfetchrefs_f{$lrefname}; # $csuite eq $distro ?
2706             runcmd_ordryrun_local @git, qw(update-ref -d), $lrefname;
2707         });
2708     }
2709
2710     printdebug "git_lrfetch_sane: git fetch --no-insane emulation complete\n",
2711         Dumper(\%lrfetchrefs_f);
2712 }
2713
2714 sub git_fetch_us () {
2715     # Want to fetch only what we are going to use, unless
2716     # deliberately-not-ff, in which case we must fetch everything.
2717
2718     my @specs = deliberately_not_fast_forward ? qw(tags/*) :
2719         map { "tags/$_" }
2720         (quiltmode_splitbrain
2721          ? (map { $_->('*',access_nomdistro) }
2722             \&debiantag_new, \&debiantag_maintview)
2723          : debiantags('*',access_nomdistro));
2724     push @specs, server_branch($csuite);
2725     push @specs, $rewritemap;
2726     push @specs, qw(heads/*) if deliberately_not_fast_forward;
2727
2728     my $url = access_giturl();
2729     git_lrfetch_sane $url, 0, @specs;
2730
2731     my %here;
2732     my @tagpats = debiantags('*',access_nomdistro);
2733
2734     git_for_each_ref([map { "refs/tags/$_" } @tagpats], sub {
2735         my ($objid,$objtype,$fullrefname,$reftail) = @_;
2736         printdebug "currently $fullrefname=$objid\n";
2737         $here{$fullrefname} = $objid;
2738     });
2739     git_for_each_ref([map { lrfetchrefs."/tags/".$_ } @tagpats], sub {
2740         my ($objid,$objtype,$fullrefname,$reftail) = @_;
2741         my $lref = "refs".substr($fullrefname, length(lrfetchrefs));
2742         printdebug "offered $lref=$objid\n";
2743         if (!defined $here{$lref}) {
2744             my @upd = (@git, qw(update-ref), $lref, $objid, '');
2745             runcmd_ordryrun_local @upd;
2746             lrfetchref_used $fullrefname;
2747         } elsif ($here{$lref} eq $objid) {
2748             lrfetchref_used $fullrefname;
2749         } else {
2750             print STDERR
2751                 "Not updating $lref from $here{$lref} to $objid.\n";
2752         }
2753     });
2754 }
2755
2756 #---------- dsc and archive handling ----------
2757
2758 sub mergeinfo_getclogp ($) {
2759     # Ensures thit $mi->{Clogp} exists and returns it
2760     my ($mi) = @_;
2761     $mi->{Clogp} = commit_getclogp($mi->{Commit});
2762 }
2763
2764 sub mergeinfo_version ($) {
2765     return getfield( (mergeinfo_getclogp $_[0]), 'Version' );
2766 }
2767
2768 sub fetch_from_archive_record_1 ($) {
2769     my ($hash) = @_;
2770     runcmd @git, qw(update-ref -m), "dgit fetch $csuite",
2771             'DGIT_ARCHIVE', $hash;
2772     cmdoutput @git, qw(log -n2), $hash;
2773     # ... gives git a chance to complain if our commit is malformed
2774 }
2775
2776 sub fetch_from_archive_record_2 ($) {
2777     my ($hash) = @_;
2778     my @upd_cmd = (@git, qw(update-ref -m), 'dgit fetch', lrref(), $hash);
2779     if (act_local()) {
2780         cmdoutput @upd_cmd;
2781     } else {
2782         dryrun_report @upd_cmd;
2783     }
2784 }
2785
2786 sub parse_dsc_field_def_dsc_distro () {
2787     $dsc_distro //= cfg qw(dgit.default.old-dsc-distro
2788                            dgit.default.distro);
2789 }
2790
2791 sub parse_dsc_field ($$) {
2792     my ($dsc, $what) = @_;
2793     my $f;
2794     foreach my $field (@ourdscfield) {
2795         $f = $dsc->{$field};
2796         last if defined $f;
2797     }
2798
2799     if (!defined $f) {
2800         progress "$what: NO git hash";
2801         parse_dsc_field_def_dsc_distro();
2802     } elsif (($dsc_hash, $dsc_distro, $dsc_hint_tag, $dsc_hint_url)
2803              = $f =~ m/^(\w+)\s+($distro_re)\s+($versiontag_re)\s+(\S+)(?:\s|$)/) {
2804         progress "$what: specified git info ($dsc_distro)";
2805         $dsc_hint_tag = [ $dsc_hint_tag ];
2806     } elsif ($f =~ m/^\w+\s*$/) {
2807         $dsc_hash = $&;
2808         parse_dsc_field_def_dsc_distro();
2809         $dsc_hint_tag = [ debiantags +(getfield $dsc, 'Version'),
2810                           $dsc_distro ];
2811         progress "$what: specified git hash";
2812     } else {
2813         fail "$what: invalid Dgit info";
2814     }
2815 }
2816
2817 sub resolve_dsc_field_commit ($$) {
2818     my ($already_distro, $already_mapref) = @_;
2819
2820     return unless defined $dsc_hash;
2821
2822     my $mapref =
2823         defined $already_mapref &&
2824         ($already_distro eq $dsc_distro || !$chase_dsc_distro)
2825         ? $already_mapref : undef;
2826
2827     my $do_fetch;
2828     $do_fetch = sub {
2829         my ($what, @fetch) = @_;
2830
2831         local $idistro = $dsc_distro;
2832         my $lrf = lrfetchrefs;
2833
2834         if (!$chase_dsc_distro) {
2835             progress
2836                 "not chasing .dsc distro $dsc_distro: not fetching $what";
2837             return 0;
2838         }
2839
2840         progress
2841             ".dsc names distro $dsc_distro: fetching $what";
2842
2843         my $url = access_giturl();
2844         if (!defined $url) {
2845             defined $dsc_hint_url or fail <<END;
2846 .dsc Dgit metadata is in context of distro $dsc_distro
2847 for which we have no configured url and .dsc provides no hint
2848 END
2849             my $proto =
2850                 $dsc_hint_url =~ m#^([-+0-9a-zA-Z]+):# ? $1 :
2851                 $dsc_hint_url =~ m#^/# ? 'file' : 'bad-syntax';
2852             parse_cfg_bool "dsc-url-proto-ok", 'false',
2853                 cfg("dgit.dsc-url-proto-ok.$proto",
2854                     "dgit.default.dsc-url-proto-ok")
2855                 or fail <<END;
2856 .dsc Dgit metadata is in context of distro $dsc_distro
2857 for which we have no configured url;
2858 .dsc provides hinted url with protocol $proto which is unsafe.
2859 (can be overridden by config - consult documentation)
2860 END
2861             $url = $dsc_hint_url;
2862         }
2863
2864         git_lrfetch_sane $url, 1, @fetch;
2865
2866         return $lrf;
2867     };
2868
2869     my $rewrite_enable = do {
2870         local $idistro = $dsc_distro;
2871         access_cfg('rewrite-map-enable', 'RETURN-UNDEF');
2872     };
2873
2874     if (parse_cfg_bool 'rewrite-map-enable', 'true', $rewrite_enable) {
2875         if (!defined $mapref) {
2876             my $lrf = $do_fetch->("rewrite map", $rewritemap) or return;
2877             $mapref = $lrf.'/'.$rewritemap;
2878         }
2879         my $rewritemapdata = git_cat_file $mapref.':map';
2880         if (defined $rewritemapdata
2881             && $rewritemapdata =~ m/^$dsc_hash(?:[ \t](\w+))/m) {
2882             progress
2883                 "server's git history rewrite map contains a relevant entry!";
2884
2885             $dsc_hash = $1;
2886             if (defined $dsc_hash) {
2887                 progress "using rewritten git hash in place of .dsc value";
2888             } else {
2889                 progress "server data says .dsc hash is to be disregarded";
2890             }
2891         }
2892     }
2893
2894     if (!defined git_cat_file $dsc_hash) {
2895         my @tags = map { "tags/".$_ } @$dsc_hint_tag;
2896         my $lrf = $do_fetch->("additional commits", @tags) &&
2897             defined git_cat_file $dsc_hash
2898             or fail <<END;
2899 .dsc Dgit metadata requires commit $dsc_hash
2900 but we could not obtain that object anywhere.
2901 END
2902         foreach my $t (@tags) {
2903             my $fullrefname = $lrf.'/'.$t;
2904 #           print STDERR "CHK $t $fullrefname ".Dumper(\%lrfetchrefs_f);
2905             next unless $lrfetchrefs_f{$fullrefname};
2906             next unless is_fast_fwd "$fullrefname~0", $dsc_hash;
2907             lrfetchref_used $fullrefname;
2908         }
2909     }
2910 }
2911
2912 sub fetch_from_archive () {
2913     ensure_setup_existing_tree();
2914
2915     # Ensures that lrref() is what is actually in the archive, one way
2916     # or another, according to us - ie this client's
2917     # appropritaely-updated archive view.  Also returns the commit id.
2918     # If there is nothing in the archive, leaves lrref alone and
2919     # returns undef.  git_fetch_us must have already been called.
2920     get_archive_dsc();
2921
2922     if ($dsc) {
2923         parse_dsc_field($dsc, 'last upload to archive');
2924         resolve_dsc_field_commit access_basedistro,
2925             lrfetchrefs."/".$rewritemap
2926     } else {
2927         progress "no version available from the archive";
2928     }
2929
2930     # If the archive's .dsc has a Dgit field, there are three
2931     # relevant git commitids we need to choose between and/or merge
2932     # together:
2933     #   1. $dsc_hash: the Dgit field from the archive
2934     #   2. $lastpush_hash: the suite branch on the dgit git server
2935     #   3. $lastfetch_hash: our local tracking brach for the suite
2936     #
2937     # These may all be distinct and need not be in any fast forward
2938     # relationship:
2939     #
2940     # If the dsc was pushed to this suite, then the server suite
2941     # branch will have been updated; but it might have been pushed to
2942     # a different suite and copied by the archive.  Conversely a more
2943     # recent version may have been pushed with dgit but not appeared
2944     # in the archive (yet).
2945     #
2946     # $lastfetch_hash may be awkward because archive imports
2947     # (particularly, imports of Dgit-less .dscs) are performed only as
2948     # needed on individual clients, so different clients may perform a
2949     # different subset of them - and these imports are only made
2950     # public during push.  So $lastfetch_hash may represent a set of
2951     # imports different to a subsequent upload by a different dgit
2952     # client.
2953     #
2954     # Our approach is as follows:
2955     #
2956     # As between $dsc_hash and $lastpush_hash: if $lastpush_hash is a
2957     # descendant of $dsc_hash, then it was pushed by a dgit user who
2958     # had based their work on $dsc_hash, so we should prefer it.
2959     # Otherwise, $dsc_hash was installed into this suite in the
2960     # archive other than by a dgit push, and (necessarily) after the
2961     # last dgit push into that suite (since a dgit push would have
2962     # been descended from the dgit server git branch); thus, in that
2963     # case, we prefer the archive's version (and produce a
2964     # pseudo-merge to overwrite the dgit server git branch).
2965     #
2966     # (If there is no Dgit field in the archive's .dsc then
2967     # generate_commit_from_dsc uses the version numbers to decide
2968     # whether the suite branch or the archive is newer.  If the suite
2969     # branch is newer it ignores the archive's .dsc; otherwise it
2970     # generates an import of the .dsc, and produces a pseudo-merge to
2971     # overwrite the suite branch with the archive contents.)
2972     #
2973     # The outcome of that part of the algorithm is the `public view',
2974     # and is same for all dgit clients: it does not depend on any
2975     # unpublished history in the local tracking branch.
2976     #
2977     # As between the public view and the local tracking branch: The
2978     # local tracking branch is only updated by dgit fetch, and
2979     # whenever dgit fetch runs it includes the public view in the
2980     # local tracking branch.  Therefore if the public view is not
2981     # descended from the local tracking branch, the local tracking
2982     # branch must contain history which was imported from the archive
2983     # but never pushed; and, its tip is now out of date.  So, we make
2984     # a pseudo-merge to overwrite the old imports and stitch the old
2985     # history in.
2986     #
2987     # Finally: we do not necessarily reify the public view (as
2988     # described above).  This is so that we do not end up stacking two
2989     # pseudo-merges.  So what we actually do is figure out the inputs
2990     # to any public view pseudo-merge and put them in @mergeinputs.
2991
2992     my @mergeinputs;
2993     # $mergeinputs[]{Commit}
2994     # $mergeinputs[]{Info}
2995     # $mergeinputs[0] is the one whose tree we use
2996     # @mergeinputs is in the order we use in the actual commit)
2997     #
2998     # Also:
2999     # $mergeinputs[]{Message} is a commit message to use
3000     # $mergeinputs[]{ReverseParents} if def specifies that parent
3001     #                                list should be in opposite order
3002     # Such an entry has no Commit or Info.  It applies only when found
3003     # in the last entry.  (This ugliness is to support making
3004     # identical imports to previous dgit versions.)
3005
3006     my $lastpush_hash = git_get_ref(lrfetchref());
3007     printdebug "previous reference hash=$lastpush_hash\n";
3008     $lastpush_mergeinput = $lastpush_hash && {
3009         Commit => $lastpush_hash,
3010         Info => "dgit suite branch on dgit git server",
3011     };
3012
3013     my $lastfetch_hash = git_get_ref(lrref());
3014     printdebug "fetch_from_archive: lastfetch=$lastfetch_hash\n";
3015     my $lastfetch_mergeinput = $lastfetch_hash && {
3016         Commit => $lastfetch_hash,
3017         Info => "dgit client's archive history view",
3018     };
3019
3020     my $dsc_mergeinput = $dsc_hash && {
3021         Commit => $dsc_hash,
3022         Info => "Dgit field in .dsc from archive",
3023     };
3024
3025     my $cwd = getcwd();
3026     my $del_lrfetchrefs = sub {
3027         changedir $cwd;
3028         my $gur;
3029         printdebug "del_lrfetchrefs...\n";
3030         foreach my $fullrefname (sort keys %lrfetchrefs_d) {
3031             my $objid = $lrfetchrefs_d{$fullrefname};
3032             printdebug "del_lrfetchrefs: $objid $fullrefname\n";
3033             if (!$gur) {
3034                 $gur ||= new IO::Handle;
3035                 open $gur, "|-", qw(git update-ref --stdin) or die $!;
3036             }
3037             printf $gur "delete %s %s\n", $fullrefname, $objid;
3038         }
3039         if ($gur) {
3040             close $gur or failedcmd "git update-ref delete lrfetchrefs";
3041         }
3042     };
3043
3044     if (defined $dsc_hash) {
3045         ensure_we_have_orig();
3046         if (!$lastpush_hash || $dsc_hash eq $lastpush_hash) {
3047             @mergeinputs = $dsc_mergeinput
3048         } elsif (is_fast_fwd($dsc_hash,$lastpush_hash)) {
3049             print STDERR <<END or die $!;
3050
3051 Git commit in archive is behind the last version allegedly pushed/uploaded.
3052 Commit referred to by archive: $dsc_hash
3053 Last version pushed with dgit: $lastpush_hash
3054 $later_warning_msg
3055 END
3056             @mergeinputs = ($lastpush_mergeinput);
3057         } else {
3058             # Archive has .dsc which is not a descendant of the last dgit
3059             # push.  This can happen if the archive moves .dscs about.
3060             # Just follow its lead.
3061             if (is_fast_fwd($lastpush_hash,$dsc_hash)) {
3062                 progress "archive .dsc names newer git commit";
3063                 @mergeinputs = ($dsc_mergeinput);
3064             } else {
3065                 progress "archive .dsc names other git commit, fixing up";
3066                 @mergeinputs = ($dsc_mergeinput, $lastpush_mergeinput);
3067             }
3068         }
3069     } elsif ($dsc) {
3070         @mergeinputs = generate_commits_from_dsc();
3071         # We have just done an import.  Now, our import algorithm might
3072         # have been improved.  But even so we do not want to generate
3073         # a new different import of the same package.  So if the
3074         # version numbers are the same, just use our existing version.
3075         # If the version numbers are different, the archive has changed
3076         # (perhaps, rewound).
3077         if ($lastfetch_mergeinput &&
3078             !version_compare( (mergeinfo_version $lastfetch_mergeinput),
3079                               (mergeinfo_version $mergeinputs[0]) )) {
3080             @mergeinputs = ($lastfetch_mergeinput);
3081         }
3082     } elsif ($lastpush_hash) {
3083         # only in git, not in the archive yet
3084         @mergeinputs = ($lastpush_mergeinput);
3085         print STDERR <<END or die $!;
3086
3087 Package not found in the archive, but has allegedly been pushed using dgit.
3088 $later_warning_msg
3089 END
3090     } else {
3091         printdebug "nothing found!\n";
3092         if (defined $skew_warning_vsn) {
3093             print STDERR <<END or die $!;
3094
3095 Warning: relevant archive skew detected.
3096 Archive allegedly contains $skew_warning_vsn
3097 But we were not able to obtain any version from the archive or git.
3098
3099 END
3100         }
3101         unshift @end, $del_lrfetchrefs;
3102         return undef;
3103     }
3104
3105     if ($lastfetch_hash &&
3106         !grep {
3107             my $h = $_->{Commit};
3108             $h and is_fast_fwd($lastfetch_hash, $h);
3109             # If true, one of the existing parents of this commit
3110             # is a descendant of the $lastfetch_hash, so we'll
3111             # be ff from that automatically.
3112         } @mergeinputs
3113         ) {
3114         # Otherwise:
3115         push @mergeinputs, $lastfetch_mergeinput;
3116     }
3117
3118     printdebug "fetch mergeinfos:\n";
3119     foreach my $mi (@mergeinputs) {
3120         if ($mi->{Info}) {
3121             printdebug " commit $mi->{Commit} $mi->{Info}\n";
3122         } else {
3123             printdebug sprintf " ReverseParents=%d Message=%s",
3124                 $mi->{ReverseParents}, $mi->{Message};
3125         }
3126     }
3127
3128     my $compat_info= pop @mergeinputs
3129         if $mergeinputs[$#mergeinputs]{Message};
3130
3131     @mergeinputs = grep { defined $_->{Commit} } @mergeinputs;
3132
3133     my $hash;
3134     if (@mergeinputs > 1) {
3135         # here we go, then:
3136         my $tree_commit = $mergeinputs[0]{Commit};
3137
3138         my $tree = cmdoutput @git, qw(cat-file commit), $tree_commit;
3139         $tree =~ m/\n\n/;  $tree = $`;
3140         $tree =~ m/^tree (\w+)$/m or die "$dsc_hash tree ?";
3141         $tree = $1;
3142
3143         # We use the changelog author of the package in question the
3144         # author of this pseudo-merge.  This is (roughly) correct if
3145         # this commit is simply representing aa non-dgit upload.
3146         # (Roughly because it does not record sponsorship - but we
3147         # don't have sponsorship info because that's in the .changes,
3148         # which isn't in the archivw.)
3149         #
3150         # But, it might be that we are representing archive history
3151         # updates (including in-archive copies).  These are not really
3152         # the responsibility of the person who created the .dsc, but
3153         # there is no-one whose name we should better use.  (The
3154         # author of the .dsc-named commit is clearly worse.)
3155
3156         my $useclogp = mergeinfo_getclogp $mergeinputs[0];
3157         my $author = clogp_authline $useclogp;
3158         my $cversion = getfield $useclogp, 'Version';
3159
3160         my $mcf = ".git/dgit/mergecommit";
3161         open MC, ">", $mcf or die "$mcf $!";
3162         print MC <<END or die $!;
3163 tree $tree
3164 END
3165
3166         my @parents = grep { $_->{Commit} } @mergeinputs;
3167         @parents = reverse @parents if $compat_info->{ReverseParents};
3168         print MC <<END or die $! foreach @parents;
3169 parent $_->{Commit}
3170 END
3171
3172         print MC <<END or die $!;
3173 author $author
3174 committer $author
3175
3176 END
3177
3178         if (defined $compat_info->{Message}) {
3179             print MC $compat_info->{Message} or die $!;
3180         } else {
3181             print MC <<END or die $!;
3182 Record $package ($cversion) in archive suite $csuite
3183
3184 Record that
3185 END
3186             my $message_add_info = sub {
3187                 my ($mi) = (@_);
3188                 my $mversion = mergeinfo_version $mi;
3189                 printf MC "  %-20s %s\n", $mversion, $mi->{Info}
3190                     or die $!;
3191             };
3192
3193             $message_add_info->($mergeinputs[0]);
3194             print MC <<END or die $!;
3195 should be treated as descended from
3196 END
3197             $message_add_info->($_) foreach @mergeinputs[1..$#mergeinputs];
3198         }
3199
3200         close MC or die $!;
3201         $hash = make_commit $mcf;
3202     } else {
3203         $hash = $mergeinputs[0]{Commit};
3204     }
3205     printdebug "fetch hash=$hash\n";
3206
3207     my $chkff = sub {
3208         my ($lasth, $what) = @_;
3209         return unless $lasth;
3210         die "$lasth $hash $what ?" unless is_fast_fwd($lasth, $hash);
3211     };
3212
3213     $chkff->($lastpush_hash, 'dgit repo server tip (last push)')
3214         if $lastpush_hash;
3215     $chkff->($lastfetch_hash, 'local tracking tip (last fetch)');
3216
3217     fetch_from_archive_record_1($hash);
3218
3219     if (defined $skew_warning_vsn) {
3220         mkpath '.git/dgit';
3221         printdebug "SKEW CHECK WANT $skew_warning_vsn\n";
3222         my $gotclogp = commit_getclogp($hash);
3223         my $got_vsn = getfield $gotclogp, 'Version';
3224         printdebug "SKEW CHECK GOT $got_vsn\n";
3225         if (version_compare($got_vsn, $skew_warning_vsn) < 0) {
3226             print STDERR <<END or die $!;
3227
3228 Warning: archive skew detected.  Using the available version:
3229 Archive allegedly contains    $skew_warning_vsn
3230 We were able to obtain only   $got_vsn
3231
3232 END
3233         }
3234     }
3235
3236     if ($lastfetch_hash ne $hash) {
3237         fetch_from_archive_record_2($hash);
3238     }
3239
3240     lrfetchref_used lrfetchref();
3241
3242     check_gitattrs($hash, "fetched source tree");
3243
3244     unshift @end, $del_lrfetchrefs;
3245     return $hash;
3246 }
3247
3248 sub set_local_git_config ($$) {
3249     my ($k, $v) = @_;
3250     runcmd @git, qw(config), $k, $v;
3251 }
3252
3253 sub setup_mergechangelogs (;$) {
3254     my ($always) = @_;
3255     return unless $always || access_cfg_bool(1, 'setup-mergechangelogs');
3256
3257     my $driver = 'dpkg-mergechangelogs';
3258     my $cb = "merge.$driver";
3259     my $attrs = '.git/info/attributes';
3260     ensuredir '.git/info';
3261
3262     open NATTRS, ">", "$attrs.new" or die "$attrs.new $!";
3263     if (!open ATTRS, "<", $attrs) {
3264         $!==ENOENT or die "$attrs: $!";
3265     } else {
3266         while (<ATTRS>) {
3267             chomp;
3268             next if m{^debian/changelog\s};
3269             print NATTRS $_, "\n" or die $!;
3270         }
3271         ATTRS->error and die $!;
3272         close ATTRS;
3273     }
3274     print NATTRS "debian/changelog merge=$driver\n" or die $!;
3275     close NATTRS;
3276
3277     set_local_git_config "$cb.name", 'debian/changelog merge driver';
3278     set_local_git_config "$cb.driver", 'dpkg-mergechangelogs -m %O %A %B %A';
3279
3280     rename "$attrs.new", "$attrs" or die "$attrs: $!";
3281 }
3282
3283 sub setup_useremail (;$) {
3284     my ($always) = @_;
3285     return unless $always || access_cfg_bool(1, 'setup-useremail');
3286
3287     my $setup = sub {
3288         my ($k, $envvar) = @_;
3289         my $v = access_cfg("user-$k", 'RETURN-UNDEF') // $ENV{$envvar};
3290         return unless defined $v;
3291         set_local_git_config "user.$k", $v;
3292     };
3293
3294     $setup->('email', 'DEBEMAIL');
3295     $setup->('name', 'DEBFULLNAME');
3296 }
3297
3298 sub ensure_setup_existing_tree () {
3299     my $k = "remote.$remotename.skipdefaultupdate";
3300     my $c = git_get_config $k;
3301     return if defined $c;
3302     set_local_git_config $k, 'true';
3303 }
3304
3305 sub open_gitattrs () {
3306     my $gai = new IO::File ".git/info/attributes"
3307         or $!==ENOENT
3308         or die "open .git/info/attributes: $!";
3309     return $gai;
3310 }
3311
3312 sub is_gitattrs_setup () {
3313     my $gai = open_gitattrs();
3314     return 0 unless $gai;
3315     while (<$gai>) {
3316         return 1 if m{^\[attr\]dgit-defuse-attrs\s};
3317     }
3318     $gai->error and die $!;
3319     return 0;
3320 }    
3321
3322 sub setup_gitattrs (;$) {
3323     my ($always) = @_;
3324     return unless $always || access_cfg_bool(1, 'setup-gitattributes');
3325
3326     if (is_gitattrs_setup()) {
3327         progress <<END;
3328 [attr]dgit-defuse-attrs already found in .git/info/attributes
3329  not doing further gitattributes setup
3330 END
3331         return;
3332     }
3333     my $af = ".git/info/attributes";
3334     ensuredir '.git/info';
3335     open GAO, "> $af.new" or die $!;
3336     print GAO <<END or die $!;
3337 *       dgit-defuse-attrs
3338 [attr]dgit-defuse-attrs $negate_harmful_gitattrs
3339 # ^ see GITATTRIBUTES in dgit(7) and dgit setup-new-tree in dgit(1)
3340 END
3341     my $gai = open_gitattrs();
3342     if ($gai) {
3343         while (<$gai>) {
3344             chomp;
3345             print GAO $_, "\n" or die $!;
3346         }
3347         $gai->error and die $!;
3348     }
3349     close GAO or die $!;
3350     rename "$af.new", "$af" or die "install $af: $!";
3351 }
3352
3353 sub setup_new_tree () {
3354     setup_mergechangelogs();
3355     setup_useremail();
3356     setup_gitattrs();
3357 }
3358
3359 sub check_gitattrs ($$) {
3360     my ($treeish, $what) = @_;
3361
3362     return if is_gitattrs_setup;
3363
3364     local $/="\0";
3365     my @cmd = (@git, qw(ls-tree -lrz --), "${treeish}:");
3366     debugcmd "|",@cmd;
3367     my $gafl = new IO::File;
3368     open $gafl, "-|", @cmd or die $!;
3369     while (<$gafl>) {
3370         chomp or die;
3371         s/^\d+\s+\w+\s+\w+\s+(\d+)\t// or die;
3372         next if $1 == 0;
3373         next unless m{(?:^|/)\.gitattributes$};
3374
3375         # oh dear, found one
3376         print STDERR <<END;
3377 dgit: warning: $what contains .gitattributes
3378 dgit: .gitattributes have not been defused.  Recommended: dgit setup-new-tree.
3379 END
3380         close $gafl;
3381         return;
3382     }
3383     # tree contains no .gitattributes files
3384     $?=0; $!=0; close $gafl or failedcmd @cmd;
3385 }
3386
3387
3388 sub multisuite_suite_child ($$$) {
3389     my ($tsuite, $merginputs, $fn) = @_;
3390     # in child, sets things up, calls $fn->(), and returns undef
3391     # in parent, returns canonical suite name for $tsuite
3392     my $canonsuitefh = IO::File::new_tmpfile;
3393     my $pid = fork // die $!;
3394     if (!$pid) {
3395         forkcheck_setup();
3396         $isuite = $tsuite;
3397         $us .= " [$isuite]";
3398         $debugprefix .= " ";
3399         progress "fetching $tsuite...";
3400         canonicalise_suite();
3401         print $canonsuitefh $csuite, "\n" or die $!;
3402         close $canonsuitefh or die $!;
3403         $fn->();
3404         return undef;
3405     }
3406     waitpid $pid,0 == $pid or die $!;
3407     fail "failed to obtain $tsuite: ".waitstatusmsg() if $? && $?!=256*4;
3408     seek $canonsuitefh,0,0 or die $!;
3409     local $csuite = <$canonsuitefh>;
3410     die $! unless defined $csuite && chomp $csuite;
3411     if ($? == 256*4) {
3412         printdebug "multisuite $tsuite missing\n";
3413         return $csuite;
3414     }
3415     printdebug "multisuite $tsuite ok (canon=$csuite)\n";
3416     push @$merginputs, {
3417         Ref => lrref,
3418         Info => $csuite,
3419     };
3420     return $csuite;
3421 }
3422
3423 sub fork_for_multisuite ($) {
3424     my ($before_fetch_merge) = @_;
3425     # if nothing unusual, just returns ''
3426     #
3427     # if multisuite:
3428     # returns 0 to caller in child, to do first of the specified suites
3429     # in child, $csuite is not yet set
3430     #
3431     # returns 1 to caller in parent, to finish up anything needed after
3432     # in parent, $csuite is set to canonicalised portmanteau
3433
3434     my $org_isuite = $isuite;
3435     my @suites = split /\,/, $isuite;
3436     return '' unless @suites > 1;
3437     printdebug "fork_for_multisuite: @suites\n";
3438
3439     my @mergeinputs;
3440
3441     my $cbasesuite = multisuite_suite_child($suites[0], \@mergeinputs,
3442                                             sub { });
3443     return 0 unless defined $cbasesuite;
3444
3445     fail "package $package missing in (base suite) $cbasesuite"
3446         unless @mergeinputs;
3447
3448     my @csuites = ($cbasesuite);
3449
3450     $before_fetch_merge->();
3451
3452     foreach my $tsuite (@suites[1..$#suites]) {
3453         $tsuite =~ s/^-/$cbasesuite-/;
3454         my $csubsuite = multisuite_suite_child($tsuite, \@mergeinputs,
3455                                                sub {
3456             @end = ();
3457             fetch();
3458             exit 0;
3459         });
3460         # xxx collecte the ref here
3461
3462         $csubsuite =~ s/^\Q$cbasesuite\E-/-/;
3463         push @csuites, $csubsuite;
3464     }
3465
3466     foreach my $mi (@mergeinputs) {
3467         my $ref = git_get_ref $mi->{Ref};
3468         die "$mi->{Ref} ?" unless length $ref;
3469         $mi->{Commit} = $ref;
3470     }
3471
3472     $csuite = join ",", @csuites;
3473
3474     my $previous = git_get_ref lrref;
3475     if ($previous) {
3476         unshift @mergeinputs, {
3477             Commit => $previous,
3478             Info => "local combined tracking branch",
3479             Warning =>
3480  "archive seems to have rewound: local tracking branch is ahead!",
3481         };
3482     }
3483
3484     foreach my $ix (0..$#mergeinputs) {
3485         $mergeinputs[$ix]{Index} = $ix;
3486     }
3487
3488     @mergeinputs = sort {
3489         -version_compare(mergeinfo_version $a,
3490                          mergeinfo_version $b) # highest version first
3491             or
3492         $a->{Index} <=> $b->{Index}; # earliest in spec first
3493     } @mergeinputs;
3494
3495     my @needed;
3496
3497   NEEDED:
3498     foreach my $mi (@mergeinputs) {
3499         printdebug "multisuite merge check $mi->{Info}\n";
3500         foreach my $previous (@needed) {
3501             next unless is_fast_fwd $mi->{Commit}, $previous->{Commit};
3502             printdebug "multisuite merge un-needed $previous->{Info}\n";
3503             next NEEDED;
3504         }
3505         push @needed, $mi;
3506         printdebug "multisuite merge this-needed\n";
3507         $mi->{Character} = '+';
3508     }
3509
3510     $needed[0]{Character} = '*';
3511
3512     my $output = $needed[0]{Commit};
3513
3514     if (@needed > 1) {
3515         printdebug "multisuite merge nontrivial\n";
3516         my $tree = cmdoutput qw(git rev-parse), $needed[0]{Commit}.':';
3517
3518         my $commit = "tree $tree\n";
3519         my $msg = "Combine archive branches $csuite [dgit]\n\n".
3520             "Input branches:\n";
3521
3522         foreach my $mi (sort { $a->{Index} <=> $b->{Index} } @mergeinputs) {
3523             printdebug "multisuite merge include $mi->{Info}\n";
3524             $mi->{Character} //= ' ';
3525             $commit .= "parent $mi->{Commit}\n";
3526             $msg .= sprintf " %s  %-25s %s\n",
3527                 $mi->{Character},
3528                 (mergeinfo_version $mi),
3529                 $mi->{Info};
3530         }
3531         my $authline = clogp_authline mergeinfo_getclogp $needed[0];
3532         $msg .= "\nKey\n".
3533             " * marks the highest version branch, which choose to use\n".
3534             " + marks each branch which was not already an ancestor\n\n".
3535             "[dgit multi-suite $csuite]\n";
3536         $commit .=
3537             "author $authline\n".
3538             "committer $authline\n\n";
3539         $output = make_commit_text $commit.$msg;
3540         printdebug "multisuite merge generated $output\n";
3541     }
3542
3543     fetch_from_archive_record_1($output);
3544     fetch_from_archive_record_2($output);
3545
3546     progress "calculated combined tracking suite $csuite";
3547
3548     return 1;
3549 }
3550
3551 sub clone_set_head () {
3552     open H, "> .git/HEAD" or die $!;
3553     print H "ref: ".lref()."\n" or die $!;
3554     close H or die $!;
3555 }
3556 sub clone_finish ($) {
3557     my ($dstdir) = @_;
3558     runcmd @git, qw(reset --hard), lrref();
3559     runcmd qw(bash -ec), <<'END';
3560         set -o pipefail
3561         git ls-tree -r --name-only -z HEAD | \
3562         xargs -0r touch -h -r . --
3563 END
3564     printdone "ready for work in $dstdir";
3565 }
3566
3567 sub clone ($) {
3568     # in multisuite, returns twice!
3569     # once in parent after first suite fetched,
3570     # and then again in child after everything is finished
3571     my ($dstdir) = @_;
3572     badusage "dry run makes no sense with clone" unless act_local();
3573
3574     my $multi_fetched = fork_for_multisuite(sub {
3575         printdebug "multi clone before fetch merge\n";
3576         changedir $dstdir;
3577     });
3578     if ($multi_fetched) {
3579         printdebug "multi clone after fetch merge\n";
3580         clone_set_head();
3581         clone_finish($dstdir);
3582         return;
3583     }
3584     printdebug "clone main body\n";
3585
3586     canonicalise_suite();
3587     my $hasgit = check_for_git();
3588     mkdir $dstdir or fail "create \`$dstdir': $!";
3589     changedir $dstdir;
3590     runcmd @git, qw(init -q);
3591     setup_new_tree();
3592     clone_set_head();
3593     my $giturl = access_giturl(1);
3594     if (defined $giturl) {
3595         runcmd @git, qw(remote add), 'origin', $giturl;
3596     }
3597     if ($hasgit) {
3598         progress "fetching existing git history";
3599         git_fetch_us();
3600         runcmd_ordryrun_local @git, qw(fetch origin);
3601     } else {
3602         progress "starting new git history";
3603     }
3604     fetch_from_archive() or no_such_package;
3605     my $vcsgiturl = $dsc->{'Vcs-Git'};
3606     if (length $vcsgiturl) {
3607         $vcsgiturl =~ s/\s+-b\s+\S+//g;
3608         runcmd @git, qw(remote add vcs-git), $vcsgiturl;
3609     }
3610     clone_finish($dstdir);
3611 }
3612
3613 sub fetch () {
3614     canonicalise_suite();
3615     if (check_for_git()) {
3616         git_fetch_us();
3617     }
3618     fetch_from_archive() or no_such_package();
3619     printdone "fetched into ".lrref();
3620 }
3621
3622 sub pull () {
3623     my $multi_fetched = fork_for_multisuite(sub { });
3624     fetch() unless $multi_fetched; # parent
3625     return if $multi_fetched eq '0'; # child
3626     runcmd_ordryrun_local @git, qw(merge -m),"Merge from $csuite [dgit]",
3627         lrref();
3628     printdone "fetched to ".lrref()." and merged into HEAD";
3629 }
3630
3631 sub check_not_dirty () {
3632     foreach my $f (qw(local-options local-patch-header)) {
3633         if (stat_exists "debian/source/$f") {
3634             fail "git tree contains debian/source/$f";
3635         }
3636     }
3637
3638     return if $ignoredirty;
3639
3640     my @cmd = (@git, qw(diff --quiet HEAD));
3641     debugcmd "+",@cmd;
3642     $!=0; $?=-1; system @cmd;
3643     return if !$?;
3644     if ($?==256) {
3645         fail "working tree is dirty (does not match HEAD)";
3646     } else {
3647         failedcmd @cmd;
3648     }
3649 }
3650
3651 sub commit_admin ($) {
3652     my ($m) = @_;
3653     progress "$m";
3654     runcmd_ordryrun_local @git, qw(commit -m), $m;
3655 }
3656
3657 sub commit_quilty_patch () {
3658     my $output = cmdoutput @git, qw(status --porcelain);
3659     my %adds;
3660     foreach my $l (split /\n/, $output) {
3661         next unless $l =~ m/\S/;
3662         if ($l =~ m{^(?:\?\?| M) (.pc|debian/patches)}) {
3663             $adds{$1}++;
3664         }
3665     }
3666     delete $adds{'.pc'}; # if there wasn't one before, don't add it
3667     if (!%adds) {
3668         progress "nothing quilty to commit, ok.";
3669         return;
3670     }
3671     my @adds = map { s/[][*?\\]/\\$&/g; $_; } sort keys %adds;
3672     runcmd_ordryrun_local @git, qw(add -f), @adds;
3673     commit_admin <<END
3674 Commit Debian 3.0 (quilt) metadata
3675
3676 [dgit ($our_version) quilt-fixup]
3677 END
3678 }
3679
3680 sub get_source_format () {
3681     my %options;
3682     if (open F, "debian/source/options") {
3683         while (<F>) {
3684             next if m/^\s*\#/;
3685             next unless m/\S/;
3686             s/\s+$//; # ignore missing final newline
3687             if (m/\s*\#\s*/) {
3688                 my ($k, $v) = ($`, $'); #');
3689                 $v =~ s/^"(.*)"$/$1/;
3690                 $options{$k} = $v;
3691             } else {
3692                 $options{$_} = 1;
3693             }
3694         }
3695         F->error and die $!;
3696         close F;
3697     } else {
3698         die $! unless $!==&ENOENT;
3699     }
3700
3701     if (!open F, "debian/source/format") {
3702         die $! unless $!==&ENOENT;
3703         return '';
3704     }
3705     $_ = <F>;
3706     F->error and die $!;
3707     chomp;
3708     return ($_, \%options);
3709 }
3710
3711 sub madformat_wantfixup ($) {
3712     my ($format) = @_;
3713     return 0 unless $format eq '3.0 (quilt)';
3714     our $quilt_mode_warned;
3715     if ($quilt_mode eq 'nocheck') {
3716         progress "Not doing any fixup of \`$format' due to".
3717             " ----no-quilt-fixup or --quilt=nocheck"
3718             unless $quilt_mode_warned++;
3719         return 0;
3720     }
3721     progress "Format \`$format', need to check/update patch stack"
3722         unless $quilt_mode_warned++;
3723     return 1;
3724 }
3725
3726 sub maybe_split_brain_save ($$$) {
3727     my ($headref, $dgitview, $msg) = @_;
3728     # => message fragment "$saved" describing disposition of $dgitview
3729     return "commit id $dgitview" unless defined $split_brain_save;
3730     my @cmd = (shell_cmd "cd ../../../..",
3731                @git, qw(update-ref -m),
3732                "dgit --dgit-view-save $msg HEAD=$headref",
3733                $split_brain_save, $dgitview);
3734     runcmd @cmd;
3735     return "and left in $split_brain_save";
3736 }
3737
3738 # An "infopair" is a tuple [ $thing, $what ]
3739 # (often $thing is a commit hash; $what is a description)
3740
3741 sub infopair_cond_equal ($$) {
3742     my ($x,$y) = @_;
3743     $x->[0] eq $y->[0] or fail <<END;
3744 $x->[1] ($x->[0]) not equal to $y->[1] ($y->[0])
3745 END
3746 };
3747
3748 sub infopair_lrf_tag_lookup ($$) {
3749     my ($tagnames, $what) = @_;
3750     # $tagname may be an array ref
3751     my @tagnames = ref $tagnames ? @$tagnames : ($tagnames);
3752     printdebug "infopair_lrfetchref_tag_lookup $what @tagnames\n";
3753     foreach my $tagname (@tagnames) {
3754         my $lrefname = lrfetchrefs."/tags/$tagname";
3755         my $tagobj = $lrfetchrefs_f{$lrefname};
3756         next unless defined $tagobj;
3757         printdebug "infopair_lrfetchref_tag_lookup $tagobj $tagname $what\n";
3758         return [ git_rev_parse($tagobj), $what ];
3759     }
3760     fail @tagnames==1 ? <<END : <<END;
3761 Wanted tag $what (@tagnames) on dgit server, but not found
3762 END
3763 Wanted tag $what (one of: @tagnames) on dgit server, but not found
3764 END
3765 }
3766
3767 sub infopair_cond_ff ($$) {
3768     my ($anc,$desc) = @_;
3769     is_fast_fwd($anc->[0], $desc->[0]) or fail <<END;
3770 $anc->[1] ($anc->[0]) .. $desc->[1] ($desc->[0]) is not fast forward
3771 END
3772 };
3773
3774 sub pseudomerge_version_check ($$) {
3775     my ($clogp, $archive_hash) = @_;
3776
3777     my $arch_clogp = commit_getclogp $archive_hash;
3778     my $i_arch_v = [ (getfield $arch_clogp, 'Version'),
3779                      'version currently in archive' ];
3780     if (defined $overwrite_version) {
3781         if (length $overwrite_version) {
3782             infopair_cond_equal([ $overwrite_version,
3783                                   '--overwrite= version' ],
3784                                 $i_arch_v);
3785         } else {
3786             my $v = $i_arch_v->[0];
3787             progress "Checking package changelog for archive version $v ...";
3788             my $cd;
3789             eval {
3790                 my @xa = ("-f$v", "-t$v");
3791                 my $vclogp = parsechangelog @xa;
3792                 my $gf = sub {
3793                     my ($fn) = @_;
3794                     [ (getfield $vclogp, $fn),
3795                       "$fn field from dpkg-parsechangelog @xa" ];
3796                 };
3797                 my $cv = $gf->('Version');
3798                 infopair_cond_equal($i_arch_v, $cv);
3799                 $cd = $gf->('Distribution');
3800             };
3801             if ($@) {
3802                 $@ =~ s/^dgit: //gm;
3803                 fail "$@".
3804                     "Perhaps debian/changelog does not mention $v ?";
3805             }
3806             fail <<END if $cd->[0] =~ m/UNRELEASED/;
3807 $cd->[1] is $cd->[0]
3808 Your tree seems to based on earlier (not uploaded) $v.
3809 END
3810         }
3811     }
3812     
3813     printdebug "pseudomerge_version_check i_arch_v @$i_arch_v\n";
3814     return $i_arch_v;
3815 }
3816
3817 sub pseudomerge_make_commit ($$$$ $$) {
3818     my ($clogp, $dgitview, $archive_hash, $i_arch_v,
3819         $msg_cmd, $msg_msg) = @_;
3820     progress "Declaring that HEAD inciudes all changes in $i_arch_v->[0]...";
3821
3822     my $tree = cmdoutput qw(git rev-parse), "${dgitview}:";
3823     my $authline = clogp_authline $clogp;
3824
3825     chomp $msg_msg;
3826     $msg_cmd .=
3827         !defined $overwrite_version ? ""
3828         : !length  $overwrite_version ? " --overwrite"
3829         : " --overwrite=".$overwrite_version;
3830
3831     mkpath '.git/dgit';
3832     my $pmf = ".git/dgit/pseudomerge";
3833     open MC, ">", $pmf or die "$pmf $!";
3834     print MC <<END or die $!;
3835 tree $tree
3836 parent $dgitview
3837 parent $archive_hash
3838 author $authline
3839 committer $authline
3840
3841 $msg_msg
3842
3843 [$msg_cmd]
3844 END
3845     close MC or die $!;
3846
3847     return make_commit($pmf);
3848 }
3849
3850 sub splitbrain_pseudomerge ($$$$) {
3851     my ($clogp, $maintview, $dgitview, $archive_hash) = @_;
3852     # => $merged_dgitview
3853     printdebug "splitbrain_pseudomerge...\n";
3854     #
3855     #     We:      debian/PREVIOUS    HEAD($maintview)
3856     # expect:          o ----------------- o
3857     #                    \                   \
3858     #                     o                   o
3859     #                 a/d/PREVIOUS        $dgitview
3860     #                $archive_hash              \
3861     #  If so,                \                   \
3862     #  we do:                 `------------------ o
3863     #   this:                                   $dgitview'
3864     #
3865
3866     return $dgitview unless defined $archive_hash;
3867     return $dgitview if deliberately_not_fast_forward();
3868
3869     printdebug "splitbrain_pseudomerge...\n";
3870
3871     my $i_arch_v = pseudomerge_version_check($clogp, $archive_hash);
3872
3873     if (!defined $overwrite_version) {
3874         progress "Checking that HEAD inciudes all changes in archive...";
3875     }
3876
3877     return $dgitview if is_fast_fwd $archive_hash, $dgitview;
3878
3879     if (defined $overwrite_version) {
3880     } elsif (!eval {
3881         my $t_dep14 = debiantag_maintview $i_arch_v->[0], access_nomdistro;
3882         my $i_dep14 = infopair_lrf_tag_lookup($t_dep14, "maintainer view tag");
3883         my $t_dgit = debiantag_new $i_arch_v->[0], access_nomdistro;
3884         my $i_dgit = infopair_lrf_tag_lookup($t_dgit, "dgit view tag");
3885         my $i_archive = [ $archive_hash, "current archive contents" ];
3886
3887         printdebug "splitbrain_pseudomerge i_archive @$i_archive\n";
3888
3889         infopair_cond_equal($i_dgit, $i_archive);
3890         infopair_cond_ff($i_dep14, $i_dgit);
3891         infopair_cond_ff($i_dep14, [ $maintview, 'HEAD' ]);
3892         1;
3893     }) {
3894         print STDERR <<END;
3895 $us: check failed (maybe --overwrite is needed, consult documentation)
3896 END
3897         die "$@";
3898     }
3899
3900     my $r = pseudomerge_make_commit
3901         $clogp, $dgitview, $archive_hash, $i_arch_v,
3902         "dgit --quilt=$quilt_mode",
3903         (defined $overwrite_version ? <<END_OVERWR : <<END_MAKEFF);
3904 Declare fast forward from $i_arch_v->[0]
3905 END_OVERWR
3906 Make fast forward from $i_arch_v->[0]
3907 END_MAKEFF
3908
3909     maybe_split_brain_save $maintview, $r, "pseudomerge";
3910
3911     progress "Made pseudo-merge of $i_arch_v->[0] into dgit view.";
3912     return $r;
3913 }       
3914
3915 sub plain_overwrite_pseudomerge ($$$) {
3916     my ($clogp, $head, $archive_hash) = @_;
3917
3918     printdebug "plain_overwrite_pseudomerge...";
3919
3920     my $i_arch_v = pseudomerge_version_check($clogp, $archive_hash);
3921
3922     return $head if is_fast_fwd $archive_hash, $head;
3923
3924     my $m = "Declare fast forward from $i_arch_v->[0]";
3925
3926     my $r = pseudomerge_make_commit
3927         $clogp, $head, $archive_hash, $i_arch_v,
3928         "dgit", $m;
3929
3930     runcmd @git, qw(update-ref -m), $m, 'HEAD', $r, $head;
3931
3932     progress "Make pseudo-merge of $i_arch_v->[0] into your HEAD.";
3933     return $r;
3934 }
3935
3936 sub push_parse_changelog ($) {
3937     my ($clogpfn) = @_;
3938
3939     my $clogp = Dpkg::Control::Hash->new();
3940     $clogp->load($clogpfn) or die;
3941
3942     my $clogpackage = getfield $clogp, 'Source';
3943     $package //= $clogpackage;
3944     fail "-p specified $package but changelog specified $clogpackage"
3945         unless $package eq $clogpackage;
3946     my $cversion = getfield $clogp, 'Version';
3947
3948     if (!$we_are_initiator) {
3949         # rpush initiator can't do this because it doesn't have $isuite yet
3950         my $tag = debiantag($cversion, access_nomdistro);
3951         runcmd @git, qw(check-ref-format), $tag;
3952     }
3953
3954     my $dscfn = dscfn($cversion);
3955
3956     return ($clogp, $cversion, $dscfn);
3957 }
3958
3959 sub push_parse_dsc ($$$) {
3960     my ($dscfn,$dscfnwhat, $cversion) = @_;
3961     $dsc = parsecontrol($dscfn,$dscfnwhat);
3962     my $dversion = getfield $dsc, 'Version';
3963     my $dscpackage = getfield $dsc, 'Source';
3964     ($dscpackage eq $package && $dversion eq $cversion) or
3965         fail "$dscfn is for $dscpackage $dversion".
3966             " but debian/changelog is for $package $cversion";
3967 }
3968
3969 sub push_tagwants ($$$$) {
3970     my ($cversion, $dgithead, $maintviewhead, $tfbase) = @_;
3971     my @tagwants;
3972     push @tagwants, {
3973         TagFn => \&debiantag,
3974         Objid => $dgithead,
3975         TfSuffix => '',
3976         View => 'dgit',
3977     };
3978     if (defined $maintviewhead) {
3979         push @tagwants, {
3980             TagFn => \&debiantag_maintview,
3981             Objid => $maintviewhead,
3982             TfSuffix => '-maintview',
3983             View => 'maint',
3984         };
3985     } elsif ($dodep14tag eq 'no' ? 0
3986              : $dodep14tag eq 'want' ? access_cfg_tagformats_can_splitbrain
3987              : $dodep14tag eq 'always'
3988              ? (access_cfg_tagformats_can_splitbrain or fail <<END)
3989 --dep14tag-always (or equivalent in config) means server must support
3990  both "new" and "maint" tag formats, but config says it doesn't.
3991 END
3992             : die "$dodep14tag ?") {
3993         push @tagwants, {
3994             TagFn => \&debiantag_maintview,
3995             Objid => $dgithead,
3996             TfSuffix => '-dgit',
3997             View => 'dgit',
3998         };
3999     };
4000     foreach my $tw (@tagwants) {
4001         $tw->{Tag} = $tw->{TagFn}($cversion, access_nomdistro);
4002         $tw->{Tfn} = sub { $tfbase.$tw->{TfSuffix}.$_[0]; };
4003     }
4004     printdebug 'push_tagwants: ', Dumper(\@_, \@tagwants);
4005     return @tagwants;
4006 }
4007
4008 sub push_mktags ($$ $$ $) {
4009     my ($clogp,$dscfn,
4010         $changesfile,$changesfilewhat,
4011         $tagwants) = @_;
4012
4013     die unless $tagwants->[0]{View} eq 'dgit';
4014
4015     my $declaredistro = access_nomdistro();
4016     my $reader_giturl = do { local $access_forpush=0; access_giturl(); };
4017     $dsc->{$ourdscfield[0]} = join " ",
4018         $tagwants->[0]{Objid}, $declaredistro, $tagwants->[0]{Tag},
4019         $reader_giturl;
4020     $dsc->save("$dscfn.tmp") or die $!;
4021
4022     my $changes = parsecontrol($changesfile,$changesfilewhat);
4023     foreach my $field (qw(Source Distribution Version)) {
4024         $changes->{$field} eq $clogp->{$field} or
4025             fail "changes field $field \`$changes->{$field}'".
4026                 " does not match changelog \`$clogp->{$field}'";
4027     }
4028
4029     my $cversion = getfield $clogp, 'Version';
4030     my $clogsuite = getfield $clogp, 'Distribution';
4031
4032     # We make the git tag by hand because (a) that makes it easier
4033     # to control the "tagger" (b) we can do remote signing
4034     my $authline = clogp_authline $clogp;
4035     my $delibs = join(" ", "",@deliberatelies);
4036
4037     my $mktag = sub {
4038         my ($tw) = @_;
4039         my $tfn = $tw->{Tfn};
4040         my $head = $tw->{Objid};
4041         my $tag = $tw->{Tag};
4042
4043         open TO, '>', $tfn->('.tmp') or die $!;
4044         print TO <<END or die $!;
4045 object $head
4046 type commit
4047 tag $tag
4048 tagger $authline
4049
4050 END
4051         if ($tw->{View} eq 'dgit') {
4052             print TO <<END or die $!;
4053 $package release $cversion for $clogsuite ($csuite) [dgit]
4054 [dgit distro=$declaredistro$delibs]
4055 END
4056             foreach my $ref (sort keys %previously) {
4057                 print TO <<END or die $!;
4058 [dgit previously:$ref=$previously{$ref}]
4059 END
4060             }
4061         } elsif ($tw->{View} eq 'maint') {
4062             print TO <<END or die $!;
4063 $package release $cversion for $clogsuite ($csuite)
4064 (maintainer view tag generated by dgit --quilt=$quilt_mode)
4065 END
4066         } else {
4067             die Dumper($tw)."?";
4068         }
4069
4070         close TO or die $!;
4071
4072         my $tagobjfn = $tfn->('.tmp');
4073         if ($sign) {
4074             if (!defined $keyid) {
4075                 $keyid = access_cfg('keyid','RETURN-UNDEF');
4076             }
4077             if (!defined $keyid) {
4078                 $keyid = getfield $clogp, 'Maintainer';
4079             }
4080             unlink $tfn->('.tmp.asc') or $!==&ENOENT or die $!;
4081             my @sign_cmd = (@gpg, qw(--detach-sign --armor));
4082             push @sign_cmd, qw(-u),$keyid if defined $keyid;
4083             push @sign_cmd, $tfn->('.tmp');
4084             runcmd_ordryrun @sign_cmd;
4085             if (act_scary()) {
4086                 $tagobjfn = $tfn->('.signed.tmp');
4087                 runcmd shell_cmd "exec >$tagobjfn", qw(cat --),
4088                     $tfn->('.tmp'), $tfn->('.tmp.asc');
4089             }
4090         }
4091         return $tagobjfn;
4092     };
4093
4094     my @r = map { $mktag->($_); } @$tagwants;
4095     return @r;
4096 }
4097
4098 sub sign_changes ($) {
4099     my ($changesfile) = @_;
4100     if ($sign) {
4101         my @debsign_cmd = @debsign;
4102         push @debsign_cmd, "-k$keyid" if defined $keyid;
4103         push @debsign_cmd, "-p$gpg[0]" if $gpg[0] ne 'gpg';
4104         push @debsign_cmd, $changesfile;
4105         runcmd_ordryrun @debsign_cmd;
4106     }
4107 }
4108
4109 sub dopush () {
4110     printdebug "actually entering push\n";
4111
4112     supplementary_message(<<'END');
4113 Push failed, while checking state of the archive.
4114 You can retry the push, after fixing the problem, if you like.
4115 END
4116     if (check_for_git()) {
4117         git_fetch_us();
4118     }
4119     my $archive_hash = fetch_from_archive();
4120     if (!$archive_hash) {
4121         $new_package or
4122             fail "package appears to be new in this suite;".
4123                 " if this is intentional, use --new";
4124     }
4125
4126     supplementary_message(<<'END');
4127 Push failed, while preparing your push.
4128 You can retry the push, after fixing the problem, if you like.
4129 END
4130
4131     need_tagformat 'new', "quilt mode $quilt_mode"
4132         if quiltmode_splitbrain;
4133
4134     prep_ud();
4135
4136     access_giturl(); # check that success is vaguely likely
4137     rpush_handle_protovsn_bothends() if $we_are_initiator;
4138     select_tagformat();
4139
4140     my $clogpfn = ".git/dgit/changelog.822.tmp";
4141     runcmd shell_cmd "exec >$clogpfn", qw(dpkg-parsechangelog);
4142
4143     responder_send_file('parsed-changelog', $clogpfn);
4144
4145     my ($clogp, $cversion, $dscfn) =
4146         push_parse_changelog("$clogpfn");
4147
4148     my $dscpath = "$buildproductsdir/$dscfn";
4149     stat_exists $dscpath or
4150         fail "looked for .dsc $dscpath, but $!;".
4151             " maybe you forgot to build";
4152
4153     responder_send_file('dsc', $dscpath);
4154
4155     push_parse_dsc($dscpath, $dscfn, $cversion);
4156
4157     my $format = getfield $dsc, 'Format';
4158     printdebug "format $format\n";
4159
4160     my $actualhead = git_rev_parse('HEAD');
4161     my $dgithead = $actualhead;
4162     my $maintviewhead = undef;
4163
4164     my $upstreamversion = upstreamversion $clogp->{Version};
4165
4166     if (madformat_wantfixup($format)) {
4167         # user might have not used dgit build, so maybe do this now:
4168         if (quiltmode_splitbrain()) {
4169             changedir $playground;
4170             quilt_make_fake_dsc($upstreamversion);
4171             my $cachekey;
4172             ($dgithead, $cachekey) =
4173                 quilt_check_splitbrain_cache($actualhead, $upstreamversion);
4174             $dgithead or fail
4175  "--quilt=$quilt_mode but no cached dgit view:
4176  perhaps tree changed since dgit build[-source] ?";
4177             $split_brain = 1;
4178             $dgithead = splitbrain_pseudomerge($clogp,
4179                                                $actualhead, $dgithead,
4180                                                $archive_hash);
4181             $maintviewhead = $actualhead;
4182             changedir $maindir;
4183             prep_ud(); # so _only_subdir() works, below
4184         } else {
4185             commit_quilty_patch();
4186         }
4187     }
4188
4189     if (defined $overwrite_version && !defined $maintviewhead) {
4190         $dgithead = plain_overwrite_pseudomerge($clogp,
4191                                                 $dgithead,
4192                                                 $archive_hash);
4193     }
4194
4195     check_not_dirty();
4196
4197     my $forceflag = '';
4198     if ($archive_hash) {
4199         if (is_fast_fwd($archive_hash, $dgithead)) {
4200             # ok
4201         } elsif (deliberately_not_fast_forward) {
4202             $forceflag = '+';
4203         } else {
4204             fail "dgit push: HEAD is not a descendant".
4205                 " of the archive's version.\n".
4206                 "To overwrite the archive's contents,".
4207                 " pass --overwrite[=VERSION].\n".
4208                 "To rewind history, if permitted by the archive,".
4209                 " use --deliberately-not-fast-forward.";
4210         }
4211     }
4212
4213     changedir $playground;
4214     progress "checking that $dscfn corresponds to HEAD";
4215     runcmd qw(dpkg-source -x --),
4216         $dscpath =~ m#^/# ? $dscpath : "../../../$dscpath";
4217     my ($tree,$dir) = mktree_in_ud_from_only_subdir("source package");
4218     check_for_vendor_patches() if madformat($dsc->{format});
4219     changedir $maindir;
4220     my @diffcmd = (@git, qw(diff --quiet), $tree, $dgithead);
4221     debugcmd "+",@diffcmd;
4222     $!=0; $?=-1;
4223     my $r = system @diffcmd;
4224     if ($r) {
4225         if ($r==256) {
4226             my $diffs = cmdoutput @git, qw(diff --stat), $tree, $dgithead;
4227             fail <<END
4228 HEAD specifies a different tree to $dscfn:
4229 $diffs
4230 Perhaps you forgot to build.  Or perhaps there is a problem with your
4231  source tree (see dgit(7) for some hints).  To see a full diff, run
4232    git diff $tree HEAD
4233 END
4234         } else {
4235             failedcmd @diffcmd;
4236         }
4237     }
4238     if (!$changesfile) {
4239         my $pat = changespat $cversion;
4240         my @cs = glob "$buildproductsdir/$pat";
4241         fail "failed to find unique changes file".
4242             " (looked for $pat in $buildproductsdir);".
4243             " perhaps you need to use dgit -C"
4244             unless @cs==1;
4245         ($changesfile) = @cs;
4246     } else {
4247         $changesfile = "$buildproductsdir/$changesfile";
4248     }
4249
4250     # Check that changes and .dsc agree enough
4251     $changesfile =~ m{[^/]*$};
4252     my $changes = parsecontrol($changesfile,$&);
4253     files_compare_inputs($dsc, $changes)
4254         unless forceing [qw(dsc-changes-mismatch)];
4255
4256     # Perhaps adjust .dsc to contain right set of origs
4257     changes_update_origs_from_dsc($dsc, $changes, $upstreamversion,
4258                                   $changesfile)
4259         unless forceing [qw(changes-origs-exactly)];
4260
4261     # Checks complete, we're going to try and go ahead:
4262
4263     responder_send_file('changes',$changesfile);
4264     responder_send_command("param head $dgithead");
4265     responder_send_command("param csuite $csuite");
4266     responder_send_command("param isuite $isuite");
4267     responder_send_command("param tagformat $tagformat");
4268     if (defined $maintviewhead) {
4269         die unless ($protovsn//4) >= 4;
4270         responder_send_command("param maint-view $maintviewhead");
4271     }
4272
4273     # Perhaps send buildinfo(s) for signing
4274     my $changes_files = getfield $changes, 'Files';
4275     my @buildinfos = ($changes_files =~ m/ .* (\S+\.buildinfo)$/mg);
4276     foreach my $bi (@buildinfos) {
4277         responder_send_command("param buildinfo-filename $bi");
4278         responder_send_file('buildinfo', "$buildproductsdir/$bi");
4279     }
4280
4281     if (deliberately_not_fast_forward) {
4282         git_for_each_ref(lrfetchrefs, sub {
4283             my ($objid,$objtype,$lrfetchrefname,$reftail) = @_;
4284             my $rrefname= substr($lrfetchrefname, length(lrfetchrefs) + 1);
4285             responder_send_command("previously $rrefname=$objid");
4286             $previously{$rrefname} = $objid;
4287         });
4288     }
4289
4290     my @tagwants = push_tagwants($cversion, $dgithead, $maintviewhead,
4291                                  ".git/dgit/tag");
4292     my @tagobjfns;
4293
4294     supplementary_message(<<'END');
4295 Push failed, while signing the tag.
4296 You can retry the push, after fixing the problem, if you like.
4297 END
4298     # If we manage to sign but fail to record it anywhere, it's fine.
4299     if ($we_are_responder) {
4300         @tagobjfns = map { $_->{Tfn}('.signed-tmp') } @tagwants;
4301         responder_receive_files('signed-tag', @tagobjfns);
4302     } else {
4303         @tagobjfns = push_mktags($clogp,$dscpath,
4304                               $changesfile,$changesfile,
4305                               \@tagwants);
4306     }
4307     supplementary_message(<<'END');
4308 Push failed, *after* signing the tag.
4309 If you want to try again, you should use a new version number.
4310 END
4311
4312     pairwise { $a->{TagObjFn} = $b } @tagwants, @tagobjfns;
4313
4314     foreach my $tw (@tagwants) {
4315         my $tag = $tw->{Tag};
4316         my $tagobjfn = $tw->{TagObjFn};
4317         my $tag_obj_hash =
4318             cmdoutput @git, qw(hash-object -w -t tag), $tagobjfn;
4319         runcmd_ordryrun @git, qw(verify-tag), $tag_obj_hash;
4320         runcmd_ordryrun_local
4321             @git, qw(update-ref), "refs/tags/$tag", $tag_obj_hash;
4322     }
4323
4324     supplementary_message(<<'END');
4325 Push failed, while updating the remote git repository - see messages above.
4326 If you want to try again, you should use a new version number.
4327 END
4328     if (!check_for_git()) {
4329         create_remote_git_repo();
4330     }
4331
4332     my @pushrefs = $forceflag.$dgithead.":".rrref();
4333     foreach my $tw (@tagwants) {
4334         push @pushrefs, $forceflag."refs/tags/$tw->{Tag}";
4335     }
4336
4337     runcmd_ordryrun @git,
4338         qw(-c push.followTags=false push), access_giturl(), @pushrefs;
4339     runcmd_ordryrun @git, qw(update-ref -m), 'dgit push', lrref(), $dgithead;
4340
4341     supplementary_message(<<'END');
4342 Push failed, while obtaining signatures on the .changes and .dsc.
4343 If it was just that the signature failed, you may try again by using
4344 debsign by hand to sign the changes
4345    $changesfile
4346 and then dput to complete the upload.
4347 If you need to change the package, you must use a new version number.
4348 END
4349     if ($we_are_responder) {
4350         my $dryrunsuffix = act_local() ? "" : ".tmp";
4351         my @rfiles = ($dscpath, $changesfile);
4352         push @rfiles, map { "$buildproductsdir/$_" } @buildinfos;
4353         responder_receive_files('signed-dsc-changes',
4354                                 map { "$_$dryrunsuffix" } @rfiles);
4355     } else {
4356         if (act_local()) {
4357             rename "$dscpath.tmp",$dscpath or die "$dscfn $!";
4358         } else {
4359             progress "[new .dsc left in $dscpath.tmp]";
4360         }
4361         sign_changes $changesfile;
4362     }
4363
4364     supplementary_message(<<END);
4365 Push failed, while uploading package(s) to the archive server.
4366 You can retry the upload of exactly these same files with dput of:
4367   $changesfile
4368 If that .changes file is broken, you will need to use a new version
4369 number for your next attempt at the upload.
4370 END
4371     my $host = access_cfg('upload-host','RETURN-UNDEF');
4372     my @hostarg = defined($host) ? ($host,) : ();
4373     runcmd_ordryrun @dput, @hostarg, $changesfile;
4374     printdone "pushed and uploaded $cversion";
4375
4376     supplementary_message('');
4377     responder_send_command("complete");
4378 }
4379
4380 sub pre_clone () {
4381     not_necessarily_a_tree();
4382 }