chiark / gitweb /
dgit: clean: Change matcbing of git to regexps
[dgit.git] / dgit
1 #!/usr/bin/perl -w
2 # dgit
3 # Integration between git and Debian-style archives
4 #
5 # Copyright (C)2013-2018 Ian Jackson
6 # Copyright (C)2017-2018 Sean Whitton
7 #
8 # This program is free software: you can redistribute it and/or modify
9 # it under the terms of the GNU General Public License as published by
10 # the Free Software Foundation, either version 3 of the License, or
11 # (at your option) any later version.
12 #
13 # This program is distributed in the hope that it will be useful,
14 # but WITHOUT ANY WARRANTY; without even the implied warranty of
15 # MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
16 # GNU General Public License for more details.
17 #
18 # You should have received a copy of the GNU General Public License
19 # along with this program.  If not, see <http://www.gnu.org/licenses/>.
20
21 END { $? = $Debian::Dgit::ExitStatus::desired // -1; };
22 use Debian::Dgit::ExitStatus;
23 use Debian::Dgit::I18n;
24
25 use strict;
26
27 use Debian::Dgit qw(:DEFAULT :playground);
28 setup_sigwarn();
29
30 use IO::Handle;
31 use Data::Dumper;
32 use LWP::UserAgent;
33 use Dpkg::Control::Hash;
34 use File::Path;
35 use File::Temp qw(tempdir);
36 use File::Basename;
37 use Dpkg::Version;
38 use Dpkg::Compression;
39 use Dpkg::Compression::Process;
40 use POSIX;
41 use Locale::gettext;
42 use IPC::Open2;
43 use Digest::SHA;
44 use Digest::MD5;
45 use List::MoreUtils qw(pairwise);
46 use Text::Glob qw(match_glob);
47 use Fcntl qw(:DEFAULT :flock);
48 use Carp;
49
50 use Debian::Dgit;
51
52 our $our_version = 'UNRELEASED'; ###substituted###
53 our $absurdity = undef; ###substituted###
54
55 our @rpushprotovsn_support = qw(4 3 2); # 4 is new tag format
56 our $protovsn;
57
58 our $cmd;
59 our $subcommand;
60 our $isuite;
61 our $idistro;
62 our $package;
63 our @ropts;
64
65 our $sign = 1;
66 our $dryrun_level = 0;
67 our $changesfile;
68 our $buildproductsdir;
69 our $bpd_glob;
70 our $new_package = 0;
71 our $includedirty = 0;
72 our $rmonerror = 1;
73 our @deliberatelies;
74 our %previously;
75 our $existing_package = 'dpkg';
76 our $cleanmode;
77 our $changes_since_version;
78 our $rmchanges;
79 our $overwrite_version; # undef: not specified; '': check changelog
80 our $quilt_mode;
81 our $quilt_modes_re = 'linear|smash|auto|nofix|nocheck|gbp|dpm|unapplied';
82 our $dodep14tag;
83 our %internal_object_save;
84 our $we_are_responder;
85 our $we_are_initiator;
86 our $initiator_tempdir;
87 our $patches_applied_dirtily = 00;
88 our $tagformat_want;
89 our $tagformat;
90 our $tagformatfn;
91 our $chase_dsc_distro=1;
92
93 our %forceopts = map { $_=>0 }
94     qw(unrepresentable unsupported-source-format
95        dsc-changes-mismatch changes-origs-exactly
96        uploading-binaries uploading-source-only
97        import-gitapply-absurd
98        import-gitapply-no-absurd
99        import-dsc-with-dgit-field);
100
101 our %format_ok = map { $_=>1 } ("1.0","3.0 (native)","3.0 (quilt)");
102
103 our $suite_re = '[-+.0-9a-z]+';
104 our $cleanmode_re = qr{(?: dpkg-source (?: -d )? (?: ,no-check | ,all-check )?
105                          | git | git-ff
106                          | check (?: ,ignores )?
107                          | none
108                          )}x;
109
110 our $git_authline_re = '^([^<>]+) \<(\S+)\> (\d+ [-+]\d+)$';
111 our $splitbraincache = 'dgit-intern/quilt-cache';
112 our $rewritemap = 'dgit-rewrite/map';
113
114 our @dpkg_source_ignores = qw(-i(?:^|/)\.git(?:/|$) -I.git);
115
116 our (@git) = qw(git);
117 our (@dget) = qw(dget);
118 our (@curl) = (qw(curl --proto-redir), '-all,http,https', qw(-L));
119 our (@dput) = qw(dput);
120 our (@debsign) = qw(debsign);
121 our (@gpg) = qw(gpg);
122 our (@sbuild) = (qw(sbuild --no-source));
123 our (@ssh) = 'ssh';
124 our (@dgit) = qw(dgit);
125 our (@git_debrebase) = qw(git-debrebase);
126 our (@aptget) = qw(apt-get);
127 our (@aptcache) = qw(apt-cache);
128 our (@dpkgbuildpackage) = (qw(dpkg-buildpackage), @dpkg_source_ignores);
129 our (@dpkgsource) = (qw(dpkg-source), @dpkg_source_ignores);
130 our (@dpkggenchanges) = qw(dpkg-genchanges);
131 our (@mergechanges) = qw(mergechanges -f);
132 our (@gbp_build) = ('');
133 our (@gbp_pq) = ('gbp pq');
134 our (@changesopts) = ('');
135 our (@pbuilder) = ("sudo -E pbuilder","--no-source-only-changes");
136 our (@cowbuilder) = ("sudo -E cowbuilder","--no-source-only-changes");
137
138 our %opts_opt_map = ('dget' => \@dget, # accept for compatibility
139                      'curl' => \@curl,
140                      'dput' => \@dput,
141                      'debsign' => \@debsign,
142                      'gpg' => \@gpg,
143                      'sbuild' => \@sbuild,
144                      'ssh' => \@ssh,
145                      'dgit' => \@dgit,
146                      'git' => \@git,
147                      'git-debrebase' => \@git_debrebase,
148                      'apt-get' => \@aptget,
149                      'apt-cache' => \@aptcache,
150                      'dpkg-source' => \@dpkgsource,
151                      'dpkg-buildpackage' => \@dpkgbuildpackage,
152                      'dpkg-genchanges' => \@dpkggenchanges,
153                      'gbp-build' => \@gbp_build,
154                      'gbp-pq' => \@gbp_pq,
155                      'ch' => \@changesopts,
156                      'mergechanges' => \@mergechanges,
157                      'pbuilder' => \@pbuilder,
158                      'cowbuilder' => \@cowbuilder);
159
160 our %opts_opt_cmdonly = ('gpg' => 1, 'git' => 1);
161 our %opts_cfg_insertpos = map {
162     $_,
163     scalar @{ $opts_opt_map{$_} }
164 } keys %opts_opt_map;
165
166 sub parseopts_late_defaults();
167 sub setup_gitattrs(;$);
168 sub check_gitattrs($$);
169
170 our $playground;
171 our $keyid;
172
173 autoflush STDOUT 1;
174
175 our $supplementary_message = '';
176 our $split_brain = 0;
177
178 END {
179     local ($@, $?);
180     return unless forkcheck_mainprocess();
181     print STDERR "! $_\n" foreach $supplementary_message =~ m/^.+$/mg;
182 }
183
184 our $remotename = 'dgit';
185 our @ourdscfield = qw(Dgit Vcs-Dgit-Master);
186 our $csuite;
187 our $instead_distro;
188
189 if (!defined $absurdity) {
190     $absurdity = $0;
191     $absurdity =~ s{/[^/]+$}{/absurd} or die;
192 }
193
194 sub debiantag ($$) {
195     my ($v,$distro) = @_;
196     return $tagformatfn->($v, $distro);
197 }
198
199 sub madformat ($) { $_[0] eq '3.0 (quilt)' }
200
201 sub lbranch () { return "$branchprefix/$csuite"; }
202 my $lbranch_re = '^refs/heads/'.$branchprefix.'/([^/.]+)$';
203 sub lref () { return "refs/heads/".lbranch(); }
204 sub lrref () { return "refs/remotes/$remotename/".server_branch($csuite); }
205 sub rrref () { return server_ref($csuite); }
206
207 sub srcfn ($$) {
208     my ($vsn, $sfx) = @_;
209     return &source_file_leafname($package, $vsn, $sfx);
210 }
211 sub is_orig_file_of_vsn ($$) {
212     my ($f, $upstreamvsn) = @_;
213     return is_orig_file_of_p_v($f, $package, $upstreamvsn);
214 }
215
216 sub dscfn ($) {
217     my ($vsn) = @_;
218     return srcfn($vsn,".dsc");
219 }
220
221 sub changespat ($;$) {
222     my ($vsn, $arch) = @_;
223     return "${package}_".(stripepoch $vsn)."_".($arch//'*').".changes";
224 }
225
226 our $us = 'dgit';
227 initdebug('');
228
229 our @end;
230 END { 
231     local ($?);
232     return unless forkcheck_mainprocess();
233     foreach my $f (@end) {
234         eval { $f->(); };
235         print STDERR "$us: cleanup: $@" if length $@;
236     }
237 };
238
239 sub badcfg {
240     print STDERR f_ "%s: invalid configuration: %s\n", $us, "@_";
241     finish 12;
242 }
243
244 sub forceable_fail ($$) {
245     my ($forceoptsl, $msg) = @_;
246     fail $msg unless grep { $forceopts{$_} } @$forceoptsl;
247     print STDERR +(__ "warning: overriding problem due to --force:\n"). $msg;
248 }
249
250 sub forceing ($) {
251     my ($forceoptsl) = @_;
252     my @got = grep { $forceopts{$_} } @$forceoptsl;
253     return 0 unless @got;
254     print STDERR f_
255         "warning: skipping checks or functionality due to --force-%s\n",
256         $got[0];
257 }
258
259 sub no_such_package () {
260     print STDERR f_ "%s: package %s does not exist in suite %s\n",
261         $us, $package, $isuite;
262     finish 4;
263 }
264
265 sub deliberately ($) {
266     my ($enquiry) = @_;
267     return !!grep { $_ eq "--deliberately-$enquiry" } @deliberatelies;
268 }
269
270 sub deliberately_not_fast_forward () {
271     foreach (qw(not-fast-forward fresh-repo)) {
272         return 1 if deliberately($_) || deliberately("TEST-dgit-only-$_");
273     }
274 }
275
276 sub quiltmode_splitbrain () {
277     $quilt_mode =~ m/gbp|dpm|unapplied/;
278 }
279
280 sub opts_opt_multi_cmd {
281     my $extra = shift;
282     my @cmd;
283     push @cmd, split /\s+/, shift @_;
284     push @cmd, @$extra;
285     push @cmd, @_;
286     @cmd;
287 }
288
289 sub gbp_pq {
290     return opts_opt_multi_cmd [], @gbp_pq;
291 }
292
293 sub dgit_privdir () {
294     our $dgit_privdir_made //= ensure_a_playground 'dgit';
295 }
296
297 sub bpd_abs () {
298     my $r = $buildproductsdir;
299     $r = "$maindir/$r" unless $r =~ m{^/};
300     return $r;
301 }
302
303 sub get_tree_of_commit ($) {
304     my ($commitish) = @_;
305     my $cdata = cmdoutput @git, qw(cat-file commit), $commitish;
306     $cdata =~ m/\n\n/;  $cdata = $`;
307     $cdata =~ m/^tree (\w+)$/m or confess "cdata $cdata ?";
308     return $1;
309 }
310
311 sub branch_gdr_info ($$) {
312     my ($symref, $head) = @_;
313     my ($status, $msg, $current, $ffq_prev, $gdrlast) =
314         gdr_ffq_prev_branchinfo($symref);
315     return () unless $status eq 'branch';
316     $ffq_prev = git_get_ref $ffq_prev;
317     $gdrlast  = git_get_ref $gdrlast;
318     $gdrlast &&= is_fast_fwd $gdrlast, $head;
319     return ($ffq_prev, $gdrlast);
320 }
321
322 sub branch_is_gdr_unstitched_ff ($$$) {
323     my ($symref, $head, $ancestor) = @_;
324     my ($ffq_prev, $gdrlast) = branch_gdr_info($symref, $head);
325     return 0 unless $ffq_prev;
326     return 0 unless !defined $ancestor or is_fast_fwd $ancestor, $ffq_prev;
327     return 1;
328 }
329
330 sub branch_is_gdr ($) {
331     my ($head) = @_;
332     # This is quite like git-debrebase's keycommits.
333     # We have our own implementation because:
334     #  - our algorighm can do fewer tests so is faster
335     #  - it saves testing to see if gdr is installed
336
337     # NB we use this jsut for deciding whether to run gdr make-patches
338     # Before reusing this algorithm for somthing else, its
339     # suitability should be reconsidered.
340
341     my $walk = $head;
342     local $Debian::Dgit::debugcmd_when_debuglevel = 3;
343     printdebug "branch_is_gdr $head...\n";
344     my $get_patches = sub {
345         my $t = git_cat_file "$_[0]:debian/patches", [qw(missing tree)];
346         return $t // '';
347     };
348     my $tip_patches = $get_patches->($head);
349   WALK:
350     for (;;) {
351         my $cdata = git_cat_file $walk, 'commit';
352         my ($hdrs,$msg) = $cdata =~ m{\n\n} ? ($`,$') : ($cdata,'');
353         if ($msg =~ m{^\[git-debrebase\ (
354                           anchor | changelog | make-patches | 
355                           merged-breakwater | pseudomerge
356                       ) [: ] }mx) {
357             # no need to analyse this - it's sufficient
358             # (gdr classifications: Anchor, MergedBreakwaters)
359             # (made by gdr: Pseudomerge, Changelog)
360             printdebug "branch_is_gdr  $walk gdr $1 YES\n";
361             return 1;
362         }
363         my @parents = ($hdrs =~ m/^parent (\w+)$/gm);
364         if (@parents==2) {
365             my $walk_tree = get_tree_of_commit $walk;
366             foreach my $p (@parents) {
367                 my $p_tree = get_tree_of_commit $p;
368                 if ($p_tree eq $walk_tree) { # pseudomerge contriburor
369                     # (gdr classification: Pseudomerge; not made by gdr)
370                     printdebug "branch_is_gdr  $walk unmarked pseudomerge\n"
371                         if $debuglevel >= 2;
372                     $walk = $p;
373                     next WALK;
374                 }
375             }
376             # some other non-gdr merge
377             # (gdr classification: VanillaMerge, DgitImportUnpatched, ?)
378             printdebug "branch_is_gdr  $walk ?-2-merge NO\n";
379             return 0;
380         }
381         if (@parents>2) {
382             # (gdr classification: ?)
383             printdebug "branch_is_gdr  $walk ?-octopus NO\n";
384             return 0;
385         }
386         if (!@parents) {
387             printdebug "branch_is_gdr  $walk origin\n";
388             return 0;
389         }
390         if ($get_patches->($walk) ne $tip_patches) {
391             # Our parent added, removed, or edited patches, and wasn't
392             # a gdr make-patches commit.  gdr make-patches probably
393             # won't do that well, then.
394             # (gdr classification of parent: AddPatches or ?)
395             printdebug "branch_is_gdr  $walk ?-patches NO\n";
396             return 0;
397         }
398         if ($tip_patches eq '' and
399             !defined git_cat_file "$walk:debian") {
400             # (gdr classification of parent: BreakwaterStart
401             printdebug "branch_is_gdr  $walk unmarked BreakwaterStart YES\n";
402             return 1;
403         }
404         # (gdr classification: Upstream Packaging Mixed Changelog)
405         printdebug "branch_is_gdr  $walk plain\n"
406             if $debuglevel >= 2;
407         $walk = $parents[0];
408     }
409 }
410
411 #---------- remote protocol support, common ----------
412
413 # remote push initiator/responder protocol:
414 #  $ dgit remote-push-build-host <n-rargs> <rargs>... <push-args>...
415 #  where <rargs> is <push-host-dir> <supported-proto-vsn>,... ...
416 #  < dgit-remote-push-ready <actual-proto-vsn>
417 #
418 # occasionally:
419 #
420 #  > progress NBYTES
421 #  [NBYTES message]
422 #
423 #  > supplementary-message NBYTES          # $protovsn >= 3
424 #  [NBYTES message]
425 #
426 # main sequence:
427 #
428 #  > file parsed-changelog
429 #  [indicates that output of dpkg-parsechangelog follows]
430 #  > data-block NBYTES
431 #  > [NBYTES bytes of data (no newline)]
432 #  [maybe some more blocks]
433 #  > data-end
434 #
435 #  > file dsc
436 #  [etc]
437 #
438 #  > file changes
439 #  [etc]
440 #
441 #  > param head DGIT-VIEW-HEAD
442 #  > param csuite SUITE
443 #  > param tagformat old|new
444 #  > param maint-view MAINT-VIEW-HEAD
445 #
446 #  > param buildinfo-filename P_V_X.buildinfo   # zero or more times
447 #  > file buildinfo                             # for buildinfos to sign
448 #
449 #  > previously REFNAME=OBJNAME       # if --deliberately-not-fast-forward
450 #                                     # goes into tag, for replay prevention
451 #
452 #  > want signed-tag
453 #  [indicates that signed tag is wanted]
454 #  < data-block NBYTES
455 #  < [NBYTES bytes of data (no newline)]
456 #  [maybe some more blocks]
457 #  < data-end
458 #  < files-end
459 #
460 #  > want signed-dsc-changes
461 #  < data-block NBYTES    [transfer of signed dsc]
462 #  [etc]
463 #  < data-block NBYTES    [transfer of signed changes]
464 #  [etc]
465 #  < data-block NBYTES    [transfer of each signed buildinfo
466 #  [etc]                   same number and order as "file buildinfo"]
467 #  ...
468 #  < files-end
469 #
470 #  > complete
471
472 our $i_child_pid;
473
474 sub i_child_report () {
475     # Sees if our child has died, and reap it if so.  Returns a string
476     # describing how it died if it failed, or undef otherwise.
477     return undef unless $i_child_pid;
478     my $got = waitpid $i_child_pid, WNOHANG;
479     return undef if $got <= 0;
480     die unless $got == $i_child_pid;
481     $i_child_pid = undef;
482     return undef unless $?;
483     return f_ "build host child %s", waitstatusmsg();
484 }
485
486 sub badproto ($$) {
487     my ($fh, $m) = @_;
488     fail f_ "connection lost: %s", $! if $fh->error;
489     fail f_ "protocol violation; %s not expected", $m;
490 }
491
492 sub badproto_badread ($$) {
493     my ($fh, $wh) = @_;
494     fail f_ "connection lost: %s", $! if $!;
495     my $report = i_child_report();
496     fail $report if defined $report;
497     badproto $fh, f_ "eof (reading %s)", $wh;
498 }
499
500 sub protocol_expect (&$) {
501     my ($match, $fh) = @_;
502     local $_;
503     $_ = <$fh>;
504     defined && chomp or badproto_badread $fh, __ "protocol message";
505     if (wantarray) {
506         my @r = &$match;
507         return @r if @r;
508     } else {
509         my $r = &$match;
510         return $r if $r;
511     }
512     badproto $fh, f_ "\`%s'", $_;
513 }
514
515 sub protocol_send_file ($$) {
516     my ($fh, $ourfn) = @_;
517     open PF, "<", $ourfn or die "$ourfn: $!";
518     for (;;) {
519         my $d;
520         my $got = read PF, $d, 65536;
521         die "$ourfn: $!" unless defined $got;
522         last if !$got;
523         print $fh "data-block ".length($d)."\n" or confess $!;
524         print $fh $d or confess $!;
525     }
526     PF->error and die "$ourfn $!";
527     print $fh "data-end\n" or confess $!;
528     close PF;
529 }
530
531 sub protocol_read_bytes ($$) {
532     my ($fh, $nbytes) = @_;
533     $nbytes =~ m/^[1-9]\d{0,5}$|^0$/ or badproto \*RO, __ "bad byte count";
534     my $d;
535     my $got = read $fh, $d, $nbytes;
536     $got==$nbytes or badproto_badread $fh, __ "data block";
537     return $d;
538 }
539
540 sub protocol_receive_file ($$) {
541     my ($fh, $ourfn) = @_;
542     printdebug "() $ourfn\n";
543     open PF, ">", $ourfn or die "$ourfn: $!";
544     for (;;) {
545         my ($y,$l) = protocol_expect {
546             m/^data-block (.*)$/ ? (1,$1) :
547             m/^data-end$/ ? (0,) :
548             ();
549         } $fh;
550         last unless $y;
551         my $d = protocol_read_bytes $fh, $l;
552         print PF $d or confess $!;
553     }
554     close PF or confess $!;
555 }
556
557 #---------- remote protocol support, responder ----------
558
559 sub responder_send_command ($) {
560     my ($command) = @_;
561     return unless $we_are_responder;
562     # called even without $we_are_responder
563     printdebug ">> $command\n";
564     print PO $command, "\n" or confess $!;
565 }    
566
567 sub responder_send_file ($$) {
568     my ($keyword, $ourfn) = @_;
569     return unless $we_are_responder;
570     printdebug "]] $keyword $ourfn\n";
571     responder_send_command "file $keyword";
572     protocol_send_file \*PO, $ourfn;
573 }
574
575 sub responder_receive_files ($@) {
576     my ($keyword, @ourfns) = @_;
577     die unless $we_are_responder;
578     printdebug "[[ $keyword @ourfns\n";
579     responder_send_command "want $keyword";
580     foreach my $fn (@ourfns) {
581         protocol_receive_file \*PI, $fn;
582     }
583     printdebug "[[\$\n";
584     protocol_expect { m/^files-end$/ } \*PI;
585 }
586
587 #---------- remote protocol support, initiator ----------
588
589 sub initiator_expect (&) {
590     my ($match) = @_;
591     protocol_expect { &$match } \*RO;
592 }
593
594 #---------- end remote code ----------
595
596 sub progress {
597     if ($we_are_responder) {
598         my $m = join '', @_;
599         responder_send_command "progress ".length($m) or confess $!;
600         print PO $m or confess $!;
601     } else {
602         print @_, "\n";
603     }
604 }
605
606 our $ua;
607
608 sub url_get {
609     if (!$ua) {
610         $ua = LWP::UserAgent->new();
611         $ua->env_proxy;
612     }
613     my $what = $_[$#_];
614     progress "downloading $what...";
615     my $r = $ua->get(@_) or confess $!;
616     return undef if $r->code == 404;
617     $r->is_success or fail f_ "failed to fetch %s: %s",
618         $what, $r->status_line;
619     return $r->decoded_content(charset => 'none');
620 }
621
622 our ($dscdata,$dscurl,$dsc,$dsc_checked,$skew_warning_vsn);
623
624 sub act_local () { return $dryrun_level <= 1; }
625 sub act_scary () { return !$dryrun_level; }
626
627 sub printdone {
628     if (!$dryrun_level) {
629         progress f_ "%s ok: %s", $us, "@_";
630     } else {
631         progress f_ "would be ok: %s (but dry run only)", "@_";
632     }
633 }
634
635 sub dryrun_report {
636     printcmd(\*STDERR,$debugprefix."#",@_);
637 }
638
639 sub runcmd_ordryrun {
640     if (act_scary()) {
641         runcmd @_;
642     } else {
643         dryrun_report @_;
644     }
645 }
646
647 sub runcmd_ordryrun_local {
648     if (act_local()) {
649         runcmd @_;
650     } else {
651         dryrun_report @_;
652     }
653 }
654
655 our $helpmsg = i_ <<END;
656 main usages:
657   dgit [dgit-opts] clone [dgit-opts] package [suite] [./dir|/dir]
658   dgit [dgit-opts] fetch|pull [dgit-opts] [suite]
659   dgit [dgit-opts] build [dpkg-buildpackage-opts]
660   dgit [dgit-opts] sbuild [sbuild-opts]
661   dgit [dgit-opts] pbuilder|cowbuilder [debbuildopts]
662   dgit [dgit-opts] push [dgit-opts] [suite]
663   dgit [dgit-opts] push-source [dgit-opts] [suite]
664   dgit [dgit-opts] rpush build-host:build-dir ...
665 important dgit options:
666   -k<keyid>           sign tag and package with <keyid> instead of default
667   --dry-run -n        do not change anything, but go through the motions
668   --damp-run -L       like --dry-run but make local changes, without signing
669   --new -N            allow introducing a new package
670   --debug -D          increase debug level
671   -c<name>=<value>    set git config option (used directly by dgit too)
672 END
673
674 our $later_warning_msg = i_ <<END;
675 Perhaps the upload is stuck in incoming.  Using the version from git.
676 END
677
678 sub badusage {
679     print STDERR f_ "%s: %s\n%s", $us, "@_", __ $helpmsg or confess $!;
680     finish 8;
681 }
682
683 sub nextarg {
684     @ARGV or badusage __ "too few arguments";
685     return scalar shift @ARGV;
686 }
687
688 sub pre_help () {
689     not_necessarily_a_tree();
690 }
691 sub cmd_help () {
692     print __ $helpmsg or confess $!;
693     finish 0;
694 }
695
696 our $td = $ENV{DGIT_TEST_DUMMY_DIR} || "DGIT_TEST_DUMMY_DIR-unset";
697
698 our %defcfg = ('dgit.default.distro' => 'debian',
699                'dgit.default.default-suite' => 'unstable',
700                'dgit.default.old-dsc-distro' => 'debian',
701                'dgit-suite.*-security.distro' => 'debian-security',
702                'dgit.default.username' => '',
703                'dgit.default.archive-query-default-component' => 'main',
704                'dgit.default.ssh' => 'ssh',
705                'dgit.default.archive-query' => 'madison:',
706                'dgit.default.sshpsql-dbname' => 'service=projectb',
707                'dgit.default.aptget-components' => 'main',
708                'dgit.default.dgit-tag-format' => 'new,old,maint',
709                'dgit.default.source-only-uploads' => 'ok',
710                'dgit.dsc-url-proto-ok.http'    => 'true',
711                'dgit.dsc-url-proto-ok.https'   => 'true',
712                'dgit.dsc-url-proto-ok.git'     => 'true',
713                'dgit.vcs-git.suites',          => 'sid', # ;-separated
714                'dgit.default.dsc-url-proto-ok' => 'false',
715                # old means "repo server accepts pushes with old dgit tags"
716                # new means "repo server accepts pushes with new dgit tags"
717                # maint means "repo server accepts split brain pushes"
718                # hist means "repo server may have old pushes without new tag"
719                #   ("hist" is implied by "old")
720                'dgit-distro.debian.archive-query' => 'ftpmasterapi:',
721                'dgit-distro.debian.git-check' => 'url',
722                'dgit-distro.debian.git-check-suffix' => '/info/refs',
723                'dgit-distro.debian.new-private-pushers' => 't',
724                'dgit-distro.debian.source-only-uploads' => 'not-wholly-new',
725                'dgit-distro.debian/push.git-url' => '',
726                'dgit-distro.debian/push.git-host' => 'push.dgit.debian.org',
727                'dgit-distro.debian/push.git-user-force' => 'dgit',
728                'dgit-distro.debian/push.git-proto' => 'git+ssh://',
729                'dgit-distro.debian/push.git-path' => '/dgit/debian/repos',
730                'dgit-distro.debian/push.git-create' => 'true',
731                'dgit-distro.debian/push.git-check' => 'ssh-cmd',
732  'dgit-distro.debian.archive-query-url', 'https://api.ftp-master.debian.org/',
733 # 'dgit-distro.debian.archive-query-tls-key',
734 #    '/etc/ssl/certs/%HOST%.pem:/etc/dgit/%HOST%.pem',
735 # ^ this does not work because curl is broken nowadays
736 # Fixing #790093 properly will involve providing providing the key
737 # in some pacagke and maybe updating these paths.
738 #
739 # 'dgit-distro.debian.archive-query-tls-curl-args',
740 #   '--ca-path=/etc/ssl/ca-debian',
741 # ^ this is a workaround but works (only) on DSA-administered machines
742                'dgit-distro.debian.git-url' => 'https://git.dgit.debian.org',
743                'dgit-distro.debian.git-url-suffix' => '',
744                'dgit-distro.debian.upload-host' => 'ftp-master', # for dput
745                'dgit-distro.debian.mirror' => 'http://ftp.debian.org/debian/',
746  'dgit-distro.debian-security.archive-query' => 'aptget:',
747  'dgit-distro.debian-security.mirror' => 'http://security.debian.org/debian-security/',
748  'dgit-distro.debian-security.aptget-suite-map' => 's#-security$#/updates#',
749  'dgit-distro.debian-security.aptget-suite-rmap' => 's#$#-security#',
750  'dgit-distro.debian-security.nominal-distro' => 'debian',
751  'dgit-distro.debian.backports-quirk' => '(squeeze)-backports*',
752  'dgit-distro.debian-backports.mirror' => 'http://backports.debian.org/debian-backports/',
753                'dgit-distro.ubuntu.git-check' => 'false',
754  'dgit-distro.ubuntu.mirror' => 'http://archive.ubuntu.com/ubuntu',
755                'dgit-distro.test-dummy.ssh' => "$td/ssh",
756                'dgit-distro.test-dummy.username' => "alice",
757                'dgit-distro.test-dummy.git-check' => "ssh-cmd",
758                'dgit-distro.test-dummy.git-create' => "ssh-cmd",
759                'dgit-distro.test-dummy.git-url' => "$td/git",
760                'dgit-distro.test-dummy.git-host' => "git",
761                'dgit-distro.test-dummy.git-path' => "$td/git",
762                'dgit-distro.test-dummy.archive-query' => "dummycatapi:",
763                'dgit-distro.test-dummy.archive-query-url' => "file://$td/aq/",
764                'dgit-distro.test-dummy.mirror' => "file://$td/mirror/",
765                'dgit-distro.test-dummy.upload-host' => 'test-dummy',
766                );
767
768 our %gitcfgs;
769 our @gitcfgsources = qw(cmdline local global system);
770 our $invoked_in_git_tree = 1;
771
772 sub git_slurp_config () {
773     # This algoritm is a bit subtle, but this is needed so that for
774     # options which we want to be single-valued, we allow the
775     # different config sources to override properly.  See #835858.
776     foreach my $src (@gitcfgsources) {
777         next if $src eq 'cmdline';
778         # we do this ourselves since git doesn't handle it
779
780         $gitcfgs{$src} = git_slurp_config_src $src;
781     }
782 }
783
784 sub git_get_config ($) {
785     my ($c) = @_;
786     foreach my $src (@gitcfgsources) {
787         my $l = $gitcfgs{$src}{$c};
788         confess "internal error ($l $c)" if $l && !ref $l;
789         printdebug"C $c ".(defined $l ?
790                            join " ", map { messagequote "'$_'" } @$l :
791                            "undef")."\n"
792             if $debuglevel >= 4;
793         $l or next;
794         @$l==1 or badcfg
795             f_ "multiple values for %s (in %s git config)", $c, $src
796             if @$l > 1;
797         $l->[0] =~ m/\n/ and badcfg f_
798  "value for config option %s (in %s git config) contains newline(s)!",
799             $c, $src;
800         return $l->[0];
801     }
802     return undef;
803 }
804
805 sub cfg {
806     foreach my $c (@_) {
807         return undef if $c =~ /RETURN-UNDEF/;
808         printdebug "C? $c\n" if $debuglevel >= 5;
809         my $v = git_get_config($c);
810         return $v if defined $v;
811         my $dv = $defcfg{$c};
812         if (defined $dv) {
813             printdebug "CD $c $dv\n" if $debuglevel >= 4;
814             return $dv;
815         }
816     }
817     badcfg f_
818         "need value for one of: %s\n".
819         "%s: distro or suite appears not to be (properly) supported",
820         "@_", $us;
821 }
822
823 sub not_necessarily_a_tree () {
824     # needs to be called from pre_*
825     @gitcfgsources = grep { $_ ne 'local' } @gitcfgsources;
826     $invoked_in_git_tree = 0;
827 }
828
829 sub access_basedistro__noalias () {
830     if (defined $idistro) {
831         return $idistro;
832     } else {    
833         my $def = cfg("dgit-suite.$isuite.distro", 'RETURN-UNDEF');
834         return $def if defined $def;
835         foreach my $src (@gitcfgsources, 'internal') {
836             my $kl = $src eq 'internal' ? \%defcfg : $gitcfgs{$src};
837             next unless $kl;
838             foreach my $k (keys %$kl) {
839                 next unless $k =~ m#^dgit-suite\.(.*)\.distro$#;
840                 my $dpat = $1;
841                 next unless match_glob $dpat, $isuite;
842                 return $kl->{$k};
843             }
844         }
845         return cfg("dgit.default.distro");
846     }
847 }
848
849 sub access_basedistro () {
850     my $noalias = access_basedistro__noalias();
851     my $canon = cfg("dgit-distro.$noalias.alias-canon",'RETURN-UNDEF');
852     return $canon // $noalias;
853 }
854
855 sub access_nomdistro () {
856     my $base = access_basedistro();
857     my $r = cfg("dgit-distro.$base.nominal-distro",'RETURN-UNDEF') // $base;
858     $r =~ m/^$distro_re$/ or badcfg
859         f_ "bad syntax for (nominal) distro \`%s' (does not match %s)",
860         $r, "/^$distro_re$/";
861     return $r;
862 }
863
864 sub access_quirk () {
865     # returns (quirk name, distro to use instead or undef, quirk-specific info)
866     my $basedistro = access_basedistro();
867     my $backports_quirk = cfg("dgit-distro.$basedistro.backports-quirk",
868                               'RETURN-UNDEF');
869     if (defined $backports_quirk) {
870         my $re = $backports_quirk;
871         $re =~ s/[^-0-9a-z_\%*()]/\\$&/ig;
872         $re =~ s/\*/.*/g;
873         $re =~ s/\%/([-0-9a-z_]+)/
874             or $re =~ m/[()]/ or badcfg __ "backports-quirk needs \% or ( )";
875         if ($isuite =~ m/^$re$/) {
876             return ('backports',"$basedistro-backports",$1);
877         }
878     }
879     return ('none',undef);
880 }
881
882 our $access_forpush;
883
884 sub parse_cfg_bool ($$$) {
885     my ($what,$def,$v) = @_;
886     $v //= $def;
887     return
888         $v =~ m/^[ty1]/ ? 1 :
889         $v =~ m/^[fn0]/ ? 0 :
890         badcfg f_ "%s needs t (true, y, 1) or f (false, n, 0) not \`%s'",
891             $what, $v;
892 }       
893
894 sub access_forpush_config () {
895     my $d = access_basedistro();
896
897     return 1 if
898         $new_package &&
899         parse_cfg_bool('new-private-pushers', 0,
900                        cfg("dgit-distro.$d.new-private-pushers",
901                            'RETURN-UNDEF'));
902
903     my $v = cfg("dgit-distro.$d.readonly", 'RETURN-UNDEF');
904     $v //= 'a';
905     return
906         $v =~ m/^[ty1]/ ? 0 : # force readonly,    forpush = 0
907         $v =~ m/^[fn0]/ ? 1 : # force nonreadonly, forpush = 1
908         $v =~ m/^[a]/  ? '' : # auto,              forpush = ''
909         badcfg __
910             "readonly needs t (true, y, 1) or f (false, n, 0) or a (auto)";
911 }
912
913 sub access_forpush () {
914     $access_forpush //= access_forpush_config();
915     return $access_forpush;
916 }
917
918 sub pushing () {
919     confess +(__ 'internal error').' '.Dumper($access_forpush)," ?" if
920         defined $access_forpush and !$access_forpush;
921     badcfg __ "pushing but distro is configured readonly"
922         if access_forpush_config() eq '0';
923     $access_forpush = 1;
924     $supplementary_message = __ <<'END' unless $we_are_responder;
925 Push failed, before we got started.
926 You can retry the push, after fixing the problem, if you like.
927 END
928     parseopts_late_defaults();
929 }
930
931 sub notpushing () {
932     parseopts_late_defaults();
933 }
934
935 sub supplementary_message ($) {
936     my ($msg) = @_;
937     if (!$we_are_responder) {
938         $supplementary_message = $msg;
939         return;
940     } elsif ($protovsn >= 3) {
941         responder_send_command "supplementary-message ".length($msg)
942             or confess $!;
943         print PO $msg or confess $!;
944     }
945 }
946
947 sub access_distros () {
948     # Returns list of distros to try, in order
949     #
950     # We want to try:
951     #    0. `instead of' distro name(s) we have been pointed to
952     #    1. the access_quirk distro, if any
953     #    2a. the user's specified distro, or failing that  } basedistro
954     #    2b. the distro calculated from the suite          }
955     my @l = access_basedistro();
956
957     my (undef,$quirkdistro) = access_quirk();
958     unshift @l, $quirkdistro;
959     unshift @l, $instead_distro;
960     @l = grep { defined } @l;
961
962     push @l, access_nomdistro();
963
964     if (access_forpush()) {
965         @l = map { ("$_/push", $_) } @l;
966     }
967     @l;
968 }
969
970 sub access_cfg_cfgs (@) {
971     my (@keys) = @_;
972     my @cfgs;
973     # The nesting of these loops determines the search order.  We put
974     # the key loop on the outside so that we search all the distros
975     # for each key, before going on to the next key.  That means that
976     # if access_cfg is called with a more specific, and then a less
977     # specific, key, an earlier distro can override the less specific
978     # without necessarily overriding any more specific keys.  (If the
979     # distro wants to override the more specific keys it can simply do
980     # so; whereas if we did the loop the other way around, it would be
981     # impossible to for an earlier distro to override a less specific
982     # key but not the more specific ones without restating the unknown
983     # values of the more specific keys.
984     my @realkeys;
985     my @rundef;
986     # We have to deal with RETURN-UNDEF specially, so that we don't
987     # terminate the search prematurely.
988     foreach (@keys) {
989         if (m/RETURN-UNDEF/) { push @rundef, $_; last; }
990         push @realkeys, $_
991     }
992     foreach my $d (access_distros()) {
993         push @cfgs, map { "dgit-distro.$d.$_" } @realkeys;
994     }
995     push @cfgs, map { "dgit.default.$_" } @realkeys;
996     push @cfgs, @rundef;
997     return @cfgs;
998 }
999
1000 sub access_cfg (@) {
1001     my (@keys) = @_;
1002     my (@cfgs) = access_cfg_cfgs(@keys);
1003     my $value = cfg(@cfgs);
1004     return $value;
1005 }
1006
1007 sub access_cfg_bool ($$) {
1008     my ($def, @keys) = @_;
1009     parse_cfg_bool($keys[0], $def, access_cfg(@keys, 'RETURN-UNDEF'));
1010 }
1011
1012 sub string_to_ssh ($) {
1013     my ($spec) = @_;
1014     if ($spec =~ m/\s/) {
1015         return qw(sh -ec), 'exec '.$spec.' "$@"', 'x';
1016     } else {
1017         return ($spec);
1018     }
1019 }
1020
1021 sub access_cfg_ssh () {
1022     my $gitssh = access_cfg('ssh', 'RETURN-UNDEF');
1023     if (!defined $gitssh) {
1024         return @ssh;
1025     } else {
1026         return string_to_ssh $gitssh;
1027     }
1028 }
1029
1030 sub access_runeinfo ($) {
1031     my ($info) = @_;
1032     return ": dgit ".access_basedistro()." $info ;";
1033 }
1034
1035 sub access_someuserhost ($) {
1036     my ($some) = @_;
1037     my $user = access_cfg("$some-user-force", 'RETURN-UNDEF');
1038     defined($user) && length($user) or
1039         $user = access_cfg("$some-user",'username');
1040     my $host = access_cfg("$some-host");
1041     return length($user) ? "$user\@$host" : $host;
1042 }
1043
1044 sub access_gituserhost () {
1045     return access_someuserhost('git');
1046 }
1047
1048 sub access_giturl (;$) {
1049     my ($optional) = @_;
1050     my $url = access_cfg('git-url','RETURN-UNDEF');
1051     my $suffix;
1052     if (!length $url) {
1053         my $proto = access_cfg('git-proto', 'RETURN-UNDEF');
1054         return undef unless defined $proto;
1055         $url =
1056             $proto.
1057             access_gituserhost().
1058             access_cfg('git-path');
1059     } else {
1060         $suffix = access_cfg('git-url-suffix','RETURN-UNDEF');
1061     }
1062     $suffix //= '.git';
1063     return "$url/$package$suffix";
1064 }              
1065
1066 sub commit_getclogp ($) {
1067     # Returns the parsed changelog hashref for a particular commit
1068     my ($objid) = @_;
1069     our %commit_getclogp_memo;
1070     my $memo = $commit_getclogp_memo{$objid};
1071     return $memo if $memo;
1072
1073     my $mclog = dgit_privdir()."clog";
1074     runcmd shell_cmd "exec >$mclog", @git, qw(cat-file blob),
1075         "$objid:debian/changelog";
1076     $commit_getclogp_memo{$objid} = parsechangelog("-l$mclog");
1077 }
1078
1079 sub parse_dscdata () {
1080     my $dscfh = new IO::File \$dscdata, '<' or confess $!;
1081     printdebug Dumper($dscdata) if $debuglevel>1;
1082     $dsc = parsecontrolfh($dscfh,$dscurl,1);
1083     printdebug Dumper($dsc) if $debuglevel>1;
1084 }
1085
1086 our %rmad;
1087
1088 sub archive_query ($;@) {
1089     my ($method) = shift @_;
1090     fail __ "this operation does not support multiple comma-separated suites"
1091         if $isuite =~ m/,/;
1092     my $query = access_cfg('archive-query','RETURN-UNDEF');
1093     $query =~ s/^(\w+):// or badcfg "invalid archive-query method \`$query'";
1094     my $proto = $1;
1095     my $data = $'; #';
1096     { no strict qw(refs); &{"${method}_${proto}"}($proto,$data,@_); }
1097 }
1098
1099 sub archive_query_prepend_mirror {
1100     my $m = access_cfg('mirror');
1101     return map { [ $_->[0], $m.$_->[1], @$_[2..$#$_] ] } @_;
1102 }
1103
1104 sub pool_dsc_subpath ($$) {
1105     my ($vsn,$component) = @_; # $package is implict arg
1106     my $prefix = substr($package, 0, $package =~ m/^l/ ? 4 : 1);
1107     return "/pool/$component/$prefix/$package/".dscfn($vsn);
1108 }
1109
1110 sub cfg_apply_map ($$$) {
1111     my ($varref, $what, $mapspec) = @_;
1112     return unless $mapspec;
1113
1114     printdebug "config $what EVAL{ $mapspec; }\n";
1115     $_ = $$varref;
1116     eval "package Dgit::Config; $mapspec;";
1117     die $@ if $@;
1118     $$varref = $_;
1119 }
1120
1121 #---------- `ftpmasterapi' archive query method (nascent) ----------
1122
1123 sub archive_api_query_cmd ($) {
1124     my ($subpath) = @_;
1125     my @cmd = (@curl, qw(-sS));
1126     my $url = access_cfg('archive-query-url');
1127     if ($url =~ m#^https://([-.0-9a-z]+)/#) {
1128         my $host = $1;
1129         my $keys = access_cfg('archive-query-tls-key','RETURN-UNDEF') //'';
1130         foreach my $key (split /\:/, $keys) {
1131             $key =~ s/\%HOST\%/$host/g;
1132             if (!stat $key) {
1133                 fail "for $url: stat $key: $!" unless $!==ENOENT;
1134                 next;
1135             }
1136             fail f_ "config requested specific TLS key but do not know".
1137                     " how to get curl to use exactly that EE key (%s)",
1138                     $key;
1139 #           push @cmd, "--cacert", $key, "--capath", "/dev/enoent";
1140 #           # Sadly the above line does not work because of changes
1141 #           # to gnutls.   The real fix for #790093 may involve
1142 #           # new curl options.
1143             last;
1144         }
1145         # Fixing #790093 properly will involve providing a value
1146         # for this on clients.
1147         my $kargs = access_cfg('archive-query-tls-curl-ca-args','RETURN-UNDEF');
1148         push @cmd, split / /, $kargs if defined $kargs;
1149     }
1150     push @cmd, $url.$subpath;
1151     return @cmd;
1152 }
1153
1154 sub api_query ($$;$) {
1155     use JSON;
1156     my ($data, $subpath, $ok404) = @_;
1157     badcfg __ "ftpmasterapi archive query method takes no data part"
1158         if length $data;
1159     my @cmd = archive_api_query_cmd($subpath);
1160     my $url = $cmd[$#cmd];
1161     push @cmd, qw(-w %{http_code});
1162     my $json = cmdoutput @cmd;
1163     unless ($json =~ s/\d+\d+\d$//) {
1164         failedcmd_report_cmd undef, @cmd;
1165         fail __ "curl failed to print 3-digit HTTP code";
1166     }
1167     my $code = $&;
1168     return undef if $code eq '404' && $ok404;
1169     fail f_ "fetch of %s gave HTTP code %s", $url, $code
1170         unless $url =~ m#^file://# or $code =~ m/^2/;
1171     return decode_json($json);
1172 }
1173
1174 sub canonicalise_suite_ftpmasterapi {
1175     my ($proto,$data) = @_;
1176     my $suites = api_query($data, 'suites');
1177     my @matched;
1178     foreach my $entry (@$suites) {
1179         next unless grep { 
1180             my $v = $entry->{$_};
1181             defined $v && $v eq $isuite;
1182         } qw(codename name);
1183         push @matched, $entry;
1184     }
1185     fail f_ "unknown suite %s, maybe -d would help", $isuite
1186         unless @matched;
1187     my $cn;
1188     eval {
1189         @matched==1 or die f_ "multiple matches for suite %s\n", $isuite;
1190         $cn = "$matched[0]{codename}";
1191         defined $cn or die f_ "suite %s info has no codename\n", $isuite;
1192         $cn =~ m/^$suite_re$/
1193             or die f_ "suite %s maps to bad codename\n", $isuite;
1194     };
1195     die +(__ "bad ftpmaster api response: ")."$@\n".Dumper(\@matched)
1196         if length $@;
1197     return $cn;
1198 }
1199
1200 sub archive_query_ftpmasterapi {
1201     my ($proto,$data) = @_;
1202     my $info = api_query($data, "dsc_in_suite/$isuite/$package");
1203     my @rows;
1204     my $digester = Digest::SHA->new(256);
1205     foreach my $entry (@$info) {
1206         eval {
1207             my $vsn = "$entry->{version}";
1208             my ($ok,$msg) = version_check $vsn;
1209             die f_ "bad version: %s\n", $msg unless $ok;
1210             my $component = "$entry->{component}";
1211             $component =~ m/^$component_re$/ or die __ "bad component";
1212             my $filename = "$entry->{filename}";
1213             $filename && $filename !~ m#[^-+:._~0-9a-zA-Z/]|^[/.]|/[/.]#
1214                 or die __ "bad filename";
1215             my $sha256sum = "$entry->{sha256sum}";
1216             $sha256sum =~ m/^[0-9a-f]+$/ or die __ "bad sha256sum";
1217             push @rows, [ $vsn, "/pool/$component/$filename",
1218                           $digester, $sha256sum ];
1219         };
1220         die +(__ "bad ftpmaster api response: ")."$@\n".Dumper($entry)
1221             if length $@;
1222     }
1223     @rows = sort { -version_compare($a->[0],$b->[0]) } @rows;
1224     return archive_query_prepend_mirror @rows;
1225 }
1226
1227 sub file_in_archive_ftpmasterapi {
1228     my ($proto,$data,$filename) = @_;
1229     my $pat = $filename;
1230     $pat =~ s/_/\\_/g;
1231     $pat = "%/$pat";
1232     $pat =~ s#[^-+_.0-9a-z/]# sprintf '%%%02x', ord $& #ge;
1233     my $info = api_query($data, "file_in_archive/$pat", 1);
1234 }
1235
1236 sub package_not_wholly_new_ftpmasterapi {
1237     my ($proto,$data,$pkg) = @_;
1238     my $info = api_query($data,"madison?package=${pkg}&f=json");
1239     return !!@$info;
1240 }
1241
1242 #---------- `aptget' archive query method ----------
1243
1244 our $aptget_base;
1245 our $aptget_releasefile;
1246 our $aptget_configpath;
1247
1248 sub aptget_aptget   () { return @aptget,   qw(-c), $aptget_configpath; }
1249 sub aptget_aptcache () { return @aptcache, qw(-c), $aptget_configpath; }
1250
1251 sub aptget_cache_clean {
1252     runcmd_ordryrun_local qw(sh -ec),
1253         'cd "$1"; find -atime +30 -type f -print0 | xargs -0r rm --',
1254         'x', $aptget_base;
1255 }
1256
1257 sub aptget_lock_acquire () {
1258     my $lockfile = "$aptget_base/lock";
1259     open APTGET_LOCK, '>', $lockfile or confess "open $lockfile: $!";
1260     flock APTGET_LOCK, LOCK_EX or confess "lock $lockfile: $!";
1261 }
1262
1263 sub aptget_prep ($) {
1264     my ($data) = @_;
1265     return if defined $aptget_base;
1266
1267     badcfg __ "aptget archive query method takes no data part"
1268         if length $data;
1269
1270     my $cache = $ENV{XDG_CACHE_DIR} // "$ENV{HOME}/.cache";
1271
1272     ensuredir $cache;
1273     ensuredir "$cache/dgit";
1274     my $cachekey =
1275         access_cfg('aptget-cachekey','RETURN-UNDEF')
1276         // access_nomdistro();
1277
1278     $aptget_base = "$cache/dgit/aptget";
1279     ensuredir $aptget_base;
1280
1281     my $quoted_base = $aptget_base;
1282     confess "$quoted_base contains bad chars, cannot continue"
1283         if $quoted_base =~ m/["\\]/; # apt.conf(5) says no escaping :-/
1284
1285     ensuredir $aptget_base;
1286
1287     aptget_lock_acquire();
1288
1289     aptget_cache_clean();
1290
1291     $aptget_configpath = "$aptget_base/apt.conf#$cachekey";
1292     my $sourceslist = "source.list#$cachekey";
1293
1294     my $aptsuites = $isuite;
1295     cfg_apply_map(\$aptsuites, 'suite map',
1296                   access_cfg('aptget-suite-map', 'RETURN-UNDEF'));
1297
1298     open SRCS, ">", "$aptget_base/$sourceslist" or confess $!;
1299     printf SRCS "deb-src %s %s %s\n",
1300         access_cfg('mirror'),
1301         $aptsuites,
1302         access_cfg('aptget-components')
1303         or confess $!;
1304
1305     ensuredir "$aptget_base/cache";
1306     ensuredir "$aptget_base/lists";
1307
1308     open CONF, ">", $aptget_configpath or confess $!;
1309     print CONF <<END;
1310 Debug::NoLocking "true";
1311 APT::Get::List-Cleanup "false";
1312 #clear APT::Update::Post-Invoke-Success;
1313 Dir::Etc::SourceList "$quoted_base/$sourceslist";
1314 Dir::State::Lists "$quoted_base/lists";
1315 Dir::Etc::preferences "$quoted_base/preferences";
1316 Dir::Cache::srcpkgcache "$quoted_base/cache/srcs#$cachekey";
1317 Dir::Cache::pkgcache "$quoted_base/cache/pkgs#$cachekey";
1318 END
1319
1320     foreach my $key (qw(
1321                         Dir::Cache
1322                         Dir::State
1323                         Dir::Cache::Archives
1324                         Dir::Etc::SourceParts
1325                         Dir::Etc::preferencesparts
1326                       )) {
1327         ensuredir "$aptget_base/$key";
1328         print CONF "$key \"$quoted_base/$key\";\n" or confess $!;
1329     };
1330
1331     my $oldatime = (time // confess $!) - 1;
1332     foreach my $oldlist (<$aptget_base/lists/*Release>) {
1333         next unless stat_exists $oldlist;
1334         my ($mtime) = (stat _)[9];
1335         utime $oldatime, $mtime, $oldlist or die "$oldlist $!";
1336     }
1337
1338     runcmd_ordryrun_local aptget_aptget(), qw(update);
1339
1340     my @releasefiles;
1341     foreach my $oldlist (<$aptget_base/lists/*Release>) {
1342         next unless stat_exists $oldlist;
1343         my ($atime) = (stat _)[8];
1344         next if $atime == $oldatime;
1345         push @releasefiles, $oldlist;
1346     }
1347     my @inreleasefiles = grep { m#/InRelease$# } @releasefiles;
1348     @releasefiles = @inreleasefiles if @inreleasefiles;
1349     if (!@releasefiles) {
1350         fail f_ <<END, $isuite, $cache;
1351 apt seemed to not to update dgit's cached Release files for %s.
1352 (Perhaps %s
1353  is on a filesystem mounted `noatime'; if so, please use `relatime'.)
1354 END
1355     }
1356     confess "apt updated too many Release files (@releasefiles), erk"
1357         unless @releasefiles == 1;
1358
1359     ($aptget_releasefile) = @releasefiles;
1360 }
1361
1362 sub canonicalise_suite_aptget {
1363     my ($proto,$data) = @_;
1364     aptget_prep($data);
1365
1366     my $release = parsecontrol $aptget_releasefile, "Release file", 1;
1367
1368     foreach my $name (qw(Codename Suite)) {
1369         my $val = $release->{$name};
1370         if (defined $val) {
1371             printdebug "release file $name: $val\n";
1372             $val =~ m/^$suite_re$/o or fail f_
1373                 "Release file (%s) specifies intolerable %s",
1374                 $aptget_releasefile, $name;
1375             cfg_apply_map(\$val, 'suite rmap',
1376                           access_cfg('aptget-suite-rmap', 'RETURN-UNDEF'));
1377             return $val
1378         }
1379     }
1380     return $isuite;
1381 }
1382
1383 sub archive_query_aptget {
1384     my ($proto,$data) = @_;
1385     aptget_prep($data);
1386
1387     ensuredir "$aptget_base/source";
1388     foreach my $old (<$aptget_base/source/*.dsc>) {
1389         unlink $old or die "$old: $!";
1390     }
1391
1392     my $showsrc = cmdoutput aptget_aptcache(), qw(showsrc), $package;
1393     return () unless $showsrc =~ m/^package:\s*\Q$package\E\s*$/mi;
1394     # avoids apt-get source failing with ambiguous error code
1395
1396     runcmd_ordryrun_local
1397         shell_cmd 'cd "$1"/source; shift', $aptget_base,
1398         aptget_aptget(), qw(--download-only --only-source source), $package;
1399
1400     my @dscs = <$aptget_base/source/*.dsc>;
1401     fail __ "apt-get source did not produce a .dsc" unless @dscs;
1402     fail f_ "apt-get source produced several .dscs (%s)", "@dscs"
1403         unless @dscs==1;
1404
1405     my $pre_dsc = parsecontrol $dscs[0], $dscs[0], 1;
1406
1407     use URI::Escape;
1408     my $uri = "file://". uri_escape $dscs[0];
1409     $uri =~ s{\%2f}{/}gi;
1410     return [ (getfield $pre_dsc, 'Version'), $uri ];
1411 }
1412
1413 sub file_in_archive_aptget () { return undef; }
1414 sub package_not_wholly_new_aptget () { return undef; }
1415
1416 #---------- `dummyapicat' archive query method ----------
1417 # (untranslated, because this is for testing purposes etc.)
1418
1419 sub archive_query_dummycatapi { archive_query_ftpmasterapi @_; }
1420 sub canonicalise_suite_dummycatapi { canonicalise_suite_ftpmasterapi @_; }
1421
1422 sub dummycatapi_run_in_mirror ($@) {
1423     # runs $fn with FIA open onto rune
1424     my ($rune, $argl, $fn) = @_;
1425
1426     my $mirror = access_cfg('mirror');
1427     $mirror =~ s#^file://#/# or die "$mirror ?";
1428     my @cmd = (qw(sh -ec), 'cd "$1"; shift'."\n".$rune,
1429                qw(x), $mirror, @$argl);
1430     debugcmd "-|", @cmd;
1431     open FIA, "-|", @cmd or confess $!;
1432     my $r = $fn->();
1433     close FIA or ($!==0 && $?==141) or die failedcmd @cmd;
1434     return $r;
1435 }
1436
1437 sub file_in_archive_dummycatapi ($$$) {
1438     my ($proto,$data,$filename) = @_;
1439     my @out;
1440     dummycatapi_run_in_mirror '
1441             find -name "$1" -print0 |
1442             xargs -0r sha256sum
1443     ', [$filename], sub {
1444         while (<FIA>) {
1445             chomp or die;
1446             printdebug "| $_\n";
1447             m/^(\w+)  (\S+)$/ or die "$_ ?";
1448             push @out, { sha256sum => $1, filename => $2 };
1449         }
1450     };
1451     return \@out;
1452 }
1453
1454 sub package_not_wholly_new_dummycatapi {
1455     my ($proto,$data,$pkg) = @_;
1456     dummycatapi_run_in_mirror "
1457             find -name ${pkg}_*.dsc
1458     ", [], sub {
1459         local $/ = undef;
1460         !!<FIA>;
1461     };
1462 }
1463
1464 #---------- `madison' archive query method ----------
1465
1466 sub archive_query_madison {
1467     return archive_query_prepend_mirror
1468         map { [ @$_[0..1] ] } madison_get_parse(@_);
1469 }
1470
1471 sub madison_get_parse {
1472     my ($proto,$data) = @_;
1473     die unless $proto eq 'madison';
1474     if (!length $data) {
1475         $data= access_cfg('madison-distro','RETURN-UNDEF');
1476         $data //= access_basedistro();
1477     }
1478     $rmad{$proto,$data,$package} ||= cmdoutput
1479         qw(rmadison -asource),"-s$isuite","-u$data",$package;
1480     my $rmad = $rmad{$proto,$data,$package};
1481
1482     my @out;
1483     foreach my $l (split /\n/, $rmad) {
1484         $l =~ m{^ \s*( [^ \t|]+ )\s* \|
1485                   \s*( [^ \t|]+ )\s* \|
1486                   \s*( [^ \t|/]+ )(?:/([^ \t|/]+))? \s* \|
1487                   \s*( [^ \t|]+ )\s* }x or die "$rmad ?";
1488         $1 eq $package or die "$rmad $package ?";
1489         my $vsn = $2;
1490         my $newsuite = $3;
1491         my $component;
1492         if (defined $4) {
1493             $component = $4;
1494         } else {
1495             $component = access_cfg('archive-query-default-component');
1496         }
1497         $5 eq 'source' or die "$rmad ?";
1498         push @out, [$vsn,pool_dsc_subpath($vsn,$component),$newsuite];
1499     }
1500     return sort { -version_compare($a->[0],$b->[0]); } @out;
1501 }
1502
1503 sub canonicalise_suite_madison {
1504     # madison canonicalises for us
1505     my @r = madison_get_parse(@_);
1506     @r or fail f_
1507         "unable to canonicalise suite using package %s".
1508         " which does not appear to exist in suite %s;".
1509         " --existing-package may help",
1510         $package, $isuite;
1511     return $r[0][2];
1512 }
1513
1514 sub file_in_archive_madison { return undef; }
1515 sub package_not_wholly_new_madison { return undef; }
1516
1517 #---------- `sshpsql' archive query method ----------
1518 # (untranslated, because this is obsolete)
1519
1520 sub sshpsql ($$$) {
1521     my ($data,$runeinfo,$sql) = @_;
1522     if (!length $data) {
1523         $data= access_someuserhost('sshpsql').':'.
1524             access_cfg('sshpsql-dbname');
1525     }
1526     $data =~ m/:/ or badcfg "invalid sshpsql method string \`$data'";
1527     my ($userhost,$dbname) = ($`,$'); #';
1528     my @rows;
1529     my @cmd = (access_cfg_ssh, $userhost,
1530                access_runeinfo("ssh-psql $runeinfo").
1531                " export LC_MESSAGES=C; export LC_CTYPE=C;".
1532                " ".shellquote qw(psql -A), $dbname, qw(-c), $sql);
1533     debugcmd "|",@cmd;
1534     open P, "-|", @cmd or confess $!;
1535     while (<P>) {
1536         chomp or die;
1537         printdebug(">|$_|\n");
1538         push @rows, $_;
1539     }
1540     $!=0; $?=0; close P or failedcmd @cmd;
1541     @rows or die;
1542     my $nrows = pop @rows;
1543     $nrows =~ s/^\((\d+) rows?\)$/$1/ or die "$nrows ?";
1544     @rows == $nrows+1 or die "$nrows ".(scalar @rows)." ?";
1545     @rows = map { [ split /\|/, $_ ] } @rows;
1546     my $ncols = scalar @{ shift @rows };
1547     die if grep { scalar @$_ != $ncols } @rows;
1548     return @rows;
1549 }
1550
1551 sub sql_injection_check {
1552     foreach (@_) { die "$_ $& ?" if m{[^-+=:_.,/0-9a-zA-Z]}; }
1553 }
1554
1555 sub archive_query_sshpsql ($$) {
1556     my ($proto,$data) = @_;
1557     sql_injection_check $isuite, $package;
1558     my @rows = sshpsql($data, "archive-query $isuite $package", <<END);
1559         SELECT source.version, component.name, files.filename, files.sha256sum
1560           FROM source
1561           JOIN src_associations ON source.id = src_associations.source
1562           JOIN suite ON suite.id = src_associations.suite
1563           JOIN dsc_files ON dsc_files.source = source.id
1564           JOIN files_archive_map ON files_archive_map.file_id = dsc_files.file
1565           JOIN component ON component.id = files_archive_map.component_id
1566           JOIN files ON files.id = dsc_files.file
1567          WHERE ( suite.suite_name='$isuite' OR suite.codename='$isuite' )
1568            AND source.source='$package'
1569            AND files.filename LIKE '%.dsc';
1570 END
1571     @rows = sort { -version_compare($a->[0],$b->[0]) } @rows;
1572     my $digester = Digest::SHA->new(256);
1573     @rows = map {
1574         my ($vsn,$component,$filename,$sha256sum) = @$_;
1575         [ $vsn, "/pool/$component/$filename",$digester,$sha256sum ];
1576     } @rows;
1577     return archive_query_prepend_mirror @rows;
1578 }
1579
1580 sub canonicalise_suite_sshpsql ($$) {
1581     my ($proto,$data) = @_;
1582     sql_injection_check $isuite;
1583     my @rows = sshpsql($data, "canonicalise-suite $isuite", <<END);
1584         SELECT suite.codename
1585           FROM suite where suite_name='$isuite' or codename='$isuite';
1586 END
1587     @rows = map { $_->[0] } @rows;
1588     fail "unknown suite $isuite" unless @rows;
1589     die "ambiguous $isuite: @rows ?" if @rows>1;
1590     return $rows[0];
1591 }
1592
1593 sub file_in_archive_sshpsql ($$$) { return undef; }
1594 sub package_not_wholly_new_sshpsql ($$$) { return undef; }
1595
1596 #---------- `dummycat' archive query method ----------
1597 # (untranslated, because this is for testing purposes etc.)
1598
1599 sub canonicalise_suite_dummycat ($$) {
1600     my ($proto,$data) = @_;
1601     my $dpath = "$data/suite.$isuite";
1602     if (!open C, "<", $dpath) {
1603         $!==ENOENT or die "$dpath: $!";
1604         printdebug "dummycat canonicalise_suite $isuite $dpath ENOENT\n";
1605         return $isuite;
1606     }
1607     $!=0; $_ = <C>;
1608     chomp or die "$dpath: $!";
1609     close C;
1610     printdebug "dummycat canonicalise_suite $isuite $dpath = $_\n";
1611     return $_;
1612 }
1613
1614 sub archive_query_dummycat ($$) {
1615     my ($proto,$data) = @_;
1616     canonicalise_suite();
1617     my $dpath = "$data/package.$csuite.$package";
1618     if (!open C, "<", $dpath) {
1619         $!==ENOENT or die "$dpath: $!";
1620         printdebug "dummycat query $csuite $package $dpath ENOENT\n";
1621         return ();
1622     }
1623     my @rows;
1624     while (<C>) {
1625         next if m/^\#/;
1626         next unless m/\S/;
1627         die unless chomp;
1628         printdebug "dummycat query $csuite $package $dpath | $_\n";
1629         my @row = split /\s+/, $_;
1630         @row==2 or die "$dpath: $_ ?";
1631         push @rows, \@row;
1632     }
1633     C->error and die "$dpath: $!";
1634     close C;
1635     return archive_query_prepend_mirror
1636         sort { -version_compare($a->[0],$b->[0]); } @rows;
1637 }
1638
1639 sub file_in_archive_dummycat () { return undef; }
1640 sub package_not_wholly_new_dummycat () { return undef; }
1641
1642 #---------- tag format handling ----------
1643 # (untranslated, because everything should be new tag format by now)
1644
1645 sub access_cfg_tagformats () {
1646     split /\,/, access_cfg('dgit-tag-format');
1647 }
1648
1649 sub access_cfg_tagformats_can_splitbrain () {
1650     my %y = map { $_ => 1 } access_cfg_tagformats;
1651     foreach my $needtf (qw(new maint)) {
1652         next if $y{$needtf};
1653         return 0;
1654     }
1655     return 1;
1656 }
1657
1658 sub need_tagformat ($$) {
1659     my ($fmt, $why) = @_;
1660     fail "need to use tag format $fmt ($why) but also need".
1661         " to use tag format $tagformat_want->[0] ($tagformat_want->[1])".
1662         " - no way to proceed"
1663         if $tagformat_want && $tagformat_want->[0] ne $fmt;
1664     $tagformat_want = [$fmt, $why, $tagformat_want->[2] // 0];
1665 }
1666
1667 sub select_tagformat () {
1668     # sets $tagformatfn
1669     return if $tagformatfn && !$tagformat_want;
1670     die 'bug' if $tagformatfn && $tagformat_want;
1671     # ... $tagformat_want assigned after previous select_tagformat
1672
1673     my (@supported) = grep { $_ =~ m/^(?:old|new)$/ } access_cfg_tagformats();
1674     printdebug "select_tagformat supported @supported\n";
1675
1676     $tagformat_want //= [ $supported[0], "distro access configuration", 0 ];
1677     printdebug "select_tagformat specified @$tagformat_want\n";
1678
1679     my ($fmt,$why,$override) = @$tagformat_want;
1680
1681     fail "target distro supports tag formats @supported".
1682         " but have to use $fmt ($why)"
1683         unless $override
1684             or grep { $_ eq $fmt } @supported;
1685
1686     $tagformat_want = undef;
1687     $tagformat = $fmt;
1688     $tagformatfn = ${*::}{"debiantag_$fmt"};
1689
1690     fail "trying to use unknown tag format \`$fmt' ($why) !"
1691         unless $tagformatfn;
1692 }
1693
1694 #---------- archive query entrypoints and rest of program ----------
1695
1696 sub canonicalise_suite () {
1697     return if defined $csuite;
1698     fail f_ "cannot operate on %s suite", $isuite if $isuite eq 'UNRELEASED';
1699     $csuite = archive_query('canonicalise_suite');
1700     if ($isuite ne $csuite) {
1701         progress f_ "canonical suite name for %s is %s", $isuite, $csuite;
1702     } else {
1703         progress f_ "canonical suite name is %s", $csuite;
1704     }
1705 }
1706
1707 sub get_archive_dsc () {
1708     canonicalise_suite();
1709     my @vsns = archive_query('archive_query');
1710     foreach my $vinfo (@vsns) {
1711         my ($vsn,$vsn_dscurl,$digester,$digest) = @$vinfo;
1712         $dscurl = $vsn_dscurl;
1713         $dscdata = url_get($dscurl);
1714         if (!$dscdata) {
1715             $skew_warning_vsn = $vsn if !defined $skew_warning_vsn;
1716             next;
1717         }
1718         if ($digester) {
1719             $digester->reset();
1720             $digester->add($dscdata);
1721             my $got = $digester->hexdigest();
1722             $got eq $digest or
1723                 fail f_ "%s has hash %s but archive told us to expect %s",
1724                         $dscurl, $got, $digest;
1725         }
1726         parse_dscdata();
1727         my $fmt = getfield $dsc, 'Format';
1728         $format_ok{$fmt} or forceable_fail [qw(unsupported-source-format)],
1729             f_ "unsupported source format %s, sorry", $fmt;
1730             
1731         $dsc_checked = !!$digester;
1732         printdebug "get_archive_dsc: Version ".(getfield $dsc, 'Version')."\n";
1733         return;
1734     }
1735     $dsc = undef;
1736     printdebug "get_archive_dsc: nothing in archive, returning undef\n";
1737 }
1738
1739 sub check_for_git ();
1740 sub check_for_git () {
1741     # returns 0 or 1
1742     my $how = access_cfg('git-check');
1743     if ($how eq 'ssh-cmd') {
1744         my @cmd =
1745             (access_cfg_ssh, access_gituserhost(),
1746              access_runeinfo("git-check $package").
1747              " set -e; cd ".access_cfg('git-path').";".
1748              " if test -d $package.git; then echo 1; else echo 0; fi");
1749         my $r= cmdoutput @cmd;
1750         if (defined $r and $r =~ m/^divert (\w+)$/) {
1751             my $divert=$1;
1752             my ($usedistro,) = access_distros();
1753             # NB that if we are pushing, $usedistro will be $distro/push
1754             $instead_distro= cfg("dgit-distro.$usedistro.diverts.$divert");
1755             $instead_distro =~ s{^/}{ access_basedistro()."/" }e;
1756             progress f_ "diverting to %s (using config for %s)",
1757                         $divert, $instead_distro;
1758             return check_for_git();
1759         }
1760         failedcmd @cmd unless defined $r and $r =~ m/^[01]$/;
1761         return $r+0;
1762     } elsif ($how eq 'url') {
1763         my $prefix = access_cfg('git-check-url','git-url');
1764         my $suffix = access_cfg('git-check-suffix','git-suffix',
1765                                 'RETURN-UNDEF') // '.git';
1766         my $url = "$prefix/$package$suffix";
1767         my @cmd = (@curl, qw(-sS -I), $url);
1768         my $result = cmdoutput @cmd;
1769         $result =~ s/^\S+ 200 .*\n\r?\n//;
1770         # curl -sS -I with https_proxy prints
1771         # HTTP/1.0 200 Connection established
1772         $result =~ m/^\S+ (404|200) /s or
1773             fail +(__ "unexpected results from git check query - ").
1774                 Dumper($prefix, $result);
1775         my $code = $1;
1776         if ($code eq '404') {
1777             return 0;
1778         } elsif ($code eq '200') {
1779             return 1;
1780         } else {
1781             die;
1782         }
1783     } elsif ($how eq 'true') {
1784         return 1;
1785     } elsif ($how eq 'false') {
1786         return 0;
1787     } else {
1788         badcfg f_ "unknown git-check \`%s'", $how;
1789     }
1790 }
1791
1792 sub create_remote_git_repo () {
1793     my $how = access_cfg('git-create');
1794     if ($how eq 'ssh-cmd') {
1795         runcmd_ordryrun
1796             (access_cfg_ssh, access_gituserhost(),
1797              access_runeinfo("git-create $package").
1798              "set -e; cd ".access_cfg('git-path').";".
1799              " cp -a _template $package.git");
1800     } elsif ($how eq 'true') {
1801         # nothing to do
1802     } else {
1803         badcfg f_ "unknown git-create \`%s'", $how;
1804     }
1805 }
1806
1807 our ($dsc_hash,$lastpush_mergeinput);
1808 our ($dsc_distro, $dsc_hint_tag, $dsc_hint_url);
1809
1810
1811 sub prep_ud () {
1812     dgit_privdir(); # ensures that $dgit_privdir_made is based on $maindir
1813     $playground = fresh_playground 'dgit/unpack';
1814 }
1815
1816 sub mktree_in_ud_here () {
1817     playtree_setup $gitcfgs{local};
1818 }
1819
1820 sub git_write_tree () {
1821     my $tree = cmdoutput @git, qw(write-tree);
1822     $tree =~ m/^\w+$/ or die "$tree ?";
1823     return $tree;
1824 }
1825
1826 sub git_add_write_tree () {
1827     runcmd @git, qw(add -Af .);
1828     return git_write_tree();
1829 }
1830
1831 sub remove_stray_gits ($) {
1832     my ($what) = @_;
1833     my @gitscmd = qw(find -name .git -prune -print0);
1834     debugcmd "|",@gitscmd;
1835     open GITS, "-|", @gitscmd or confess $!;
1836     {
1837         local $/="\0";
1838         while (<GITS>) {
1839             chomp or die;
1840             print STDERR f_ "%s: warning: removing from %s: %s\n",
1841                 $us, $what, (messagequote $_);
1842             rmtree $_;
1843         }
1844     }
1845     $!=0; $?=0; close GITS or failedcmd @gitscmd;
1846 }
1847
1848 sub mktree_in_ud_from_only_subdir ($;$) {
1849     my ($what,$raw) = @_;
1850     # changes into the subdir
1851
1852     my (@dirs) = <*/.>;
1853     confess "expected one subdir but found @dirs ?" unless @dirs==1;
1854     $dirs[0] =~ m#^([^/]+)/\.$# or die;
1855     my $dir = $1;
1856     changedir $dir;
1857
1858     remove_stray_gits($what);
1859     mktree_in_ud_here();
1860     if (!$raw) {
1861         my ($format, $fopts) = get_source_format();
1862         if (madformat($format)) {
1863             rmtree '.pc';
1864         }
1865     }
1866
1867     my $tree=git_add_write_tree();
1868     return ($tree,$dir);
1869 }
1870
1871 our @files_csum_info_fields = 
1872     (['Checksums-Sha256','Digest::SHA', 'new(256)', 'sha256sum'],
1873      ['Checksums-Sha1',  'Digest::SHA', 'new(1)',   'sha1sum'],
1874      ['Files',           'Digest::MD5', 'new()',    'md5sum']);
1875
1876 sub dsc_files_info () {
1877     foreach my $csumi (@files_csum_info_fields) {
1878         my ($fname, $module, $method) = @$csumi;
1879         my $field = $dsc->{$fname};
1880         next unless defined $field;
1881         eval "use $module; 1;" or die $@;
1882         my @out;
1883         foreach (split /\n/, $field) {
1884             next unless m/\S/;
1885             m/^(\w+) (\d+) (\S+)$/ or
1886                 fail f_ "could not parse .dsc %s line \`%s'", $fname, $_;
1887             my $digester = eval "$module"."->$method;" or die $@;
1888             push @out, {
1889                 Hash => $1,
1890                 Bytes => $2,
1891                 Filename => $3,
1892                 Digester => $digester,
1893             };
1894         }
1895         return @out;
1896     }
1897     fail f_ "missing any supported Checksums-* or Files field in %s",
1898             $dsc->get_option('name');
1899 }
1900
1901 sub dsc_files () {
1902     map { $_->{Filename} } dsc_files_info();
1903 }
1904
1905 sub files_compare_inputs (@) {
1906     my $inputs = \@_;
1907     my %record;
1908     my %fchecked;
1909
1910     my $showinputs = sub {
1911         return join "; ", map { $_->get_option('name') } @$inputs;
1912     };
1913
1914     foreach my $in (@$inputs) {
1915         my $expected_files;
1916         my $in_name = $in->get_option('name');
1917
1918         printdebug "files_compare_inputs $in_name\n";
1919
1920         foreach my $csumi (@files_csum_info_fields) {
1921             my ($fname) = @$csumi;
1922             printdebug "files_compare_inputs $in_name $fname\n";
1923
1924             my $field = $in->{$fname};
1925             next unless defined $field;
1926
1927             my @files;
1928             foreach (split /\n/, $field) {
1929                 next unless m/\S/;
1930
1931                 my ($info, $f) = m/^(\w+ \d+) (?:\S+ \S+ )?(\S+)$/ or
1932                     fail "could not parse $in_name $fname line \`$_'";
1933
1934                 printdebug "files_compare_inputs $in_name $fname $f\n";
1935
1936                 push @files, $f;
1937
1938                 my $re = \ $record{$f}{$fname};
1939                 if (defined $$re) {
1940                     $fchecked{$f}{$in_name} = 1;
1941                     $$re eq $info or
1942                         fail f_
1943               "hash or size of %s varies in %s fields (between: %s)",
1944                                  $f, $fname, $showinputs->();
1945                 } else {
1946                     $$re = $info;
1947                 }
1948             }
1949             @files = sort @files;
1950             $expected_files //= \@files;
1951             "@$expected_files" eq "@files" or
1952                 fail f_ "file list in %s varies between hash fields!",
1953                         $in_name;
1954         }
1955         $expected_files or
1956             fail f_ "%s has no files list field(s)", $in_name;
1957     }
1958     printdebug "files_compare_inputs ".Dumper(\%fchecked, \%record)
1959         if $debuglevel>=2;
1960
1961     grep { keys %$_ == @$inputs-1 } values %fchecked
1962         or fail f_ "no file appears in all file lists (looked in: %s)",
1963                    $showinputs->();
1964 }
1965
1966 sub is_orig_file_in_dsc ($$) {
1967     my ($f, $dsc_files_info) = @_;
1968     return 0 if @$dsc_files_info <= 1;
1969     # One file means no origs, and the filename doesn't have a "what
1970     # part of dsc" component.  (Consider versions ending `.orig'.)
1971     return 0 unless $f =~ m/\.$orig_f_tail_re$/o;
1972     return 1;
1973 }
1974
1975 # This function determines whether a .changes file is source-only from
1976 # the point of view of dak.  Thus, it permits *_source.buildinfo
1977 # files.
1978 #
1979 # It does not, however, permit any other buildinfo files.  After a
1980 # source-only upload, the buildds will try to upload files like
1981 # foo_1.2.3_amd64.buildinfo.  If the package maintainer included files
1982 # named like this in their (otherwise) source-only upload, the uploads
1983 # of the buildd can be rejected by dak.  Fixing the resultant
1984 # situation can require manual intervention.  So we block such
1985 # .buildinfo files when the user tells us to perform a source-only
1986 # upload (such as when using the push-source subcommand with the -C
1987 # option, which calls this function).
1988 #
1989 # Note, though, that when dgit is told to prepare a source-only
1990 # upload, such as when subcommands like build-source and push-source
1991 # without -C are used, dgit has a more restrictive notion of
1992 # source-only .changes than dak: such uploads will never include
1993 # *_source.buildinfo files.  This is because there is no use for such
1994 # files when using a tool like dgit to produce the source package, as
1995 # dgit ensures the source is identical to git HEAD.
1996 sub test_source_only_changes ($) {
1997     my ($changes) = @_;
1998     foreach my $l (split /\n/, getfield $changes, 'Files') {
1999         $l =~ m/\S+$/ or next;
2000         # \.tar\.[a-z0-9]+ covers orig.tar and the tarballs in native packages
2001         unless ($& =~ m/(?:\.dsc|\.diff\.gz|\.tar\.[a-z0-9]+|_source\.buildinfo)$/) {
2002             print f_ "purportedly source-only changes polluted by %s\n", $&;
2003             return 0;
2004         }
2005     }
2006     return 1;
2007 }
2008
2009 sub changes_update_origs_from_dsc ($$$$) {
2010     my ($dsc, $changes, $upstreamvsn, $changesfile) = @_;
2011     my %changes_f;
2012     printdebug "checking origs needed ($upstreamvsn)...\n";
2013     $_ = getfield $changes, 'Files';
2014     m/^\w+ \d+ (\S+ \S+) \S+$/m or
2015         fail __ "cannot find section/priority from .changes Files field";
2016     my $placementinfo = $1;
2017     my %changed;
2018     printdebug "checking origs needed placement '$placementinfo'...\n";
2019     foreach my $l (split /\n/, getfield $dsc, 'Files') {
2020         $l =~ m/\S+$/ or next;
2021         my $file = $&;
2022         printdebug "origs $file | $l\n";
2023         next unless is_orig_file_of_vsn $file, $upstreamvsn;
2024         printdebug "origs $file is_orig\n";
2025         my $have = archive_query('file_in_archive', $file);
2026         if (!defined $have) {
2027             print STDERR __ <<END;
2028 archive does not support .orig check; hope you used --ch:--sa/-sd if needed
2029 END
2030             return;
2031         }
2032         my $found_same = 0;
2033         my @found_differ;
2034         printdebug "origs $file \$#\$have=$#$have\n";
2035         foreach my $h (@$have) {
2036             my $same = 0;
2037             my @differ;
2038             foreach my $csumi (@files_csum_info_fields) {
2039                 my ($fname, $module, $method, $archivefield) = @$csumi;
2040                 next unless defined $h->{$archivefield};
2041                 $_ = $dsc->{$fname};
2042                 next unless defined;
2043                 m/^(\w+) .* \Q$file\E$/m or
2044                     fail f_ ".dsc %s missing entry for %s", $fname, $file;
2045                 if ($h->{$archivefield} eq $1) {
2046                     $same++;
2047                 } else {
2048                     push @differ, f_
2049                         "%s: %s (archive) != %s (local .dsc)",
2050                         $archivefield, $h->{$archivefield}, $1;
2051                 }
2052             }
2053             confess "$file ".Dumper($h)." ?!" if $same && @differ;
2054             $found_same++
2055                 if $same;
2056             push @found_differ,
2057                 f_ "archive %s: %s", $h->{filename}, join "; ", @differ
2058                 if @differ;
2059         }
2060         printdebug "origs $file f.same=$found_same".
2061             " #f._differ=$#found_differ\n";
2062         if (@found_differ && !$found_same) {
2063             fail join "\n",
2064                 (f_ "archive contains %s with different checksum", $file),
2065                 @found_differ;
2066         }
2067         # Now we edit the changes file to add or remove it
2068         foreach my $csumi (@files_csum_info_fields) {
2069             my ($fname, $module, $method, $archivefield) = @$csumi;
2070             next unless defined $changes->{$fname};
2071             if ($found_same) {
2072                 # in archive, delete from .changes if it's there
2073                 $changed{$file} = "removed" if
2074                     $changes->{$fname} =~ s/\n.* \Q$file\E$(?:)$//m;
2075             } elsif ($changes->{$fname} =~ m/^.* \Q$file\E$(?:)$/m) {
2076                 # not in archive, but it's here in the .changes
2077             } else {
2078                 my $dsc_data = getfield $dsc, $fname;
2079                 $dsc_data =~ m/^(.* \Q$file\E$)$/m or die "$dsc_data $file ?";
2080                 my $extra = $1;
2081                 $extra =~ s/ \d+ /$&$placementinfo /
2082                     or confess "$fname $extra >$dsc_data< ?"
2083                     if $fname eq 'Files';
2084                 $changes->{$fname} .= "\n". $extra;
2085                 $changed{$file} = "added";
2086             }
2087         }
2088     }
2089     if (%changed) {
2090         foreach my $file (keys %changed) {
2091             progress f_
2092                 "edited .changes for archive .orig contents: %s %s",
2093                 $changed{$file}, $file;
2094         }
2095         my $chtmp = "$changesfile.tmp";
2096         $changes->save($chtmp);
2097         if (act_local()) {
2098             rename $chtmp,$changesfile or die "$changesfile $!";
2099         } else {
2100             progress f_ "[new .changes left in %s]", $changesfile;
2101         }
2102     } else {
2103         progress f_ "%s already has appropriate .orig(s) (if any)",
2104                     $changesfile;
2105     }
2106 }
2107
2108 sub make_commit ($) {
2109     my ($file) = @_;
2110     return cmdoutput @git, qw(hash-object -w -t commit), $file;
2111 }
2112
2113 sub clogp_authline ($) {
2114     my ($clogp) = @_;
2115     my $author = getfield $clogp, 'Maintainer';
2116     if ($author =~ m/^[^"\@]+\,/) {
2117         # single entry Maintainer field with unquoted comma
2118         $author = ($& =~ y/,//rd).$'; # strip the comma
2119     }
2120     # git wants a single author; any remaining commas in $author
2121     # are by now preceded by @ (or ").  It seems safer to punt on
2122     # "..." for now rather than attempting to dequote or something.
2123     $author =~ s#,.*##ms unless $author =~ m/"/;
2124     my $date = cmdoutput qw(date), '+%s %z', qw(-d), getfield($clogp,'Date');
2125     my $authline = "$author $date";
2126     $authline =~ m/$git_authline_re/o or
2127         fail f_ "unexpected commit author line format \`%s'".
2128                 " (was generated from changelog Maintainer field)",
2129                 $authline;
2130     return ($1,$2,$3) if wantarray;
2131     return $authline;
2132 }
2133
2134 sub vendor_patches_distro ($$) {
2135     my ($checkdistro, $what) = @_;
2136     return unless defined $checkdistro;
2137
2138     my $series = "debian/patches/\L$checkdistro\E.series";
2139     printdebug "checking for vendor-specific $series ($what)\n";
2140
2141     if (!open SERIES, "<", $series) {
2142         confess "$series $!" unless $!==ENOENT;
2143         return;
2144     }
2145     while (<SERIES>) {
2146         next unless m/\S/;
2147         next if m/^\s+\#/;
2148
2149         print STDERR __ <<END;
2150
2151 Unfortunately, this source package uses a feature of dpkg-source where
2152 the same source package unpacks to different source code on different
2153 distros.  dgit cannot safely operate on such packages on affected
2154 distros, because the meaning of source packages is not stable.
2155
2156 Please ask the distro/maintainer to remove the distro-specific series
2157 files and use a different technique (if necessary, uploading actually
2158 different packages, if different distros are supposed to have
2159 different code).
2160
2161 END
2162         fail f_ "Found active distro-specific series file for".
2163                 " %s (%s): %s, cannot continue",
2164                 $checkdistro, $what, $series;
2165     }
2166     die "$series $!" if SERIES->error;
2167     close SERIES;
2168 }
2169
2170 sub check_for_vendor_patches () {
2171     # This dpkg-source feature doesn't seem to be documented anywhere!
2172     # But it can be found in the changelog (reformatted):
2173
2174     #   commit  4fa01b70df1dc4458daee306cfa1f987b69da58c
2175     #   Author: Raphael Hertzog <hertzog@debian.org>
2176     #   Date: Sun  Oct  3  09:36:48  2010 +0200
2177
2178     #   dpkg-source: correctly create .pc/.quilt_series with alternate
2179     #   series files
2180     #   
2181     #   If you have debian/patches/ubuntu.series and you were
2182     #   unpacking the source package on ubuntu, quilt was still
2183     #   directed to debian/patches/series instead of
2184     #   debian/patches/ubuntu.series.
2185     #   
2186     #   debian/changelog                        |    3 +++
2187     #   scripts/Dpkg/Source/Package/V3/quilt.pm |    4 +++-
2188     #   2 files changed, 6 insertions(+), 1 deletion(-)
2189
2190     use Dpkg::Vendor;
2191     vendor_patches_distro($ENV{DEB_VENDOR}, "DEB_VENDOR");
2192     vendor_patches_distro(Dpkg::Vendor::get_current_vendor(),
2193                           __ "Dpkg::Vendor \`current vendor'");
2194     vendor_patches_distro(access_basedistro(),
2195                           __ "(base) distro being accessed");
2196     vendor_patches_distro(access_nomdistro(),
2197                           __ "(nominal) distro being accessed");
2198 }
2199
2200 sub check_bpd_exists () {
2201     stat $buildproductsdir
2202         or fail f_ "build-products-dir %s is not accessible: %s\n",
2203         $buildproductsdir, $!;
2204 }
2205
2206 sub generate_commits_from_dsc () {
2207     # See big comment in fetch_from_archive, below.
2208     # See also README.dsc-import.
2209     prep_ud();
2210     changedir $playground;
2211
2212     my @dfi = dsc_files_info();
2213     foreach my $fi (@dfi) {
2214         my $f = $fi->{Filename};
2215         die "$f ?" if $f =~ m#/|^\.|\.dsc$|\.tmp$#;
2216         my $upper_f = (bpd_abs()."/$f");
2217
2218         printdebug "considering reusing $f: ";
2219
2220         if (link_ltarget "$upper_f,fetch", $f) {
2221             printdebug "linked (using ...,fetch).\n";
2222         } elsif ((printdebug "($!) "),
2223                  $! != ENOENT) {
2224             fail f_ "accessing %s: %s", "$buildproductsdir/$f,fetch", $!;
2225         } elsif (link_ltarget $upper_f, $f) {
2226             printdebug "linked.\n";
2227         } elsif ((printdebug "($!) "),
2228                  $! != ENOENT) {
2229             fail f_ "accessing %s: %s", "$buildproductsdir/$f", $!;
2230         } else {
2231             printdebug "absent.\n";
2232         }
2233
2234         my $refetched;
2235         complete_file_from_dsc('.', $fi, \$refetched)
2236             or next;
2237
2238         printdebug "considering saving $f: ";
2239
2240         if (rename_link_xf 1, $f, $upper_f) {
2241             printdebug "linked.\n";
2242         } elsif ((printdebug "($@) "),
2243                  $! != EEXIST) {
2244             fail f_ "saving %s: %s", "$buildproductsdir/$f", $@;
2245         } elsif (!$refetched) {
2246             printdebug "no need.\n";
2247         } elsif (rename_link_xf 1, $f, "$upper_f,fetch") {
2248             printdebug "linked (using ...,fetch).\n";
2249         } elsif ((printdebug "($@) "),
2250                  $! != EEXIST) {
2251             fail f_ "saving %s: %s", "$buildproductsdir/$f,fetch", $@;
2252         } else {
2253             printdebug "cannot.\n";
2254         }
2255     }
2256
2257     # We unpack and record the orig tarballs first, so that we only
2258     # need disk space for one private copy of the unpacked source.
2259     # But we can't make them into commits until we have the metadata
2260     # from the debian/changelog, so we record the tree objects now and
2261     # make them into commits later.
2262     my @tartrees;
2263     my $upstreamv = upstreamversion $dsc->{version};
2264     my $orig_f_base = srcfn $upstreamv, '';
2265
2266     foreach my $fi (@dfi) {
2267         # We actually import, and record as a commit, every tarball
2268         # (unless there is only one file, in which case there seems
2269         # little point.
2270
2271         my $f = $fi->{Filename};
2272         printdebug "import considering $f ";
2273         (printdebug "only one dfi\n"), next if @dfi == 1;
2274         (printdebug "not tar\n"), next unless $f =~ m/\.tar(\.\w+)?$/;
2275         (printdebug "signature\n"), next if $f =~ m/$orig_f_sig_re$/o;
2276         my $compr_ext = $1;
2277
2278         my ($orig_f_part) =
2279             $f =~ m/^\Q$orig_f_base\E\.([^._]+)?\.tar(?:\.\w+)?$/;
2280
2281         printdebug "Y ", (join ' ', map { $_//"(none)" }
2282                           $compr_ext, $orig_f_part
2283                          ), "\n";
2284
2285         my $input = new IO::File $f, '<' or die "$f $!";
2286         my $compr_pid;
2287         my @compr_cmd;
2288
2289         if (defined $compr_ext) {
2290             my $cname =
2291                 Dpkg::Compression::compression_guess_from_filename $f;
2292             fail "Dpkg::Compression cannot handle file $f in source package"
2293                 if defined $compr_ext && !defined $cname;
2294             my $compr_proc =
2295                 new Dpkg::Compression::Process compression => $cname;
2296             @compr_cmd = $compr_proc->get_uncompress_cmdline();
2297             my $compr_fh = new IO::Handle;
2298             my $compr_pid = open $compr_fh, "-|" // confess $!;
2299             if (!$compr_pid) {
2300                 open STDIN, "<&", $input or confess $!;
2301                 exec @compr_cmd;
2302                 die "dgit (child): exec $compr_cmd[0]: $!\n";
2303             }
2304             $input = $compr_fh;
2305         }
2306
2307         rmtree "_unpack-tar";
2308         mkdir "_unpack-tar" or confess $!;
2309         my @tarcmd = qw(tar -x -f -
2310                         --no-same-owner --no-same-permissions
2311                         --no-acls --no-xattrs --no-selinux);
2312         my $tar_pid = fork // confess $!;
2313         if (!$tar_pid) {
2314             chdir "_unpack-tar" or confess $!;
2315             open STDIN, "<&", $input or confess $!;
2316             exec @tarcmd;
2317             die f_ "dgit (child): exec %s: %s", $tarcmd[0], $!;
2318         }
2319         $!=0; (waitpid $tar_pid, 0) == $tar_pid or confess $!;
2320         !$? or failedcmd @tarcmd;
2321
2322         close $input or
2323             (@compr_cmd ? ($?==SIGPIPE || failedcmd @compr_cmd)
2324              : confess $!);
2325         # finally, we have the results in "tarball", but maybe
2326         # with the wrong permissions
2327
2328         runcmd qw(chmod -R +rwX _unpack-tar);
2329         changedir "_unpack-tar";
2330         remove_stray_gits($f);
2331         mktree_in_ud_here();
2332         
2333         my ($tree) = git_add_write_tree();
2334         my $tentries = cmdoutput @git, qw(ls-tree -z), $tree;
2335         if ($tentries =~ m/^\d+ tree (\w+)\t[^\000]+\000$/s) {
2336             $tree = $1;
2337             printdebug "one subtree $1\n";
2338         } else {
2339             printdebug "multiple subtrees\n";
2340         }
2341         changedir "..";
2342         rmtree "_unpack-tar";
2343
2344         my $ent = [ $f, $tree ];
2345         push @tartrees, {
2346             Orig => !!$orig_f_part,
2347             Sort => (!$orig_f_part         ? 2 :
2348                      $orig_f_part =~ m/-/g ? 1 :
2349                                              0),
2350             F => $f,
2351             Tree => $tree,
2352         };
2353     }
2354
2355     @tartrees = sort {
2356         # put any without "_" first (spec is not clear whether files
2357         # are always in the usual order).  Tarballs without "_" are
2358         # the main orig or the debian tarball.
2359         $a->{Sort} <=> $b->{Sort} or
2360         $a->{F}    cmp $b->{F}
2361     } @tartrees;
2362
2363     my $any_orig = grep { $_->{Orig} } @tartrees;
2364
2365     my $dscfn = "$package.dsc";
2366
2367     my $treeimporthow = 'package';
2368
2369     open D, ">", $dscfn or die "$dscfn: $!";
2370     print D $dscdata or die "$dscfn: $!";
2371     close D or die "$dscfn: $!";
2372     my @cmd = qw(dpkg-source);
2373     push @cmd, '--no-check' if $dsc_checked;
2374     if (madformat $dsc->{format}) {
2375         push @cmd, '--skip-patches';
2376         $treeimporthow = 'unpatched';
2377     }
2378     push @cmd, qw(-x --), $dscfn;
2379     runcmd @cmd;
2380
2381     my ($tree,$dir) = mktree_in_ud_from_only_subdir(__ "source package");
2382     if (madformat $dsc->{format}) { 
2383         check_for_vendor_patches();
2384     }
2385
2386     my $dappliedtree;
2387     if (madformat $dsc->{format}) {
2388         my @pcmd = qw(dpkg-source --before-build .);
2389         runcmd shell_cmd 'exec >/dev/null', @pcmd;
2390         rmtree '.pc';
2391         $dappliedtree = git_add_write_tree();
2392     }
2393
2394     my @clogcmd = qw(dpkg-parsechangelog --format rfc822 --all);
2395     my $clogp;
2396     my $r1clogp;
2397
2398     printdebug "import clog search...\n";
2399     parsechangelog_loop \@clogcmd, (__ "package changelog"), sub {
2400         my ($thisstanza, $desc) = @_;
2401         no warnings qw(exiting);
2402
2403         $clogp //= $thisstanza;
2404
2405         printdebug "import clog $thisstanza->{version} $desc...\n";
2406
2407         last if !$any_orig; # we don't need $r1clogp
2408
2409         # We look for the first (most recent) changelog entry whose
2410         # version number is lower than the upstream version of this
2411         # package.  Then the last (least recent) previous changelog
2412         # entry is treated as the one which introduced this upstream
2413         # version and used for the synthetic commits for the upstream
2414         # tarballs.
2415
2416         # One might think that a more sophisticated algorithm would be
2417         # necessary.  But: we do not want to scan the whole changelog
2418         # file.  Stopping when we see an earlier version, which
2419         # necessarily then is an earlier upstream version, is the only
2420         # realistic way to do that.  Then, either the earliest
2421         # changelog entry we have seen so far is indeed the earliest
2422         # upload of this upstream version; or there are only changelog
2423         # entries relating to later upstream versions (which is not
2424         # possible unless the changelog and .dsc disagree about the
2425         # version).  Then it remains to choose between the physically
2426         # last entry in the file, and the one with the lowest version
2427         # number.  If these are not the same, we guess that the
2428         # versions were created in a non-monotonic order rather than
2429         # that the changelog entries have been misordered.
2430
2431         printdebug "import clog $thisstanza->{version} vs $upstreamv...\n";
2432
2433         last if version_compare($thisstanza->{version}, $upstreamv) < 0;
2434         $r1clogp = $thisstanza;
2435
2436         printdebug "import clog $r1clogp->{version} becomes r1\n";
2437     };
2438
2439     $clogp or fail __ "package changelog has no entries!";
2440
2441     my $authline = clogp_authline $clogp;
2442     my $changes = getfield $clogp, 'Changes';
2443     $changes =~ s/^\n//; # Changes: \n
2444     my $cversion = getfield $clogp, 'Version';
2445
2446     if (@tartrees) {
2447         $r1clogp //= $clogp; # maybe there's only one entry;
2448         my $r1authline = clogp_authline $r1clogp;
2449         # Strictly, r1authline might now be wrong if it's going to be
2450         # unused because !$any_orig.  Whatever.
2451
2452         printdebug "import tartrees authline   $authline\n";
2453         printdebug "import tartrees r1authline $r1authline\n";
2454
2455         foreach my $tt (@tartrees) {
2456             printdebug "import tartree $tt->{F} $tt->{Tree}\n";
2457
2458             my $mbody = f_ "Import %s", $tt->{F};
2459             $tt->{Commit} = make_commit_text($tt->{Orig} ? <<END_O : <<END_T);
2460 tree $tt->{Tree}
2461 author $r1authline
2462 committer $r1authline
2463
2464 $mbody
2465
2466 [dgit import orig $tt->{F}]
2467 END_O
2468 tree $tt->{Tree}
2469 author $authline
2470 committer $authline
2471
2472 $mbody
2473
2474 [dgit import tarball $package $cversion $tt->{F}]
2475 END_T
2476         }
2477     }
2478
2479     printdebug "import main commit\n";
2480
2481     open C, ">../commit.tmp" or confess $!;
2482     print C <<END or confess $!;
2483 tree $tree
2484 END
2485     print C <<END or confess $! foreach @tartrees;
2486 parent $_->{Commit}
2487 END
2488     print C <<END or confess $!;
2489 author $authline
2490 committer $authline
2491
2492 $changes
2493
2494 [dgit import $treeimporthow $package $cversion]
2495 END
2496
2497     close C or confess $!;
2498     my $rawimport_hash = make_commit qw(../commit.tmp);
2499
2500     if (madformat $dsc->{format}) {
2501         printdebug "import apply patches...\n";
2502
2503         # regularise the state of the working tree so that
2504         # the checkout of $rawimport_hash works nicely.
2505         my $dappliedcommit = make_commit_text(<<END);
2506 tree $dappliedtree
2507 author $authline
2508 committer $authline
2509
2510 [dgit dummy commit]
2511 END
2512         runcmd @git, qw(checkout -q -b dapplied), $dappliedcommit;
2513
2514         runcmd @git, qw(checkout -q -b unpa), $rawimport_hash;
2515
2516         # We need the answers to be reproducible
2517         my @authline = clogp_authline($clogp);
2518         local $ENV{GIT_COMMITTER_NAME} =  $authline[0];
2519         local $ENV{GIT_COMMITTER_EMAIL} = $authline[1];
2520         local $ENV{GIT_COMMITTER_DATE} =  $authline[2];
2521         local $ENV{GIT_AUTHOR_NAME} =  $authline[0];
2522         local $ENV{GIT_AUTHOR_EMAIL} = $authline[1];
2523         local $ENV{GIT_AUTHOR_DATE} =  $authline[2];
2524
2525         my $path = $ENV{PATH} or die;
2526
2527         # we use ../../gbp-pq-output, which (given that we are in
2528         # $playground/PLAYTREE, and $playground is .git/dgit/unpack,
2529         # is .git/dgit.
2530
2531         foreach my $use_absurd (qw(0 1)) {
2532             runcmd @git, qw(checkout -q unpa);
2533             runcmd @git, qw(update-ref -d refs/heads/patch-queue/unpa);
2534             local $ENV{PATH} = $path;
2535             if ($use_absurd) {
2536                 chomp $@;
2537                 progress "warning: $@";
2538                 $path = "$absurdity:$path";
2539                 progress f_ "%s: trying slow absurd-git-apply...", $us;
2540                 rename "../../gbp-pq-output","../../gbp-pq-output.0"
2541                     or $!==ENOENT
2542                     or confess $!;
2543             }
2544             eval {
2545                 die "forbid absurd git-apply\n" if $use_absurd
2546                     && forceing [qw(import-gitapply-no-absurd)];
2547                 die "only absurd git-apply!\n" if !$use_absurd
2548                     && forceing [qw(import-gitapply-absurd)];
2549
2550                 local $ENV{DGIT_ABSURD_DEBUG} = $debuglevel if $use_absurd;
2551                 local $ENV{PATH} = $path                    if $use_absurd;
2552
2553                 my @showcmd = (gbp_pq, qw(import));
2554                 my @realcmd = shell_cmd
2555                     'exec >/dev/null 2>>../../gbp-pq-output', @showcmd;
2556                 debugcmd "+",@realcmd;
2557                 if (system @realcmd) {
2558                     die f_ "%s failed: %s\n",
2559                         +(shellquote @showcmd),
2560                         failedcmd_waitstatus();
2561                 }
2562
2563                 my $gapplied = git_rev_parse('HEAD');
2564                 my $gappliedtree = cmdoutput @git, qw(rev-parse HEAD:);
2565                 $gappliedtree eq $dappliedtree or
2566                     fail f_ <<END, $gapplied, $gappliedtree, $dappliedtree;
2567 gbp-pq import and dpkg-source disagree!
2568  gbp-pq import gave commit %s
2569  gbp-pq import gave tree %s
2570  dpkg-source --before-build gave tree %s
2571 END
2572                 $rawimport_hash = $gapplied;
2573             };
2574             last unless $@;
2575         }
2576         if ($@) {
2577             { local $@; eval { runcmd qw(cat ../../gbp-pq-output); }; }
2578             die $@;
2579         }
2580     }
2581
2582     progress f_ "synthesised git commit from .dsc %s", $cversion;
2583
2584     my $rawimport_mergeinput = {
2585         Commit => $rawimport_hash,
2586         Info => __ "Import of source package",
2587     };
2588     my @output = ($rawimport_mergeinput);
2589
2590     if ($lastpush_mergeinput) {
2591         my $oldclogp = mergeinfo_getclogp($lastpush_mergeinput);
2592         my $oversion = getfield $oldclogp, 'Version';
2593         my $vcmp =
2594             version_compare($oversion, $cversion);
2595         if ($vcmp < 0) {
2596             @output = ($rawimport_mergeinput, $lastpush_mergeinput,
2597                 { ReverseParents => 1,
2598                   Message => (f_ <<END, $package, $cversion, $csuite) });
2599 Record %s (%s) in archive suite %s
2600 END
2601         } elsif ($vcmp > 0) {
2602             print STDERR f_ <<END, $cversion, $oversion,
2603
2604 Version actually in archive:   %s (older)
2605 Last version pushed with dgit: %s (newer or same)
2606 %s
2607 END
2608                 __ $later_warning_msg or confess $!;
2609             @output = $lastpush_mergeinput;
2610         } else {
2611             # Same version.  Use what's in the server git branch,
2612             # discarding our own import.  (This could happen if the
2613             # server automatically imports all packages into git.)
2614             @output = $lastpush_mergeinput;
2615         }
2616     }
2617     changedir $maindir;
2618     rmtree $playground;
2619     return @output;
2620 }
2621
2622 sub complete_file_from_dsc ($$;$) {
2623     our ($dstdir, $fi, $refetched) = @_;
2624     # Ensures that we have, in $dstdir, the file $fi, with the correct
2625     # contents.  (Downloading it from alongside $dscurl if necessary.)
2626     # If $refetched is defined, can overwrite "$dstdir/$fi->{Filename}"
2627     # and will set $$refetched=1 if it did so (or tried to).
2628
2629     my $f = $fi->{Filename};
2630     my $tf = "$dstdir/$f";
2631     my $downloaded = 0;
2632
2633     my $got;
2634     my $checkhash = sub {
2635         open F, "<", "$tf" or die "$tf: $!";
2636         $fi->{Digester}->reset();
2637         $fi->{Digester}->addfile(*F);
2638         F->error and confess $!;
2639         $got = $fi->{Digester}->hexdigest();
2640         return $got eq $fi->{Hash};
2641     };
2642
2643     if (stat_exists $tf) {
2644         if ($checkhash->()) {
2645             progress f_ "using existing %s", $f;
2646             return 1;
2647         }
2648         if (!$refetched) {
2649             fail f_ "file %s has hash %s but .dsc demands hash %s".
2650                     " (perhaps you should delete this file?)",
2651                     $f, $got, $fi->{Hash};
2652         }
2653         progress f_ "need to fetch correct version of %s", $f;
2654         unlink $tf or die "$tf $!";
2655         $$refetched = 1;
2656     } else {
2657         printdebug "$tf does not exist, need to fetch\n";
2658     }
2659
2660     my $furl = $dscurl;
2661     $furl =~ s{/[^/]+$}{};
2662     $furl .= "/$f";
2663     die "$f ?" unless $f =~ m/^\Q${package}\E_/;
2664     die "$f ?" if $f =~ m#/#;
2665     runcmd_ordryrun_local @curl,qw(-f -o),$tf,'--',"$furl";
2666     return 0 if !act_local();
2667
2668     $checkhash->() or
2669         fail f_ "file %s has hash %s but .dsc demands hash %s".
2670                 " (got wrong file from archive!)",
2671                 $f, $got, $fi->{Hash};
2672
2673     return 1;
2674 }
2675
2676 sub ensure_we_have_orig () {
2677     my @dfi = dsc_files_info();
2678     foreach my $fi (@dfi) {
2679         my $f = $fi->{Filename};
2680         next unless is_orig_file_in_dsc($f, \@dfi);
2681         complete_file_from_dsc($buildproductsdir, $fi)
2682             or next;
2683     }
2684 }
2685
2686 #---------- git fetch ----------
2687
2688 sub lrfetchrefs () { return "refs/dgit-fetch/".access_basedistro(); }
2689 sub lrfetchref () { return lrfetchrefs.'/'.server_branch($csuite); }
2690
2691 # We fetch some parts of lrfetchrefs/*.  Ideally we delete these
2692 # locally fetched refs because they have unhelpful names and clutter
2693 # up gitk etc.  So we track whether we have "used up" head ref (ie,
2694 # whether we have made another local ref which refers to this object).
2695 #
2696 # (If we deleted them unconditionally, then we might end up
2697 # re-fetching the same git objects each time dgit fetch was run.)
2698 #
2699 # So, each use of lrfetchrefs needs to be accompanied by arrangements
2700 # in git_fetch_us to fetch the refs in question, and possibly a call
2701 # to lrfetchref_used.
2702
2703 our (%lrfetchrefs_f, %lrfetchrefs_d);
2704 # $lrfetchrefs_X{lrfetchrefs."/heads/whatever"} = $objid
2705
2706 sub lrfetchref_used ($) {
2707     my ($fullrefname) = @_;
2708     my $objid = $lrfetchrefs_f{$fullrefname};
2709     $lrfetchrefs_d{$fullrefname} = $objid if defined $objid;
2710 }
2711
2712 sub git_lrfetch_sane {
2713     my ($url, $supplementary, @specs) = @_;
2714     # Make a 'refs/'.lrfetchrefs.'/*' be just like on server,
2715     # at least as regards @specs.  Also leave the results in
2716     # %lrfetchrefs_f, and arrange for lrfetchref_used to be
2717     # able to clean these up.
2718     #
2719     # With $supplementary==1, @specs must not contain wildcards
2720     # and we add to our previous fetches (non-atomically).
2721
2722     # This is rather miserable:
2723     # When git fetch --prune is passed a fetchspec ending with a *,
2724     # it does a plausible thing.  If there is no * then:
2725     # - it matches subpaths too, even if the supplied refspec
2726     #   starts refs, and behaves completely madly if the source
2727     #   has refs/refs/something.  (See, for example, Debian #NNNN.)
2728     # - if there is no matching remote ref, it bombs out the whole
2729     #   fetch.
2730     # We want to fetch a fixed ref, and we don't know in advance
2731     # if it exists, so this is not suitable.
2732     #
2733     # Our workaround is to use git ls-remote.  git ls-remote has its
2734     # own qairks.  Notably, it has the absurd multi-tail-matching
2735     # behaviour: git ls-remote R refs/foo can report refs/foo AND
2736     # refs/refs/foo etc.
2737     #
2738     # Also, we want an idempotent snapshot, but we have to make two
2739     # calls to the remote: one to git ls-remote and to git fetch.  The
2740     # solution is use git ls-remote to obtain a target state, and
2741     # git fetch to try to generate it.  If we don't manage to generate
2742     # the target state, we try again.
2743
2744     printdebug "git_lrfetch_sane suppl=$supplementary specs @specs\n";
2745
2746     my $specre = join '|', map {
2747         my $x = $_;
2748         $x =~ s/\W/\\$&/g;
2749         my $wildcard = $x =~ s/\\\*$/.*/;
2750         die if $wildcard && $supplementary;
2751         "(?:refs/$x)";
2752     } @specs;
2753     printdebug "git_lrfetch_sane specre=$specre\n";
2754     my $wanted_rref = sub {
2755         local ($_) = @_;
2756         return m/^(?:$specre)$/;
2757     };
2758
2759     my $fetch_iteration = 0;
2760     FETCH_ITERATION:
2761     for (;;) {
2762         printdebug "git_lrfetch_sane iteration $fetch_iteration\n";
2763         if (++$fetch_iteration > 10) {
2764             fail __ "too many iterations trying to get sane fetch!";
2765         }
2766
2767         my @look = map { "refs/$_" } @specs;
2768         my @lcmd = (@git, qw(ls-remote -q --refs), $url, @look);
2769         debugcmd "|",@lcmd;
2770
2771         my %wantr;
2772         open GITLS, "-|", @lcmd or confess $!;
2773         while (<GITLS>) {
2774             printdebug "=> ", $_;
2775             m/^(\w+)\s+(\S+)\n/ or die "ls-remote $_ ?";
2776             my ($objid,$rrefname) = ($1,$2);
2777             if (!$wanted_rref->($rrefname)) {
2778                 print STDERR f_ <<END, "@look", $rrefname;
2779 warning: git ls-remote %s reported %s; this is silly, ignoring it.
2780 END
2781                 next;
2782             }
2783             $wantr{$rrefname} = $objid;
2784         }
2785         $!=0; $?=0;
2786         close GITLS or failedcmd @lcmd;
2787
2788         # OK, now %want is exactly what we want for refs in @specs
2789         my @fspecs = map {
2790             !m/\*$/ && !exists $wantr{"refs/$_"} ? () :
2791             "+refs/$_:".lrfetchrefs."/$_";
2792         } @specs;
2793
2794         printdebug "git_lrfetch_sane fspecs @fspecs\n";
2795
2796         my @fcmd = (@git, qw(fetch -p -n -q), $url, @fspecs);
2797         runcmd_ordryrun_local @fcmd if @fspecs;
2798
2799         if (!$supplementary) {
2800             %lrfetchrefs_f = ();
2801         }
2802         my %objgot;
2803
2804         git_for_each_ref(lrfetchrefs, sub {
2805             my ($objid,$objtype,$lrefname,$reftail) = @_;
2806             $lrfetchrefs_f{$lrefname} = $objid;
2807             $objgot{$objid} = 1;
2808         });
2809
2810         if ($supplementary) {
2811             last;
2812         }
2813
2814         foreach my $lrefname (sort keys %lrfetchrefs_f) {
2815             my $rrefname = 'refs'.substr($lrefname, length lrfetchrefs);
2816             if (!exists $wantr{$rrefname}) {
2817                 if ($wanted_rref->($rrefname)) {
2818                     printdebug <<END;
2819 git-fetch @fspecs created $lrefname which git ls-remote @look didn't list.
2820 END
2821                 } else {
2822                     print STDERR f_ <<END, "@fspecs", $lrefname
2823 warning: git fetch %s created %s; this is silly, deleting it.
2824 END
2825                 }
2826                 runcmd_ordryrun_local @git, qw(update-ref -d), $lrefname;
2827                 delete $lrfetchrefs_f{$lrefname};
2828                 next;
2829             }
2830         }
2831         foreach my $rrefname (sort keys %wantr) {
2832             my $lrefname = lrfetchrefs.substr($rrefname, 4);
2833             my $got = $lrfetchrefs_f{$lrefname} // '<none>';
2834             my $want = $wantr{$rrefname};
2835             next if $got eq $want;
2836             if (!defined $objgot{$want}) {
2837                 fail __ <<END unless act_local();
2838 --dry-run specified but we actually wanted the results of git fetch,
2839 so this is not going to work.  Try running dgit fetch first,
2840 or using --damp-run instead of --dry-run.
2841 END
2842                 print STDERR f_ <<END, $lrefname, $want;
2843 warning: git ls-remote suggests we want %s
2844 warning:  and it should refer to %s
2845 warning:  but git fetch didn't fetch that object to any relevant ref.
2846 warning:  This may be due to a race with someone updating the server.
2847 warning:  Will try again...
2848 END
2849                 next FETCH_ITERATION;
2850             }
2851             printdebug <<END;
2852 git-fetch @fspecs made $lrefname=$got but want git ls-remote @look says $want
2853 END
2854             runcmd_ordryrun_local @git, qw(update-ref -m),
2855                 "dgit fetch git fetch fixup", $lrefname, $want;
2856             $lrfetchrefs_f{$lrefname} = $want;
2857         }
2858         last;
2859     }
2860
2861     if (defined $csuite) {
2862         printdebug "git_lrfetch_sane: tidying any old suite lrfetchrefs\n";
2863         git_for_each_ref("refs/dgit-fetch/$csuite", sub {
2864             my ($objid,$objtype,$lrefname,$reftail) = @_;
2865             next if $lrfetchrefs_f{$lrefname}; # $csuite eq $distro ?
2866             runcmd_ordryrun_local @git, qw(update-ref -d), $lrefname;
2867         });
2868     }
2869
2870     printdebug "git_lrfetch_sane: git fetch --no-insane emulation complete\n",
2871         Dumper(\%lrfetchrefs_f);
2872 }
2873
2874 sub git_fetch_us () {
2875     # Want to fetch only what we are going to use, unless
2876     # deliberately-not-ff, in which case we must fetch everything.
2877
2878     my @specs = deliberately_not_fast_forward ? qw(tags/*) :
2879         map { "tags/$_" }
2880         (quiltmode_splitbrain
2881          ? (map { $_->('*',access_nomdistro) }
2882             \&debiantag_new, \&debiantag_maintview)
2883          : debiantags('*',access_nomdistro));
2884     push @specs, server_branch($csuite);
2885     push @specs, $rewritemap;
2886     push @specs, qw(heads/*) if deliberately_not_fast_forward;
2887
2888     my $url = access_giturl();
2889     git_lrfetch_sane $url, 0, @specs;
2890
2891     my %here;
2892     my @tagpats = debiantags('*',access_nomdistro);
2893
2894     git_for_each_ref([map { "refs/tags/$_" } @tagpats], sub {
2895         my ($objid,$objtype,$fullrefname,$reftail) = @_;
2896         printdebug "currently $fullrefname=$objid\n";
2897         $here{$fullrefname} = $objid;
2898     });
2899     git_for_each_ref([map { lrfetchrefs."/tags/".$_ } @tagpats], sub {
2900         my ($objid,$objtype,$fullrefname,$reftail) = @_;
2901         my $lref = "refs".substr($fullrefname, length(lrfetchrefs));
2902         printdebug "offered $lref=$objid\n";
2903         if (!defined $here{$lref}) {
2904             my @upd = (@git, qw(update-ref), $lref, $objid, '');
2905             runcmd_ordryrun_local @upd;
2906             lrfetchref_used $fullrefname;
2907         } elsif ($here{$lref} eq $objid) {
2908             lrfetchref_used $fullrefname;
2909         } else {
2910             print STDERR f_ "Not updating %s from %s to %s.\n",
2911                             $lref, $here{$lref}, $objid;
2912         }
2913     });
2914 }
2915
2916 #---------- dsc and archive handling ----------
2917
2918 sub mergeinfo_getclogp ($) {
2919     # Ensures thit $mi->{Clogp} exists and returns it
2920     my ($mi) = @_;
2921     $mi->{Clogp} = commit_getclogp($mi->{Commit});
2922 }
2923
2924 sub mergeinfo_version ($) {
2925     return getfield( (mergeinfo_getclogp $_[0]), 'Version' );
2926 }
2927
2928 sub fetch_from_archive_record_1 ($) {
2929     my ($hash) = @_;
2930     runcmd git_update_ref_cmd "dgit fetch $csuite", 'DGIT_ARCHIVE', $hash;
2931     cmdoutput @git, qw(log -n2), $hash;
2932     # ... gives git a chance to complain if our commit is malformed
2933 }
2934
2935 sub fetch_from_archive_record_2 ($) {
2936     my ($hash) = @_;
2937     my @upd_cmd = (git_update_ref_cmd 'dgit fetch', lrref(), $hash);
2938     if (act_local()) {
2939         cmdoutput @upd_cmd;
2940     } else {
2941         dryrun_report @upd_cmd;
2942     }
2943 }
2944
2945 sub parse_dsc_field_def_dsc_distro () {
2946     $dsc_distro //= cfg qw(dgit.default.old-dsc-distro
2947                            dgit.default.distro);
2948 }
2949
2950 sub parse_dsc_field ($$) {
2951     my ($dsc, $what) = @_;
2952     my $f;
2953     foreach my $field (@ourdscfield) {
2954         $f = $dsc->{$field};
2955         last if defined $f;
2956     }
2957
2958     if (!defined $f) {
2959         progress f_ "%s: NO git hash", $what;
2960         parse_dsc_field_def_dsc_distro();
2961     } elsif (($dsc_hash, $dsc_distro, $dsc_hint_tag, $dsc_hint_url)
2962              = $f =~ m/^(\w+)\s+($distro_re)\s+($versiontag_re)\s+(\S+)(?:\s|$)/) {
2963         progress f_ "%s: specified git info (%s)", $what, $dsc_distro;
2964         $dsc_hint_tag = [ $dsc_hint_tag ];
2965     } elsif ($f =~ m/^\w+\s*$/) {
2966         $dsc_hash = $&;
2967         parse_dsc_field_def_dsc_distro();
2968         $dsc_hint_tag = [ debiantags +(getfield $dsc, 'Version'),
2969                           $dsc_distro ];
2970         progress f_ "%s: specified git hash", $what;
2971     } else {
2972         fail f_ "%s: invalid Dgit info", $what;
2973     }
2974 }
2975
2976 sub resolve_dsc_field_commit ($$) {
2977     my ($already_distro, $already_mapref) = @_;
2978
2979     return unless defined $dsc_hash;
2980
2981     my $mapref =
2982         defined $already_mapref &&
2983         ($already_distro eq $dsc_distro || !$chase_dsc_distro)
2984         ? $already_mapref : undef;
2985
2986     my $do_fetch;
2987     $do_fetch = sub {
2988         my ($what, @fetch) = @_;
2989
2990         local $idistro = $dsc_distro;
2991         my $lrf = lrfetchrefs;
2992
2993         if (!$chase_dsc_distro) {
2994             progress f_ "not chasing .dsc distro %s: not fetching %s",
2995                         $dsc_distro, $what;
2996             return 0;
2997         }
2998
2999         progress f_ ".dsc names distro %s: fetching %s", $dsc_distro, $what;
3000
3001         my $url = access_giturl();
3002         if (!defined $url) {
3003             defined $dsc_hint_url or fail f_ <<END, $dsc_distro;
3004 .dsc Dgit metadata is in context of distro %s
3005 for which we have no configured url and .dsc provides no hint
3006 END
3007             my $proto =
3008                 $dsc_hint_url =~ m#^([-+0-9a-zA-Z]+):# ? $1 :
3009                 $dsc_hint_url =~ m#^/# ? 'file' : 'bad-syntax';
3010             parse_cfg_bool "dsc-url-proto-ok", 'false',
3011                 cfg("dgit.dsc-url-proto-ok.$proto",
3012                     "dgit.default.dsc-url-proto-ok")
3013                 or fail f_ <<END, $dsc_distro, $proto;
3014 .dsc Dgit metadata is in context of distro %s
3015 for which we have no configured url;
3016 .dsc provides hinted url with protocol %s which is unsafe.
3017 (can be overridden by config - consult documentation)
3018 END
3019             $url = $dsc_hint_url;
3020         }
3021
3022         git_lrfetch_sane $url, 1, @fetch;
3023
3024         return $lrf;
3025     };
3026
3027     my $rewrite_enable = do {
3028         local $idistro = $dsc_distro;
3029         access_cfg('rewrite-map-enable', 'RETURN-UNDEF');
3030     };
3031
3032     if (parse_cfg_bool 'rewrite-map-enable', 'true', $rewrite_enable) {
3033         if (!defined $mapref) {
3034             my $lrf = $do_fetch->((__ "rewrite map"), $rewritemap) or return;
3035             $mapref = $lrf.'/'.$rewritemap;
3036         }
3037         my $rewritemapdata = git_cat_file $mapref.':map';
3038         if (defined $rewritemapdata
3039             && $rewritemapdata =~ m/^$dsc_hash(?:[ \t](\w+))/m) {
3040             progress __
3041                 "server's git history rewrite map contains a relevant entry!";
3042
3043             $dsc_hash = $1;
3044             if (defined $dsc_hash) {
3045                 progress __ "using rewritten git hash in place of .dsc value";
3046             } else {
3047                 progress __ "server data says .dsc hash is to be disregarded";
3048             }
3049         }
3050     }
3051
3052     if (!defined git_cat_file $dsc_hash) {
3053         my @tags = map { "tags/".$_ } @$dsc_hint_tag;
3054         my $lrf = $do_fetch->((__ "additional commits"), @tags) &&
3055             defined git_cat_file $dsc_hash
3056             or fail f_ <<END, $dsc_hash;
3057 .dsc Dgit metadata requires commit %s
3058 but we could not obtain that object anywhere.
3059 END
3060         foreach my $t (@tags) {
3061             my $fullrefname = $lrf.'/'.$t;
3062 #           print STDERR "CHK $t $fullrefname ".Dumper(\%lrfetchrefs_f);
3063             next unless $lrfetchrefs_f{$fullrefname};
3064             next unless is_fast_fwd "$fullrefname~0", $dsc_hash;
3065             lrfetchref_used $fullrefname;
3066         }
3067     }
3068 }
3069
3070 sub fetch_from_archive () {
3071     check_bpd_exists();
3072     ensure_setup_existing_tree();
3073
3074     # Ensures that lrref() is what is actually in the archive, one way
3075     # or another, according to us - ie this client's
3076     # appropritaely-updated archive view.  Also returns the commit id.
3077     # If there is nothing in the archive, leaves lrref alone and
3078     # returns undef.  git_fetch_us must have already been called.
3079     get_archive_dsc();
3080
3081     if ($dsc) {
3082         parse_dsc_field($dsc, __ 'last upload to archive');
3083         resolve_dsc_field_commit access_basedistro,
3084             lrfetchrefs."/".$rewritemap
3085     } else {
3086         progress __ "no version available from the archive";
3087     }
3088
3089     # If the archive's .dsc has a Dgit field, there are three
3090     # relevant git commitids we need to choose between and/or merge
3091     # together:
3092     #   1. $dsc_hash: the Dgit field from the archive
3093     #   2. $lastpush_hash: the suite branch on the dgit git server
3094     #   3. $lastfetch_hash: our local tracking brach for the suite
3095     #
3096     # These may all be distinct and need not be in any fast forward
3097     # relationship:
3098     #
3099     # If the dsc was pushed to this suite, then the server suite
3100     # branch will have been updated; but it might have been pushed to
3101     # a different suite and copied by the archive.  Conversely a more
3102     # recent version may have been pushed with dgit but not appeared
3103     # in the archive (yet).
3104     #
3105     # $lastfetch_hash may be awkward because archive imports
3106     # (particularly, imports of Dgit-less .dscs) are performed only as
3107     # needed on individual clients, so different clients may perform a
3108     # different subset of them - and these imports are only made
3109     # public during push.  So $lastfetch_hash may represent a set of
3110     # imports different to a subsequent upload by a different dgit
3111     # client.
3112     #
3113     # Our approach is as follows:
3114     #
3115     # As between $dsc_hash and $lastpush_hash: if $lastpush_hash is a
3116     # descendant of $dsc_hash, then it was pushed by a dgit user who
3117     # had based their work on $dsc_hash, so we should prefer it.
3118     # Otherwise, $dsc_hash was installed into this suite in the
3119     # archive other than by a dgit push, and (necessarily) after the
3120     # last dgit push into that suite (since a dgit push would have
3121     # been descended from the dgit server git branch); thus, in that
3122     # case, we prefer the archive's version (and produce a
3123     # pseudo-merge to overwrite the dgit server git branch).
3124     #
3125     # (If there is no Dgit field in the archive's .dsc then
3126     # generate_commit_from_dsc uses the version numbers to decide
3127     # whether the suite branch or the archive is newer.  If the suite
3128     # branch is newer it ignores the archive's .dsc; otherwise it
3129     # generates an import of the .dsc, and produces a pseudo-merge to
3130     # overwrite the suite branch with the archive contents.)
3131     #
3132     # The outcome of that part of the algorithm is the `public view',
3133     # and is same for all dgit clients: it does not depend on any
3134     # unpublished history in the local tracking branch.
3135     #
3136     # As between the public view and the local tracking branch: The
3137     # local tracking branch is only updated by dgit fetch, and
3138     # whenever dgit fetch runs it includes the public view in the
3139     # local tracking branch.  Therefore if the public view is not
3140     # descended from the local tracking branch, the local tracking
3141     # branch must contain history which was imported from the archive
3142     # but never pushed; and, its tip is now out of date.  So, we make
3143     # a pseudo-merge to overwrite the old imports and stitch the old
3144     # history in.
3145     #
3146     # Finally: we do not necessarily reify the public view (as
3147     # described above).  This is so that we do not end up stacking two
3148     # pseudo-merges.  So what we actually do is figure out the inputs
3149     # to any public view pseudo-merge and put them in @mergeinputs.
3150
3151     my @mergeinputs;
3152     # $mergeinputs[]{Commit}
3153     # $mergeinputs[]{Info}
3154     # $mergeinputs[0] is the one whose tree we use
3155     # @mergeinputs is in the order we use in the actual commit)
3156     #
3157     # Also:
3158     # $mergeinputs[]{Message} is a commit message to use
3159     # $mergeinputs[]{ReverseParents} if def specifies that parent
3160     #                                list should be in opposite order
3161     # Such an entry has no Commit or Info.  It applies only when found
3162     # in the last entry.  (This ugliness is to support making
3163     # identical imports to previous dgit versions.)
3164
3165     my $lastpush_hash = git_get_ref(lrfetchref());
3166     printdebug "previous reference hash=$lastpush_hash\n";
3167     $lastpush_mergeinput = $lastpush_hash && {
3168         Commit => $lastpush_hash,
3169         Info => (__ "dgit suite branch on dgit git server"),
3170     };
3171
3172     my $lastfetch_hash = git_get_ref(lrref());
3173     printdebug "fetch_from_archive: lastfetch=$lastfetch_hash\n";
3174     my $lastfetch_mergeinput = $lastfetch_hash && {
3175         Commit => $lastfetch_hash,
3176         Info => (__ "dgit client's archive history view"),
3177     };
3178
3179     my $dsc_mergeinput = $dsc_hash && {
3180         Commit => $dsc_hash,
3181         Info => (__ "Dgit field in .dsc from archive"),
3182     };
3183
3184     my $cwd = getcwd();
3185     my $del_lrfetchrefs = sub {
3186         changedir $cwd;
3187         my $gur;
3188         printdebug "del_lrfetchrefs...\n";
3189         foreach my $fullrefname (sort keys %lrfetchrefs_d) {
3190             my $objid = $lrfetchrefs_d{$fullrefname};
3191             printdebug "del_lrfetchrefs: $objid $fullrefname\n";
3192             if (!$gur) {
3193                 $gur ||= new IO::Handle;
3194                 open $gur, "|-", qw(git update-ref --stdin) or confess $!;
3195             }
3196             printf $gur "delete %s %s\n", $fullrefname, $objid;
3197         }
3198         if ($gur) {
3199             close $gur or failedcmd "git update-ref delete lrfetchrefs";
3200         }
3201     };
3202
3203     if (defined $dsc_hash) {
3204         ensure_we_have_orig();
3205         if (!$lastpush_hash || $dsc_hash eq $lastpush_hash) {
3206             @mergeinputs = $dsc_mergeinput
3207         } elsif (is_fast_fwd($dsc_hash,$lastpush_hash)) {
3208             print STDERR f_ <<END, $dsc_hash, $lastpush_hash,
3209
3210 Git commit in archive is behind the last version allegedly pushed/uploaded.
3211 Commit referred to by archive: %s
3212 Last version pushed with dgit: %s
3213 %s
3214 END
3215                 __ $later_warning_msg or confess $!;
3216             @mergeinputs = ($lastpush_mergeinput);
3217         } else {
3218             # Archive has .dsc which is not a descendant of the last dgit
3219             # push.  This can happen if the archive moves .dscs about.
3220             # Just follow its lead.
3221             if (is_fast_fwd($lastpush_hash,$dsc_hash)) {
3222                 progress __ "archive .dsc names newer git commit";
3223                 @mergeinputs = ($dsc_mergeinput);
3224             } else {
3225                 progress __ "archive .dsc names other git commit, fixing up";
3226                 @mergeinputs = ($dsc_mergeinput, $lastpush_mergeinput);
3227             }
3228         }
3229     } elsif ($dsc) {
3230         @mergeinputs = generate_commits_from_dsc();
3231         # We have just done an import.  Now, our import algorithm might
3232         # have been improved.  But even so we do not want to generate
3233         # a new different import of the same package.  So if the
3234         # version numbers are the same, just use our existing version.
3235         # If the version numbers are different, the archive has changed
3236         # (perhaps, rewound).
3237         if ($lastfetch_mergeinput &&
3238             !version_compare( (mergeinfo_version $lastfetch_mergeinput),
3239                               (mergeinfo_version $mergeinputs[0]) )) {
3240             @mergeinputs = ($lastfetch_mergeinput);
3241         }
3242     } elsif ($lastpush_hash) {
3243         # only in git, not in the archive yet
3244         @mergeinputs = ($lastpush_mergeinput);
3245         print STDERR f_ <<END,
3246
3247 Package not found in the archive, but has allegedly been pushed using dgit.
3248 %s
3249 END
3250             __ $later_warning_msg or confess $!;
3251     } else {
3252         printdebug "nothing found!\n";
3253         if (defined $skew_warning_vsn) {
3254             print STDERR f_ <<END, $skew_warning_vsn or confess $!;
3255
3256 Warning: relevant archive skew detected.
3257 Archive allegedly contains %s
3258 But we were not able to obtain any version from the archive or git.
3259
3260 END
3261         }
3262         unshift @end, $del_lrfetchrefs;
3263         return undef;
3264     }
3265
3266     if ($lastfetch_hash &&
3267         !grep {
3268             my $h = $_->{Commit};
3269             $h and is_fast_fwd($lastfetch_hash, $h);
3270             # If true, one of the existing parents of this commit
3271             # is a descendant of the $lastfetch_hash, so we'll
3272             # be ff from that automatically.
3273         } @mergeinputs
3274         ) {
3275         # Otherwise:
3276         push @mergeinputs, $lastfetch_mergeinput;
3277     }
3278
3279     printdebug "fetch mergeinfos:\n";
3280     foreach my $mi (@mergeinputs) {
3281         if ($mi->{Info}) {
3282             printdebug " commit $mi->{Commit} $mi->{Info}\n";
3283         } else {
3284             printdebug sprintf " ReverseParents=%d Message=%s",
3285                 $mi->{ReverseParents}, $mi->{Message};
3286         }
3287     }
3288
3289     my $compat_info= pop @mergeinputs
3290         if $mergeinputs[$#mergeinputs]{Message};
3291
3292     @mergeinputs = grep { defined $_->{Commit} } @mergeinputs;
3293
3294     my $hash;
3295     if (@mergeinputs > 1) {
3296         # here we go, then:
3297         my $tree_commit = $mergeinputs[0]{Commit};
3298
3299         my $tree = get_tree_of_commit $tree_commit;;
3300
3301         # We use the changelog author of the package in question the
3302         # author of this pseudo-merge.  This is (roughly) correct if
3303         # this commit is simply representing aa non-dgit upload.
3304         # (Roughly because it does not record sponsorship - but we
3305         # don't have sponsorship info because that's in the .changes,
3306         # which isn't in the archivw.)
3307         #
3308         # But, it might be that we are representing archive history
3309         # updates (including in-archive copies).  These are not really
3310         # the responsibility of the person who created the .dsc, but
3311         # there is no-one whose name we should better use.  (The
3312         # author of the .dsc-named commit is clearly worse.)
3313
3314         my $useclogp = mergeinfo_getclogp $mergeinputs[0];
3315         my $author = clogp_authline $useclogp;
3316         my $cversion = getfield $useclogp, 'Version';
3317
3318         my $mcf = dgit_privdir()."/mergecommit";
3319         open MC, ">", $mcf or die "$mcf $!";
3320         print MC <<END or confess $!;
3321 tree $tree
3322 END
3323
3324         my @parents = grep { $_->{Commit} } @mergeinputs;
3325         @parents = reverse @parents if $compat_info->{ReverseParents};
3326         print MC <<END or confess $! foreach @parents;
3327 parent $_->{Commit}
3328 END
3329
3330         print MC <<END or confess $!;
3331 author $author
3332 committer $author
3333
3334 END
3335
3336         if (defined $compat_info->{Message}) {
3337             print MC $compat_info->{Message} or confess $!;
3338         } else {
3339             print MC f_ <<END, $package, $cversion, $csuite or confess $!;
3340 Record %s (%s) in archive suite %s
3341
3342 Record that
3343 END
3344             my $message_add_info = sub {
3345                 my ($mi) = (@_);
3346                 my $mversion = mergeinfo_version $mi;
3347                 printf MC "  %-20s %s\n", $mversion, $mi->{Info}
3348                     or confess $!;
3349             };
3350
3351             $message_add_info->($mergeinputs[0]);
3352             print MC __ <<END or confess $!;
3353 should be treated as descended from
3354 END
3355             $message_add_info->($_) foreach @mergeinputs[1..$#mergeinputs];
3356         }
3357
3358         close MC or confess $!;
3359         $hash = make_commit $mcf;
3360     } else {
3361         $hash = $mergeinputs[0]{Commit};
3362     }
3363     printdebug "fetch hash=$hash\n";
3364
3365     my $chkff = sub {
3366         my ($lasth, $what) = @_;
3367         return unless $lasth;
3368         confess "$lasth $hash $what ?" unless is_fast_fwd($lasth, $hash);
3369     };
3370
3371     $chkff->($lastpush_hash, __ 'dgit repo server tip (last push)')
3372         if $lastpush_hash;
3373     $chkff->($lastfetch_hash, __ 'local tracking tip (last fetch)');
3374
3375     fetch_from_archive_record_1($hash);
3376
3377     if (defined $skew_warning_vsn) {
3378         printdebug "SKEW CHECK WANT $skew_warning_vsn\n";
3379         my $gotclogp = commit_getclogp($hash);
3380         my $got_vsn = getfield $gotclogp, 'Version';
3381         printdebug "SKEW CHECK GOT $got_vsn\n";
3382         if (version_compare($got_vsn, $skew_warning_vsn) < 0) {
3383             print STDERR f_ <<END, $skew_warning_vsn, $got_vsn or confess $!;
3384
3385 Warning: archive skew detected.  Using the available version:
3386 Archive allegedly contains    %s
3387 We were able to obtain only   %s
3388
3389 END
3390         }
3391     }
3392
3393     if ($lastfetch_hash ne $hash) {
3394         fetch_from_archive_record_2($hash);
3395     }
3396
3397     lrfetchref_used lrfetchref();
3398
3399     check_gitattrs($hash, __ "fetched source tree");
3400
3401     unshift @end, $del_lrfetchrefs;
3402     return $hash;
3403 }
3404
3405 sub set_local_git_config ($$) {
3406     my ($k, $v) = @_;
3407     runcmd @git, qw(config), $k, $v;
3408 }
3409
3410 sub setup_mergechangelogs (;$) {
3411     my ($always) = @_;
3412     return unless $always || access_cfg_bool(1, 'setup-mergechangelogs');
3413
3414     my $driver = 'dpkg-mergechangelogs';
3415     my $cb = "merge.$driver";
3416     confess unless defined $maindir;
3417     my $attrs = "$maindir_gitcommon/info/attributes";
3418     ensuredir "$maindir_gitcommon/info";
3419
3420     open NATTRS, ">", "$attrs.new" or die "$attrs.new $!";
3421     if (!open ATTRS, "<", $attrs) {
3422         $!==ENOENT or die "$attrs: $!";
3423     } else {
3424         while (<ATTRS>) {
3425             chomp;
3426             next if m{^debian/changelog\s};
3427             print NATTRS $_, "\n" or confess $!;
3428         }
3429         ATTRS->error and confess $!;
3430         close ATTRS;
3431     }
3432     print NATTRS "debian/changelog merge=$driver\n" or confess $!;
3433     close NATTRS;
3434
3435     set_local_git_config "$cb.name", __ 'debian/changelog merge driver';
3436     set_local_git_config "$cb.driver", 'dpkg-mergechangelogs -m %O %A %B %A';
3437
3438     rename "$attrs.new", "$attrs" or die "$attrs: $!";
3439 }
3440
3441 sub setup_useremail (;$) {
3442     my ($always) = @_;
3443     return unless $always || access_cfg_bool(1, 'setup-useremail');
3444
3445     my $setup = sub {
3446         my ($k, $envvar) = @_;
3447         my $v = access_cfg("user-$k", 'RETURN-UNDEF') // $ENV{$envvar};
3448         return unless defined $v;
3449         set_local_git_config "user.$k", $v;
3450     };
3451
3452     $setup->('email', 'DEBEMAIL');
3453     $setup->('name', 'DEBFULLNAME');
3454 }
3455
3456 sub ensure_setup_existing_tree () {
3457     my $k = "remote.$remotename.skipdefaultupdate";
3458     my $c = git_get_config $k;
3459     return if defined $c;
3460     set_local_git_config $k, 'true';
3461 }
3462
3463 sub open_main_gitattrs () {
3464     confess 'internal error no maindir' unless defined $maindir;
3465     my $gai = new IO::File "$maindir_gitcommon/info/attributes"
3466         or $!==ENOENT
3467         or die "open $maindir_gitcommon/info/attributes: $!";
3468     return $gai;
3469 }
3470
3471 our $gitattrs_ourmacro_re = qr{^\[attr\]dgit-defuse-attrs\s};
3472
3473 sub is_gitattrs_setup () {
3474     # return values:
3475     #  trueish
3476     #     1: gitattributes set up and should be left alone
3477     #  falseish
3478     #     0: there is a dgit-defuse-attrs but it needs fixing
3479     #     undef: there is none
3480     my $gai = open_main_gitattrs();
3481     return 0 unless $gai;
3482     while (<$gai>) {
3483         next unless m{$gitattrs_ourmacro_re};
3484         return 1 if m{\s-working-tree-encoding\s};
3485         printdebug "is_gitattrs_setup: found old macro\n";
3486         return 0;
3487     }
3488     $gai->error and confess $!;
3489     printdebug "is_gitattrs_setup: found nothing\n";
3490     return undef;
3491 }    
3492
3493 sub setup_gitattrs (;$) {
3494     my ($always) = @_;
3495     return unless $always || access_cfg_bool(1, 'setup-gitattributes');
3496
3497     my $already = is_gitattrs_setup();
3498     if ($already) {
3499         progress __ <<END;
3500 [attr]dgit-defuse-attrs already found, and proper, in .git/info/attributes
3501  not doing further gitattributes setup
3502 END
3503         return;
3504     }
3505     my $new = "[attr]dgit-defuse-attrs  $negate_harmful_gitattrs";
3506     my $af = "$maindir_gitcommon/info/attributes";
3507     ensuredir "$maindir_gitcommon/info";
3508
3509     open GAO, "> $af.new" or confess $!;
3510     print GAO <<END, __ <<ENDT or confess $! unless defined $already;
3511 *       dgit-defuse-attrs
3512 $new
3513 END
3514 # ^ see GITATTRIBUTES in dgit(7) and dgit setup-new-tree in dgit(1)
3515 ENDT
3516     my $gai = open_main_gitattrs();
3517     if ($gai) {
3518         while (<$gai>) {
3519             if (m{$gitattrs_ourmacro_re}) {
3520                 die unless defined $already;
3521                 $_ = $new;
3522             }
3523             chomp;
3524             print GAO $_, "\n" or confess $!;
3525         }
3526         $gai->error and confess $!;
3527     }
3528     close GAO or confess $!;
3529     rename "$af.new", "$af" or fail f_ "install %s: %s", $af, $!;
3530 }
3531
3532 sub setup_new_tree () {
3533     setup_mergechangelogs();
3534     setup_useremail();
3535     setup_gitattrs();
3536 }
3537
3538 sub check_gitattrs ($$) {
3539     my ($treeish, $what) = @_;
3540
3541     return if is_gitattrs_setup;
3542
3543     local $/="\0";
3544     my @cmd = (@git, qw(ls-tree -lrz --), "${treeish}:");
3545     debugcmd "|",@cmd;
3546     my $gafl = new IO::File;
3547     open $gafl, "-|", @cmd or confess $!;
3548     while (<$gafl>) {
3549         chomp or die;
3550         s/^\d+\s+\w+\s+\w+\s+(\d+)\t// or die;
3551         next if $1 == 0;
3552         next unless m{(?:^|/)\.gitattributes$};
3553
3554         # oh dear, found one
3555         print STDERR f_ <<END, $what;
3556 dgit: warning: %s contains .gitattributes
3557 dgit: .gitattributes not (fully) defused.  Recommended: dgit setup-new-tree.
3558 END
3559         close $gafl;
3560         return;
3561     }
3562     # tree contains no .gitattributes files
3563     $?=0; $!=0; close $gafl or failedcmd @cmd;
3564 }
3565
3566
3567 sub multisuite_suite_child ($$$) {
3568     my ($tsuite, $mergeinputs, $fn) = @_;
3569     # in child, sets things up, calls $fn->(), and returns undef
3570     # in parent, returns canonical suite name for $tsuite
3571     my $canonsuitefh = IO::File::new_tmpfile;
3572     my $pid = fork // confess $!;
3573     if (!$pid) {
3574         forkcheck_setup();
3575         $isuite = $tsuite;
3576         $us .= " [$isuite]";
3577         $debugprefix .= " ";
3578         progress f_ "fetching %s...", $tsuite;
3579         canonicalise_suite();
3580         print $canonsuitefh $csuite, "\n" or confess $!;
3581         close $canonsuitefh or confess $!;
3582         $fn->();
3583         return undef;
3584     }
3585     waitpid $pid,0 == $pid or confess $!;
3586     fail f_ "failed to obtain %s: %s", $tsuite, waitstatusmsg()
3587         if $? && $?!=256*4;
3588     seek $canonsuitefh,0,0 or confess $!;
3589     local $csuite = <$canonsuitefh>;
3590     confess $! unless defined $csuite && chomp $csuite;
3591     if ($? == 256*4) {
3592         printdebug "multisuite $tsuite missing\n";
3593         return $csuite;
3594     }
3595     printdebug "multisuite $tsuite ok (canon=$csuite)\n";
3596     push @$mergeinputs, {
3597         Ref => lrref,
3598         Info => $csuite,
3599     };
3600     return $csuite;
3601 }
3602
3603 sub fork_for_multisuite ($) {
3604     my ($before_fetch_merge) = @_;
3605     # if nothing unusual, just returns ''
3606     #
3607     # if multisuite:
3608     # returns 0 to caller in child, to do first of the specified suites
3609     # in child, $csuite is not yet set
3610     #
3611     # returns 1 to caller in parent, to finish up anything needed after
3612     # in parent, $csuite is set to canonicalised portmanteau
3613
3614     my $org_isuite = $isuite;
3615     my @suites = split /\,/, $isuite;
3616     return '' unless @suites > 1;
3617     printdebug "fork_for_multisuite: @suites\n";
3618
3619     my @mergeinputs;
3620
3621     my $cbasesuite = multisuite_suite_child($suites[0], \@mergeinputs,
3622                                             sub { });
3623     return 0 unless defined $cbasesuite;
3624
3625     fail f_ "package %s missing in (base suite) %s", $package, $cbasesuite
3626         unless @mergeinputs;
3627
3628     my @csuites = ($cbasesuite);
3629
3630     $before_fetch_merge->();
3631
3632     foreach my $tsuite (@suites[1..$#suites]) {
3633         $tsuite =~ s/^-/$cbasesuite-/;
3634         my $csubsuite = multisuite_suite_child($tsuite, \@mergeinputs,
3635                                                sub {
3636             @end = ();
3637             fetch_one();
3638             finish 0;
3639         });
3640
3641         $csubsuite =~ s/^\Q$cbasesuite\E-/-/;
3642         push @csuites, $csubsuite;
3643     }
3644
3645     foreach my $mi (@mergeinputs) {
3646         my $ref = git_get_ref $mi->{Ref};
3647         die "$mi->{Ref} ?" unless length $ref;
3648         $mi->{Commit} = $ref;
3649     }
3650
3651     $csuite = join ",", @csuites;
3652
3653     my $previous = git_get_ref lrref;
3654     if ($previous) {
3655         unshift @mergeinputs, {
3656             Commit => $previous,
3657             Info => (__ "local combined tracking branch"),
3658             Warning => (__
3659  "archive seems to have rewound: local tracking branch is ahead!"),
3660         };
3661     }
3662
3663     foreach my $ix (0..$#mergeinputs) {
3664         $mergeinputs[$ix]{Index} = $ix;
3665     }
3666
3667     @mergeinputs = sort {
3668         -version_compare(mergeinfo_version $a,
3669                          mergeinfo_version $b) # highest version first
3670             or
3671         $a->{Index} <=> $b->{Index}; # earliest in spec first
3672     } @mergeinputs;
3673
3674     my @needed;
3675
3676   NEEDED:
3677     foreach my $mi (@mergeinputs) {
3678         printdebug "multisuite merge check $mi->{Info}\n";
3679         foreach my $previous (@needed) {
3680             next unless is_fast_fwd $mi->{Commit}, $previous->{Commit};
3681             printdebug "multisuite merge un-needed $previous->{Info}\n";
3682             next NEEDED;
3683         }
3684         push @needed, $mi;
3685         printdebug "multisuite