chiark / gitweb /
mkm3u: Further improve the debugging for filename parsing.
[epls] / mkm3u
1 #! /usr/bin/python3
2 ### -*- mode: python; coding: utf-8 -*-
3
4 from contextlib import contextmanager
5 import optparse as OP
6 import os as OS
7 import re as RX
8 import sys as SYS
9
10 class ExpectedError (Exception): pass
11
12 @contextmanager
13 def location(loc):
14   global LOC
15   old, LOC = LOC, loc
16   yield loc
17   LOC = old
18
19 def filter(value, func = None, dflt = None):
20   if value is None: return dflt
21   elif func is None: return value
22   else: return func(value)
23
24 def check(cond, msg):
25   if not cond: raise ExpectedError(msg)
26
27 def lookup(dict, key, msg):
28   try: return dict[key]
29   except KeyError: raise ExpectedError(msg)
30
31 def forget(dict, key):
32   try: del dict[key]
33   except KeyError: pass
34
35 def getint(s):
36   if not s.isdigit(): raise ExpectedError("bad integer `%s'" % s)
37   return int(s)
38
39 class Words (object):
40   def __init__(me, s):
41     me._s = s
42     me._i, me._n = 0, len(s)
43   def _wordstart(me):
44     s, i, n = me._s, me._i, me._n
45     while i < n:
46       if not s[i].isspace(): return i
47       i += 1
48     return -1
49   def nextword(me):
50     s, n = me._s, me._n
51     begin = i = me._wordstart()
52     if begin < 0: return None
53     while i < n and not s[i].isspace(): i += 1
54     me._i = i
55     return s[begin:i]
56   def rest(me):
57     s, n = me._s, me._n
58     begin = me._wordstart()
59     if begin < 0: return None
60     else: return s[begin:].rstrip()
61
62 URL_SAFE_P = 256*[False]
63 for ch in \
64     b"ABCDEFGHIJKLMNOPQRSTUVWXYZ" \
65     b"abcdefghijklmnopqrstuvwxyz" \
66     b"0123456789" b"!$%-.,/":
67   URL_SAFE_P[ch] = True
68 def urlencode(s):
69   return "".join((URL_SAFE_P[ch] and chr(ch) or "%%%02x" % ch
70                   for ch in s.encode("UTF-8")))
71
72 PROG = OS.path.basename(SYS.argv[0])
73
74 class BaseLocation (object):
75   def report(me, exc):
76     SYS.stderr.write("%s: %s%s\n" % (PROG, me._loc(), exc))
77
78 class DummyLocation (BaseLocation):
79   def _loc(me): return ""
80
81 class FileLocation (BaseLocation):
82   def __init__(me, fn, lno = 1): me._fn, me._lno = fn, lno
83   def _loc(me): return "%s:%d: " % (me._fn, me._lno)
84   def stepline(me): me._lno += 1
85
86 LOC = DummyLocation()
87
88 class Source (object):
89   PREFIX = ""
90   TITLEP = CHAPTERP = False
91   def __init__(me, fn):
92     me.fn = fn
93     me.neps = None
94     me.used_titles = dict()
95     me.used_chapters = set()
96     me.nuses = 0
97   def url(me, title = None, start_chapter = None, end_chapter = None):
98     if title == "-":
99       if me.TITLEP: raise ExpectedError("missing title number")
100       if start_chapter is not None or end_chapter is not None:
101         raise ExpectedError("can't specify chapter without title")
102       suffix = ""
103     elif not me.TITLEP:
104       raise ExpectedError("can't specify title with `%s'" % me.fn)
105     elif start_chapter is None:
106       if end_chapter is not None:
107         raise ExpectedError("can't specify end chapter without start chapter")
108       suffix = "#%d" % title
109     elif not me.CHAPTERP:
110       raise ExpectedError("can't specify chapter with `%s'" % me.fn)
111     elif end_chapter is None:
112       suffix = "#%d:%d" % (title, start_chapter)
113     else:
114       suffix = "#%d:%d-%d:%d" % (title, start_chapter, title, end_chapter - 1)
115     if end_chapter is not None:
116       keys = [(title, ch) for ch in range(start_chapter, end_chapter)]
117       set = me.used_chapters
118     else:
119       keys, set = [title], me.used_titles
120     for k in keys:
121       if k in set:
122         if title == "-":
123           raise ExpectedError("`%s' already used" % me.fn)
124         elif end_chapter is None:
125           raise ExpectedError("`%s' title %d already used" % (me.fn, title))
126         else:
127           raise ExpectedError("`%s' title %d chapter %d already used" %
128                               (me.fn, title, k[1]))
129     if end_chapter is not None:
130       for ch in range(start_chapter, end_chapter):
131         me.used_chapters.add((title, ch))
132     return me.PREFIX + ROOT + urlencode(me.fn) + suffix
133
134 class VideoDisc (Source):
135   PREFIX = "dvd://"
136   TITLEP = CHAPTERP = True
137
138   def __init__(me, fn, *args, **kw):
139     super().__init__(fn, *args, **kw)
140     me.neps = 0
141
142 class VideoSeason (object):
143   def __init__(me, i, title):
144     me.i = i
145     me.title = title
146     me.episodes = {}
147   def set_episode_disc(me, i, disc):
148     if i in me.episodes:
149       raise ExpectedError("season %d episode %d already taken" % (me.i, i))
150     me.episodes[i] = disc; disc.neps += 1
151
152 def some_group(m, *gg):
153   for g in gg:
154     s = m.group(g)
155     if s is not None: return s
156   return None
157
158 class VideoDir (object):
159
160   _R_ISO_PRE = RX.compile(r""" ^
161         (?: S (?P<si> \d+)
162               (?: \. \ (?P<st> .*) — (?: D \d+ \. \ )? |
163                   D \d+ \. \ |
164                   (?= E \d+ \. \ ) |
165                   \. \ ) |
166             \d+ \. \ )
167         (?: (?P<eplist>
168              (?: S \d+ \ )? E \d+ (?: – \d+)?
169              (?: , \ (?: S \d+ \ )? E \d+ (?: – \d+)?)*) |
170             (?P<epname> E \d+) \. \ .*)
171         \. iso $
172   """, RX.X)
173
174   _R_ISO_EP = RX.compile(r""" ^
175         (?: S (?P<si> \d+) \ )?
176         E (?P<ei> \d+) (?: – (?P<ej> \d+))? $
177   """, RX.X)
178
179   def __init__(me, dir):
180     me.dir = dir
181     fns = OS.listdir(OS.path.join(ROOT, dir))
182     fns.sort()
183     season = None
184     seasons = {}
185     for fn in fns:
186       path = OS.path.join(dir, fn)
187       if not fn.endswith(".iso"): continue
188       m = me._R_ISO_PRE.match(fn)
189       if not m:
190         #print(";; `%s' ignored (regex mismatch)" % path, file = SYS.stderr)
191         continue
192
193       i = filter(m.group("si"), int)
194       stitle = m.group("st")
195       check(i is not None or stitle is None,
196             "explicit season title without number in `%s'" % fn)
197       if i is not None:
198         if season is None or i != season.i:
199           check(season is None or i == season.i + 1,
200                 "season %d /= %d" %
201                   (i, season is None and -1 or season.i + 1))
202           check(i not in seasons, "season %d already seen" % i)
203           seasons[i] = season = VideoSeason(i, stitle)
204         else:
205           check(stitle == season.title,
206                 "season title `%s' /= `%s'" % (stitle, season.title))
207
208       disc = VideoDisc(path)
209       ts = season
210       any, bad = False, False
211       epname = m.group("epname")
212       if epname is not None: eplist = [epname]
213       else: eplist = m.group("eplist").split(", ")
214       #print(";; `%s'" % path, file = SYS.stderr)
215       for eprange in eplist:
216         mm = me._R_ISO_EP.match(eprange)
217         if mm is None:
218           #print(";;\t`%s'?" % eprange, file = SYS.stderr)
219           bad = True; continue
220         if not any: any = True
221         i = filter(mm.group("si"), int)
222         if i is not None:
223           try: ts = seasons[i]
224           except KeyError: ts = seasons[i] = VideoSeason(i, None)
225         if ts is None:
226           ts = season = seasons[1] = VideoSeason(1, None)
227         start = filter(mm.group("ei"), int)
228         end = filter(mm.group("ej"), int, start)
229         for k in range(start, end + 1):
230           ts.set_episode_disc(k, disc)
231           #print(";;\tepisode %d.%d" % (ts.i, k), file = SYS.stderr)
232       if not any:
233         #print(";;\tignored" % path, file = SYS.stderr)
234         pass
235       elif bad:
236         raise ExpectedError("bad ep list in `%s'", fn)
237     me.seasons = seasons
238
239 class AudioDisc (Source):
240   PREFIX = "file://"
241   TITLEP = CHAPTERP = False
242
243 class AudioEpisode (Source):
244   PREFIX = "file://"
245   TITLEP = CHAPTERP = False
246   def __init__(me, fn, i, *args, **kw):
247     super().__init__(fn, *args, **kw)
248     me.i = i
249
250 class AudioDir (object):
251
252   _R_FLAC = RX.compile(r""" ^
253           E (\d+)
254           (?: \. \ (.*))?
255           \. flac $
256   """, RX.X)
257
258   def __init__(me, dir):
259     me.dir = dir
260     fns = OS.listdir(OS.path.join(ROOT, dir))
261     fns.sort()
262     episodes = {}
263     last_i = 0
264     for fn in fns:
265       path = OS.path.join(dir, fn)
266       if not fn.endswith(".flac"): continue
267       m = me._R_FLAC.match(fn)
268       if not m: continue
269       i = filter(m.group(1), int)
270       etitle = m.group(2)
271       check(i == last_i + 1, "episode %d /= %d" % (i, last_i + 1))
272       episodes[i] = AudioEpisode(path, i)
273       last_i = i
274     me.episodes = episodes
275
276 class Chapter (object):
277   def __init__(me, episode, title, i):
278     me.title, me.i = title, i
279     me.url = episode.source.url(episode.tno, i, i + 1)
280
281 class Episode (object):
282   def __init__(me, season, i, neps, title, src, tno = None, startch = None):
283     me.season = season
284     me.i, me.neps, me.title = i, neps, title
285     me.chapters = []
286     me.source, me.tno = src, tno
287     me.url = src.url(tno, startch, None)
288   def add_chapter(me, title, j):
289     ch = Chapter(me, title, j)
290     me.chapters.append(ch)
291     return ch
292   def label(me):
293     return me.season._eplabel(me.i, me.neps, me.title)
294
295 class BaseSeason (object):
296   def __init__(me, series, implicitp = False):
297     me.series = series
298     me.episodes = []
299     me.implicitp = implicitp
300     me.ep_i, episodes = 1, []
301   def add_episode(me, j, neps, title, src, tno, startch):
302     ep = Episode(me, j, neps, title, src, tno, startch)
303     me.episodes.append(ep)
304     src.nuses += neps; me.ep_i += neps
305     return ep
306   def _epnames(me, i, neps):
307     playlist = me.series.playlist
308     if neps == 1: return playlist.epname, "%d" % i
309     elif neps == 2: return playlist.epnames, "%d, %d" % (i, i + 1)
310     else: return playlist.epnames, "%d–%d" % (i, i + neps - 1)
311
312 class Season (BaseSeason):
313   def __init__(me, series, title, i, *args, **kw):
314     super().__init__(series, *args, **kw)
315     me.title, me.i = title, i
316   def _eplabel(me, i, neps, title):
317     epname, epn = me._epnames(i, neps)
318     if title is None:
319       if me.implicitp: label = "%s %s" % (epname, epn)
320       elif me.title is None: label = "%s %d.%s" % (epname, me.i, epn)
321       else: label = "%s—%s %s" % (me.title, epname, epn)
322     else:
323       if me.implicitp: label = "%s. %s" % (epn, title)
324       elif me.title is None: label = "%d.%s. %s" % (me.i, epn, title)
325       else: label = "%s—%s. %s" % (me.title, epn, title)
326     return label
327
328 class MovieSeason (BaseSeason):
329   def __init__(me, series, title, *args, **kw):
330     super().__init__(series, *args, **kw)
331     me.title = title
332     me.i = None
333   def add_episode(me, j, neps, title, src, tno, startch):
334     if me.title is None and title is None:
335       raise ExpectedError("movie or movie season must have a title")
336     return super().add_episode(j, neps, title, src, tno, startch)
337   def _eplabel(me, i, neps, title):
338     if me.title is None:
339       label = title
340     elif title is None:
341       epname, epn = me._epnames(i, neps)
342       label = "%s—%s %s" % (me.title, epname, epn)
343     else:
344       label = "%s—%s" % (me.title, title)
345     return label
346
347 class Series (object):
348   def __init__(me, playlist, name, title = None, wantedp = True):
349     me.playlist = playlist
350     me.name, me.title = name, title
351     me.cur_season = None
352     me.wantedp = wantedp
353   def _add_season(me, season):
354     me.cur_season = season
355   def add_season(me, title, i, implicitp = False):
356     me._add_season(Season(me, title, i, implicitp))
357   def add_movies(me, title = None):
358     me._add_season(MovieSeason(me, title))
359   def ensure_season(me):
360     if me.cur_season is None: me.add_season(None, 1, implicitp = True)
361     return me.cur_season
362   def end_season(me):
363     me.cur_season = None
364
365 class Playlist (object):
366   def __init__(me):
367     me.seasons = []
368     me.episodes = []
369     me.epname, me.epnames = "Episode", "Episodes"
370     me.nseries = 0
371   def add_episode(me, episode):
372     me.episodes.append(episode)
373   def done_season(me):
374     if me.episodes:
375       me.seasons.append(me.episodes)
376       me.episodes = []
377   def write(me, f):
378     f.write("#EXTM3U\n")
379     for season in me.seasons:
380       f.write("\n")
381       for ep in season:
382         label = ep.label()
383         if me.nseries > 1: label = ep.season.series.title + " " + label
384         if not ep.chapters:
385           f.write("#EXTINF:0,,%s\n%s\n" % (label, ep.url))
386         else:
387           for ch in ep.chapters:
388             f.write("#EXTINF:0,,%s: %s\n%s\n" %
389                     (label, ch.title, ch.url))
390
391 MODE_UNSET = 0
392 MODE_SINGLE = 1
393 MODE_MULTI = 2
394
395 class EpisodeListParser (object):
396
397   def __init__(me, series_wanted = None, chapters_wanted_p = False):
398     me._pl = Playlist()
399     me._cur_episode = me._cur_chapter = None
400     me._series = {}; me._vdirs = {}; me._audirs = {}; me._isos = {}
401     me._series_wanted = series_wanted
402     me._chaptersp = chapters_wanted_p
403     if series_wanted is None: me._mode = MODE_UNSET
404     else: me._mode = MODE_MULTI
405
406   def _bad_keyval(me, cmd, k, v):
407     raise ExpectedError("invalid `!%s' option `%s'" %
408                           (cmd, v if k is None else k))
409
410   def _keyvals(me, opts):
411     if opts is not None:
412       for kv in opts.split(","):
413         try: sep = kv.index("=")
414         except ValueError: yield None, kv
415         else: yield kv[:sep], kv[sep + 1:]
416
417   def _set_mode(me, mode):
418     if me._mode == MODE_UNSET:
419       me._mode = mode
420     elif me._mode != mode:
421       raise ExpectedError("inconsistent single-/multi-series usage")
422
423   def _get_series(me, name):
424     if name is None:
425       me._set_mode(MODE_SINGLE)
426       try: series = me._series[None]
427       except KeyError:
428         series = me._series[None] = Series(me._pl, None)
429         me._pl.nseries += 1
430     else:
431       me._set_mode(MODE_MULTI)
432       series = lookup(me._series, name, "unknown series `%s'" % name)
433     return series
434
435   def _opts_series(me, cmd, opts):
436     name = None
437     for k, v in me._keyvals(opts):
438       if k is None: name = v
439       else: me._bad_keyval(cmd, k, v)
440     return me._get_series(name)
441
442   def _auto_epsrc(me, series):
443     dir = lookup(me._vdirs, series.name, "no active video directory")
444     season = series.ensure_season()
445     check(season.i is not None, "must use explicit iso for movie seasons")
446     vseason = lookup(dir.seasons, season.i,
447                      "season %d not found in video dir `%s'" %
448                        (season.i, dir.dir))
449     src = lookup(vseason.episodes, season.ep_i,
450                  "episode %d.%d not found in video dir `%s'" %
451                    (season.i, season.ep_i, dir.dir))
452     return src
453
454   def _process_cmd(me, ww):
455
456     cmd = ww.nextword(); check(cmd is not None, "missing command")
457     try: sep = cmd.index(":")
458     except ValueError: opts = None
459     else: cmd, opts = cmd[:sep], cmd[sep + 1:]
460
461     if cmd == "series":
462       name = None
463       for k, v in me._keyvals(opts):
464         if k is None: name = v
465         else: me._bad_keyval(cmd, k, v)
466       check(name is not None, "missing series name")
467       check(name not in me._series, "series `%s' already defined" % name)
468       title = ww.rest(); check(title is not None, "missing title")
469       me._set_mode(MODE_MULTI)
470       me._series[name] = series = Series(me._pl, name, title,
471                                          me._series_wanted is None or
472                                            name in me._series_wanted)
473       if series.wantedp: me._pl.nseries += 1
474
475     elif cmd == "season":
476       series = me._opts_series(cmd, opts)
477       w = ww.nextword();
478       check(w is not None, "missing season number")
479       if w == "-":
480         if not series.wantedp: return
481         series.add_movies(ww.rest())
482       else:
483         title = ww.rest(); i = getint(w)
484         if not series.wantedp: return
485         series.add_season(ww.rest(), getint(w), implicitp = False)
486       me._cur_episode = me._cur_chapter = None
487       me._pl.done_season()
488
489     elif cmd == "epname":
490       for k, v in me._keyvals(opts): me._bad_keyval("epname", k, v)
491       name = ww.rest(); check(name is not None, "missing episode name")
492       try: sep = name.index(",")
493       except ValueError: names = name + "s"
494       else: name, names = name[:sep], name[sep + 1:]
495       me._pl.epname, me._pl.epnames = name, names
496
497     elif cmd == "epno":
498       series = me._opts_series(cmd, opts)
499       w = ww.rest(); check(w is not None, "missing episode number")
500       epi = getint(w)
501       if not series.wantedp: return
502       series.ensure_season().ep_i = epi
503
504     elif cmd == "iso":
505       series = me._opts_series(cmd, opts)
506       fn = ww.rest(); check(fn is not None, "missing filename")
507       if not series.wantedp: return
508       if fn == "-": forget(me._isos, series.name)
509       else:
510         check(OS.path.exists(OS.path.join(ROOT, fn)),
511               "iso file `%s' not found" % fn)
512         me._isos[series.name] = VideoDisc(fn)
513
514     elif cmd == "vdir":
515       series = me._opts_series(cmd, opts)
516       dir = ww.rest(); check(dir is not None, "missing directory")
517       if not series.wantedp: return
518       if dir == "-": forget(me._vdirs, series.name)
519       else: me._vdirs[series.name] = VideoDir(dir)
520
521     elif cmd == "adir":
522       series = me._opts_series(cmd, opts)
523       dir = ww.rest(); check(dir is not None, "missing directory")
524       if not series.wantedp: return
525       if dir == "-": forget(me._audirs, series.name)
526       else: me._audirs[series.name] = AudioDir(dir)
527
528     elif cmd == "displaced":
529       series = me._opts_series(cmd, opts)
530       w = ww.rest(); check(w is not None, "missing count"); n = getint(w)
531       src = me._auto_epsrc(series)
532       src.nuses += n
533     else:
534       raise ExpectedError("unknown command `%s'" % cmd)
535
536   def _process_episode(me, ww):
537
538     opts = ww.nextword(); check(opts is not None, "missing title/options")
539     ti = None; sname = None; neps = 1; epi = None; ch = None
540     for k, v in me._keyvals(opts):
541       if k is None:
542         if v.isdigit(): ti = int(v)
543         elif v == "-": ti = "-"
544         else: sname = v
545       elif k == "s": sname = v
546       elif k == "n": neps = getint(v)
547       elif k == "ep": epi = getint(v)
548       elif k == "ch": ch = getint(v)
549       else: raise ExpectedError("unknown episode option `%s'" % k)
550     check(ti is not None, "missing title number")
551     series = me._get_series(sname)
552     me._cur_chapter = None
553
554     title = ww.rest()
555     if not series.wantedp: return
556     season = series.ensure_season()
557     if epi is None: epi = season.ep_i
558
559     if ti == "-":
560       check(season.implicitp, "audio source, but explicit season")
561       dir = lookup(me._audirs, series.name,
562                    "no title, and no audio directory")
563       src = lookup(dir.episodes, season.ep_i,
564                    "episode %d not found in audio dir `%s'" % (epi, dir.dir))
565
566     else:
567       try: src = me._isos[series.name]
568       except KeyError: src = me._auto_epsrc(series)
569
570     episode = season.add_episode(epi, neps, title, src, ti, ch)
571     me._pl.add_episode(episode)
572     me._cur_episode = episode
573
574   def _process_chapter(me, ww):
575     check(me._cur_episode is not None, "no current episode")
576     check(me._cur_episode.source.CHAPTERP,
577           "episode source doesn't allow chapters")
578     if me._chaptersp:
579       if me._cur_chapter is None: i = 1
580       else: i = me._cur_chapter.i + 1
581       me._cur_chapter = me._cur_episode.add_chapter(ww.rest(), i)
582
583   def parse_file(me, fn):
584     with location(FileLocation(fn, 0)) as floc:
585       with open(fn, "r") as f:
586         for line in f:
587           floc.stepline()
588           sline = line.lstrip()
589           if sline == "" or sline.startswith(";"): continue
590
591           if line.startswith("!"): me._process_cmd(Words(line[1:]))
592           elif not line[0].isspace(): me._process_episode(Words(line))
593           else: me._process_chapter(Words(line))
594     me._pl.done_season()
595
596   def done(me):
597     discs = set()
598     for name, vdir in me._vdirs.items():
599       if not me._series[name].wantedp: continue
600       for s in vdir.seasons.values():
601         for d in s.episodes.values():
602           discs.add(d)
603     for adir in me._audirs.values():
604       for d in adir.episodes.values():
605         discs.add(d)
606     for d in sorted(discs, key = lambda d: d.fn):
607       if d.neps is not None and d.neps != d.nuses:
608         raise ExpectedError("disc `%s' has %d episodes, used %d times" %
609                             (d.fn, d.neps, d.nuses))
610     return me._pl
611
612 ROOT = "/mnt/dvd/archive/"
613
614 op = OP.OptionParser \
615   (usage = "%prog [-c] [-s SERIES] EPLS",
616    description = "Generate M3U playlists from an episode list.")
617 op.add_option("-c", "--chapters",
618               dest = "chaptersp", action = "store_true", default = False,
619               help = "Output individual chapter names")
620 op.add_option("-s", "--series",
621               dest = "series", type = "str", default = None,
622               help = "Output only the listed SERIES (comma-separated)")
623 opts, argv = op.parse_args()
624 if len(argv) != 1: op.print_usage(file = SYS.stderr); SYS.exit(2)
625 if opts.series is None:
626   series_wanted = None
627 else:
628   series_wanted = set()
629   for name in opts.series.split(","): series_wanted.add(name)
630 try:
631   ep = EpisodeListParser(series_wanted, opts.chaptersp)
632   ep.parse_file(argv[0])
633   pl = ep.done()
634   pl.write(SYS.stdout)
635 except (ExpectedError, IOError, OSError) as e:
636   LOC.report(e)
637   SYS.exit(2)