chiark / gitweb /
mkm3u: Support one-episode-per-file arrangements.
[epls] / mkm3u
1 #! /usr/bin/python3
2 ### -*- mode: python; coding: utf-8 -*-
3
4 from contextlib import contextmanager
5 import optparse as OP
6 import os as OS
7 import re as RX
8 import sys as SYS
9
10 class ExpectedError (Exception): pass
11
12 @contextmanager
13 def location(loc):
14   global LOC
15   old, LOC = LOC, loc
16   yield loc
17   LOC = old
18
19 def filter(value, func = None, dflt = None):
20   if value is None: return dflt
21   elif func is None: return value
22   else: return func(value)
23
24 def check(cond, msg):
25   if not cond: raise ExpectedError(msg)
26
27 def lookup(dict, key, msg):
28   try: return dict[key]
29   except KeyError: raise ExpectedError(msg)
30
31 def forget(dict, key):
32   try: del dict[key]
33   except KeyError: pass
34
35 def getint(s):
36   if not s.isdigit(): raise ExpectedError("bad integer `%s'" % s)
37   return int(s)
38
39 class Words (object):
40   def __init__(me, s):
41     me._s = s
42     me._i, me._n = 0, len(s)
43   def _wordstart(me):
44     s, i, n = me._s, me._i, me._n
45     while i < n:
46       if not s[i].isspace(): return i
47       i += 1
48     return -1
49   def nextword(me):
50     s, n = me._s, me._n
51     begin = i = me._wordstart()
52     if begin < 0: return None
53     while i < n and not s[i].isspace(): i += 1
54     me._i = i
55     return s[begin:i]
56   def rest(me):
57     s, n = me._s, me._n
58     begin = me._wordstart()
59     if begin < 0: return None
60     else: return s[begin:].rstrip()
61
62 URL_SAFE_P = 256*[False]
63 for ch in \
64     b"ABCDEFGHIJKLMNOPQRSTUVWXYZ" \
65     b"abcdefghijklmnopqrstuvwxyz" \
66     b"0123456789" b"!$%-.,/":
67   URL_SAFE_P[ch] = True
68 def urlencode(s):
69   return "".join((URL_SAFE_P[ch] and chr(ch) or "%%%02x" % ch
70                   for ch in s.encode("UTF-8")))
71
72 PROG = OS.path.basename(SYS.argv[0])
73
74 class BaseLocation (object):
75   def report(me, exc):
76     SYS.stderr.write("%s: %s%s\n" % (PROG, me._loc(), exc))
77
78 class DummyLocation (BaseLocation):
79   def _loc(me): return ""
80
81 class FileLocation (BaseLocation):
82   def __init__(me, fn, lno = 1): me._fn, me._lno = fn, lno
83   def _loc(me): return "%s:%d: " % (me._fn, me._lno)
84   def stepline(me): me._lno += 1
85
86 LOC = DummyLocation()
87
88 class Source (object):
89   PREFIX = ""
90   TITLEP = CHAPTERP = False
91   def __init__(me, fn):
92     me.fn = fn
93     me.neps = None
94     me.used_titles = dict()
95     me.used_chapters = set()
96     me.nuses = 0
97   def url(me, title = None, start_chapter = None, end_chapter = None):
98     if title == "-":
99       if me.TITLEP: raise ExpectedError("missing title number")
100       if start_chapter is not None or end_chapter is not None:
101         raise ExpectedError("can't specify chapter without title")
102       suffix = ""
103     elif not me.TITLEP:
104       raise ExpectedError("can't specify title with `%s'" % me.fn)
105     elif start_chapter is None:
106       if end_chapter is not None:
107         raise ExpectedError("can't specify end chapter without start chapter")
108       suffix = "#%d" % title
109     elif not me.CHAPTERP:
110       raise ExpectedError("can't specify chapter with `%s'" % me.fn)
111     elif end_chapter is None:
112       suffix = "#%d:%d" % (title, start_chapter)
113     else:
114       suffix = "#%d:%d-%d:%d" % (title, start_chapter, title, end_chapter - 1)
115     if end_chapter is not None:
116       keys = [(title, ch) for ch in range(start_chapter, end_chapter)]
117       set = me.used_chapters
118     else:
119       keys, set = [title], me.used_titles
120     for k in keys:
121       if k in set:
122         if title == "-":
123           raise ExpectedError("`%s' already used" % me.fn)
124         elif end_chapter is None:
125           raise ExpectedError("`%s' title %d already used" % (me.fn, title))
126         else:
127           raise ExpectedError("`%s' title %d chapter %d already used" %
128                               (me.fn, title, k[1]))
129     if end_chapter is not None:
130       for ch in range(start_chapter, end_chapter):
131         me.used_chapters.add((title, ch))
132     return me.PREFIX + ROOT + urlencode(me.fn) + suffix
133
134 class VideoDisc (Source):
135   PREFIX = "dvd://"
136   TITLEP = CHAPTERP = True
137
138   def __init__(me, fn, *args, **kw):
139     super().__init__(fn, *args, **kw)
140     me.neps = 0
141
142 class VideoSeason (object):
143   def __init__(me, i, title):
144     me.i = i
145     me.title = title
146     me.episodes = {}
147   def set_episode_disc(me, i, disc):
148     if i in me.episodes:
149       raise ExpectedError("season %d episode %d already taken" % (me.i, i))
150     me.episodes[i] = disc; disc.neps += 1
151
152 def some_group(m, *gg):
153   for g in gg:
154     s = m.group(g)
155     if s is not None: return s
156   return None
157
158 class VideoDir (object):
159
160   _R_ISO_PRE = RX.compile(r""" ^
161         (?: S (?P<si> \d+)
162               (?: \. \ (?P<st> .*) — (?: D \d+ \. \ )? |
163                   D \d+ \. \ |
164                   (?= E \d+ \. \ ) |
165                   \. \ ) |
166             (?P<epnum> \d+) \. \ )
167         (?: (?P<eplist>
168              (?: S \d+ \ )? E \d+ (?: – \d+)?
169              (?: , \ (?: S \d+ \ )? E \d+ (?: – \d+)?)*) |
170             (?P<epname> E \d+) \. \ .* |
171             .*)
172         \. iso $
173   """, RX.X)
174
175   _R_ISO_EP = RX.compile(r""" ^
176         (?: S (?P<si> \d+) \ )?
177         E (?P<ei> \d+) (?: – (?P<ej> \d+))? $
178   """, RX.X)
179
180   def __init__(me, dir):
181     me.dir = dir
182     fns = OS.listdir(OS.path.join(ROOT, dir))
183     fns.sort()
184     season = None
185     seasons = {}
186     for fn in fns:
187       path = OS.path.join(dir, fn)
188       if not fn.endswith(".iso"): continue
189       m = me._R_ISO_PRE.match(fn)
190       if not m:
191         #print(";; `%s' ignored (regex mismatch)" % path, file = SYS.stderr)
192         continue
193
194       i = filter(m.group("si"), int)
195       stitle = m.group("st")
196       check(i is not None or stitle is None,
197             "explicit season title without number in `%s'" % fn)
198       if i is not None:
199         if season is None or i != season.i:
200           check(season is None or i == season.i + 1,
201                 "season %d /= %d" %
202                   (i, season is None and -1 or season.i + 1))
203           check(i not in seasons, "season %d already seen" % i)
204           seasons[i] = season = VideoSeason(i, stitle)
205         else:
206           check(stitle == season.title,
207                 "season title `%s' /= `%s'" % (stitle, season.title))
208
209       disc = VideoDisc(path)
210       ts = season
211       any, bad = False, False
212       epname = m.group("epname")
213       epexpr = m.group("eplist")
214       epnum = m.group("epnum")
215       if epname is not None: eplist = [epname]
216       elif epexpr is not None: eplist = epexpr.split(", ")
217       elif epnum is not None: eplist = ["E" + epnum]
218       else: continue
219       #print(";; `%s'" % path, file = SYS.stderr)
220       for eprange in eplist:
221         mm = me._R_ISO_EP.match(eprange)
222         if mm is None:
223           #print(";;\t`%s'?" % eprange, file = SYS.stderr)
224           bad = True; continue
225         if not any: any = True
226         i = filter(mm.group("si"), int)
227         if i is not None:
228           try: ts = seasons[i]
229           except KeyError: ts = seasons[i] = VideoSeason(i, None)
230         if ts is None:
231           ts = season = seasons[1] = VideoSeason(1, None)
232         start = filter(mm.group("ei"), int)
233         end = filter(mm.group("ej"), int, start)
234         for k in range(start, end + 1):
235           ts.set_episode_disc(k, disc)
236           #print(";;\tepisode %d.%d" % (ts.i, k), file = SYS.stderr)
237       if not any:
238         #print(";;\tignored" % path, file = SYS.stderr)
239         pass
240       elif bad:
241         raise ExpectedError("bad ep list in `%s'", fn)
242     me.seasons = seasons
243
244 class AudioDisc (Source):
245   PREFIX = "file://"
246   TITLEP = CHAPTERP = False
247
248 class AudioEpisode (Source):
249   PREFIX = "file://"
250   TITLEP = CHAPTERP = False
251   def __init__(me, fn, i, *args, **kw):
252     super().__init__(fn, *args, **kw)
253     me.i = i
254
255 class AudioDir (object):
256
257   _R_FLAC = RX.compile(r""" ^
258           E (\d+)
259           (?: \. \ (.*))?
260           \. flac $
261   """, RX.X)
262
263   def __init__(me, dir):
264     me.dir = dir
265     fns = OS.listdir(OS.path.join(ROOT, dir))
266     fns.sort()
267     episodes = {}
268     last_i = 0
269     for fn in fns:
270       path = OS.path.join(dir, fn)
271       if not fn.endswith(".flac"): continue
272       m = me._R_FLAC.match(fn)
273       if not m: continue
274       i = filter(m.group(1), int)
275       etitle = m.group(2)
276       check(i == last_i + 1, "episode %d /= %d" % (i, last_i + 1))
277       episodes[i] = AudioEpisode(path, i)
278       last_i = i
279     me.episodes = episodes
280
281 class Chapter (object):
282   def __init__(me, episode, title, i):
283     me.title, me.i = title, i
284     me.url = episode.source.url(episode.tno, i, i + 1)
285
286 class Episode (object):
287   def __init__(me, season, i, neps, title, src, tno = None, startch = None):
288     me.season = season
289     me.i, me.neps, me.title = i, neps, title
290     me.chapters = []
291     me.source, me.tno = src, tno
292     me.url = src.url(tno, startch, None)
293   def add_chapter(me, title, j):
294     ch = Chapter(me, title, j)
295     me.chapters.append(ch)
296     return ch
297   def label(me):
298     return me.season._eplabel(me.i, me.neps, me.title)
299
300 class BaseSeason (object):
301   def __init__(me, series, implicitp = False):
302     me.series = series
303     me.episodes = []
304     me.implicitp = implicitp
305     me.ep_i, episodes = 1, []
306   def add_episode(me, j, neps, title, src, tno, startch):
307     ep = Episode(me, j, neps, title, src, tno, startch)
308     me.episodes.append(ep)
309     src.nuses += neps; me.ep_i += neps
310     return ep
311   def _epnames(me, i, neps):
312     playlist = me.series.playlist
313     if neps == 1: return playlist.epname, "%d" % i
314     elif neps == 2: return playlist.epnames, "%d, %d" % (i, i + 1)
315     else: return playlist.epnames, "%d–%d" % (i, i + neps - 1)
316
317 class Season (BaseSeason):
318   def __init__(me, series, title, i, *args, **kw):
319     super().__init__(series, *args, **kw)
320     me.title, me.i = title, i
321   def _eplabel(me, i, neps, title):
322     epname, epn = me._epnames(i, neps)
323     if title is None:
324       if me.implicitp: label = "%s %s" % (epname, epn)
325       elif me.title is None: label = "%s %d.%s" % (epname, me.i, epn)
326       else: label = "%s—%s %s" % (me.title, epname, epn)
327     else:
328       if me.implicitp: label = "%s. %s" % (epn, title)
329       elif me.title is None: label = "%d.%s. %s" % (me.i, epn, title)
330       else: label = "%s—%s. %s" % (me.title, epn, title)
331     return label
332
333 class MovieSeason (BaseSeason):
334   def __init__(me, series, title, *args, **kw):
335     super().__init__(series, *args, **kw)
336     me.title = title
337     me.i = None
338   def add_episode(me, j, neps, title, src, tno, startch):
339     if me.title is None and title is None:
340       raise ExpectedError("movie or movie season must have a title")
341     return super().add_episode(j, neps, title, src, tno, startch)
342   def _eplabel(me, i, neps, title):
343     if me.title is None:
344       label = title
345     elif title is None:
346       epname, epn = me._epnames(i, neps)
347       label = "%s—%s %s" % (me.title, epname, epn)
348     else:
349       label = "%s—%s" % (me.title, title)
350     return label
351
352 class Series (object):
353   def __init__(me, playlist, name, title = None, wantedp = True):
354     me.playlist = playlist
355     me.name, me.title = name, title
356     me.cur_season = None
357     me.wantedp = wantedp
358   def _add_season(me, season):
359     me.cur_season = season
360   def add_season(me, title, i, implicitp = False):
361     me._add_season(Season(me, title, i, implicitp))
362   def add_movies(me, title = None):
363     me._add_season(MovieSeason(me, title))
364   def ensure_season(me):
365     if me.cur_season is None: me.add_season(None, 1, implicitp = True)
366     return me.cur_season
367   def end_season(me):
368     me.cur_season = None
369
370 class Playlist (object):
371   def __init__(me):
372     me.seasons = []
373     me.episodes = []
374     me.epname, me.epnames = "Episode", "Episodes"
375     me.nseries = 0
376   def add_episode(me, episode):
377     me.episodes.append(episode)
378   def done_season(me):
379     if me.episodes:
380       me.seasons.append(me.episodes)
381       me.episodes = []
382   def write(me, f):
383     f.write("#EXTM3U\n")
384     for season in me.seasons:
385       f.write("\n")
386       for ep in season:
387         label = ep.label()
388         if me.nseries > 1: label = ep.season.series.title + " " + label
389         if not ep.chapters:
390           f.write("#EXTINF:0,,%s\n%s\n" % (label, ep.url))
391         else:
392           for ch in ep.chapters:
393             f.write("#EXTINF:0,,%s: %s\n%s\n" %
394                     (label, ch.title, ch.url))
395
396 MODE_UNSET = 0
397 MODE_SINGLE = 1
398 MODE_MULTI = 2
399
400 class EpisodeListParser (object):
401
402   def __init__(me, series_wanted = None, chapters_wanted_p = False):
403     me._pl = Playlist()
404     me._cur_episode = me._cur_chapter = None
405     me._series = {}; me._vdirs = {}; me._audirs = {}; me._isos = {}
406     me._series_wanted = series_wanted
407     me._chaptersp = chapters_wanted_p
408     if series_wanted is None: me._mode = MODE_UNSET
409     else: me._mode = MODE_MULTI
410
411   def _bad_keyval(me, cmd, k, v):
412     raise ExpectedError("invalid `!%s' option `%s'" %
413                           (cmd, v if k is None else k))
414
415   def _keyvals(me, opts):
416     if opts is not None:
417       for kv in opts.split(","):
418         try: sep = kv.index("=")
419         except ValueError: yield None, kv
420         else: yield kv[:sep], kv[sep + 1:]
421
422   def _set_mode(me, mode):
423     if me._mode == MODE_UNSET:
424       me._mode = mode
425     elif me._mode != mode:
426       raise ExpectedError("inconsistent single-/multi-series usage")
427
428   def _get_series(me, name):
429     if name is None:
430       me._set_mode(MODE_SINGLE)
431       try: series = me._series[None]
432       except KeyError:
433         series = me._series[None] = Series(me._pl, None)
434         me._pl.nseries += 1
435     else:
436       me._set_mode(MODE_MULTI)
437       series = lookup(me._series, name, "unknown series `%s'" % name)
438     return series
439
440   def _opts_series(me, cmd, opts):
441     name = None
442     for k, v in me._keyvals(opts):
443       if k is None: name = v
444       else: me._bad_keyval(cmd, k, v)
445     return me._get_series(name)
446
447   def _auto_epsrc(me, series):
448     dir = lookup(me._vdirs, series.name, "no active video directory")
449     season = series.ensure_season()
450     check(season.i is not None, "must use explicit iso for movie seasons")
451     vseason = lookup(dir.seasons, season.i,
452                      "season %d not found in video dir `%s'" %
453                        (season.i, dir.dir))
454     src = lookup(vseason.episodes, season.ep_i,
455                  "episode %d.%d not found in video dir `%s'" %
456                    (season.i, season.ep_i, dir.dir))
457     return src
458
459   def _process_cmd(me, ww):
460
461     cmd = ww.nextword(); check(cmd is not None, "missing command")
462     try: sep = cmd.index(":")
463     except ValueError: opts = None
464     else: cmd, opts = cmd[:sep], cmd[sep + 1:]
465
466     if cmd == "series":
467       name = None
468       for k, v in me._keyvals(opts):
469         if k is None: name = v
470         else: me._bad_keyval(cmd, k, v)
471       check(name is not None, "missing series name")
472       check(name not in me._series, "series `%s' already defined" % name)
473       title = ww.rest(); check(title is not None, "missing title")
474       me._set_mode(MODE_MULTI)
475       me._series[name] = series = Series(me._pl, name, title,
476                                          me._series_wanted is None or
477                                            name in me._series_wanted)
478       if series.wantedp: me._pl.nseries += 1
479
480     elif cmd == "season":
481       series = me._opts_series(cmd, opts)
482       w = ww.nextword();
483       check(w is not None, "missing season number")
484       if w == "-":
485         if not series.wantedp: return
486         series.add_movies(ww.rest())
487       else:
488         title = ww.rest(); i = getint(w)
489         if not series.wantedp: return
490         series.add_season(ww.rest(), getint(w), implicitp = False)
491       me._cur_episode = me._cur_chapter = None
492       me._pl.done_season()
493
494     elif cmd == "epname":
495       for k, v in me._keyvals(opts): me._bad_keyval("epname", k, v)
496       name = ww.rest(); check(name is not None, "missing episode name")
497       try: sep = name.index(",")
498       except ValueError: names = name + "s"
499       else: name, names = name[:sep], name[sep + 1:]
500       me._pl.epname, me._pl.epnames = name, names
501
502     elif cmd == "epno":
503       series = me._opts_series(cmd, opts)
504       w = ww.rest(); check(w is not None, "missing episode number")
505       epi = getint(w)
506       if not series.wantedp: return
507       series.ensure_season().ep_i = epi
508
509     elif cmd == "iso":
510       series = me._opts_series(cmd, opts)
511       fn = ww.rest(); check(fn is not None, "missing filename")
512       if not series.wantedp: return
513       if fn == "-": forget(me._isos, series.name)
514       else:
515         check(OS.path.exists(OS.path.join(ROOT, fn)),
516               "iso file `%s' not found" % fn)
517         me._isos[series.name] = VideoDisc(fn)
518
519     elif cmd == "vdir":
520       series = me._opts_series(cmd, opts)
521       dir = ww.rest(); check(dir is not None, "missing directory")
522       if not series.wantedp: return
523       if dir == "-": forget(me._vdirs, series.name)
524       else: me._vdirs[series.name] = VideoDir(dir)
525
526     elif cmd == "adir":
527       series = me._opts_series(cmd, opts)
528       dir = ww.rest(); check(dir is not None, "missing directory")
529       if not series.wantedp: return
530       if dir == "-": forget(me._audirs, series.name)
531       else: me._audirs[series.name] = AudioDir(dir)
532
533     elif cmd == "displaced":
534       series = me._opts_series(cmd, opts)
535       w = ww.rest(); check(w is not None, "missing count"); n = getint(w)
536       src = me._auto_epsrc(series)
537       src.nuses += n
538     else:
539       raise ExpectedError("unknown command `%s'" % cmd)
540
541   def _process_episode(me, ww):
542
543     opts = ww.nextword(); check(opts is not None, "missing title/options")
544     ti = None; sname = None; neps = 1; epi = None; ch = None
545     for k, v in me._keyvals(opts):
546       if k is None:
547         if v.isdigit(): ti = int(v)
548         elif v == "-": ti = "-"
549         else: sname = v
550       elif k == "s": sname = v
551       elif k == "n": neps = getint(v)
552       elif k == "ep": epi = getint(v)
553       elif k == "ch": ch = getint(v)
554       else: raise ExpectedError("unknown episode option `%s'" % k)
555     check(ti is not None, "missing title number")
556     series = me._get_series(sname)
557     me._cur_chapter = None
558
559     title = ww.rest()
560     if not series.wantedp: return
561     season = series.ensure_season()
562     if epi is None: epi = season.ep_i
563
564     if ti == "-":
565       check(season.implicitp, "audio source, but explicit season")
566       dir = lookup(me._audirs, series.name,
567                    "no title, and no audio directory")
568       src = lookup(dir.episodes, season.ep_i,
569                    "episode %d not found in audio dir `%s'" % (epi, dir.dir))
570
571     else:
572       try: src = me._isos[series.name]
573       except KeyError: src = me._auto_epsrc(series)
574
575     episode = season.add_episode(epi, neps, title, src, ti, ch)
576     me._pl.add_episode(episode)
577     me._cur_episode = episode
578
579   def _process_chapter(me, ww):
580     check(me._cur_episode is not None, "no current episode")
581     check(me._cur_episode.source.CHAPTERP,
582           "episode source doesn't allow chapters")
583     if me._chaptersp:
584       if me._cur_chapter is None: i = 1
585       else: i = me._cur_chapter.i + 1
586       me._cur_chapter = me._cur_episode.add_chapter(ww.rest(), i)
587
588   def parse_file(me, fn):
589     with location(FileLocation(fn, 0)) as floc:
590       with open(fn, "r") as f:
591         for line in f:
592           floc.stepline()
593           sline = line.lstrip()
594           if sline == "" or sline.startswith(";"): continue
595
596           if line.startswith("!"): me._process_cmd(Words(line[1:]))
597           elif not line[0].isspace(): me._process_episode(Words(line))
598           else: me._process_chapter(Words(line))
599     me._pl.done_season()
600
601   def done(me):
602     discs = set()
603     for name, vdir in me._vdirs.items():
604       if not me._series[name].wantedp: continue
605       for s in vdir.seasons.values():
606         for d in s.episodes.values():
607           discs.add(d)
608     for adir in me._audirs.values():
609       for d in adir.episodes.values():
610         discs.add(d)
611     for d in sorted(discs, key = lambda d: d.fn):
612       if d.neps is not None and d.neps != d.nuses:
613         raise ExpectedError("disc `%s' has %d episodes, used %d times" %
614                             (d.fn, d.neps, d.nuses))
615     return me._pl
616
617 ROOT = "/mnt/dvd/archive/"
618
619 op = OP.OptionParser \
620   (usage = "%prog [-c] [-s SERIES] EPLS",
621    description = "Generate M3U playlists from an episode list.")
622 op.add_option("-c", "--chapters",
623               dest = "chaptersp", action = "store_true", default = False,
624               help = "Output individual chapter names")
625 op.add_option("-s", "--series",
626               dest = "series", type = "str", default = None,
627               help = "Output only the listed SERIES (comma-separated)")
628 opts, argv = op.parse_args()
629 if len(argv) != 1: op.print_usage(file = SYS.stderr); SYS.exit(2)
630 if opts.series is None:
631   series_wanted = None
632 else:
633   series_wanted = set()
634   for name in opts.series.split(","): series_wanted.add(name)
635 try:
636   ep = EpisodeListParser(series_wanted, opts.chaptersp)
637   ep.parse_file(argv[0])
638   pl = ep.done()
639   pl.write(SYS.stdout)
640 except (ExpectedError, IOError, OSError) as e:
641   LOC.report(e)
642   SYS.exit(2)