chiark / gitweb /
Add series as far as `P'.
[epls] / mkm3u
1 #! /usr/bin/python3
2 ### -*- mode: python; coding: utf-8 -*-
3
4 from contextlib import contextmanager
5 import optparse as OP
6 import os as OS
7 import re as RX
8 import sys as SYS
9
10 class ExpectedError (Exception): pass
11
12 @contextmanager
13 def location(loc):
14   global LOC
15   old, LOC = LOC, loc
16   yield loc
17   LOC = old
18
19 def filter(value, func = None, dflt = None):
20   if value is None: return dflt
21   elif func is None: return value
22   else: return func(value)
23
24 def check(cond, msg):
25   if not cond: raise ExpectedError(msg)
26
27 def lookup(dict, key, msg):
28   try: return dict[key]
29   except KeyError: raise ExpectedError(msg)
30
31 def forget(dict, key):
32   try: del dict[key]
33   except KeyError: pass
34
35 def getint(s):
36   if not s.isdigit(): raise ExpectedError("bad integer `%s'" % s)
37   return int(s)
38
39 class Words (object):
40   def __init__(me, s):
41     me._s = s
42     me._i, me._n = 0, len(s)
43   def _wordstart(me):
44     s, i, n = me._s, me._i, me._n
45     while i < n:
46       if not s[i].isspace(): return i
47       i += 1
48     return -1
49   def nextword(me):
50     s, n = me._s, me._n
51     begin = i = me._wordstart()
52     if begin < 0: return None
53     while i < n and not s[i].isspace(): i += 1
54     me._i = i
55     return s[begin:i]
56   def rest(me):
57     s, n = me._s, me._n
58     begin = me._wordstart()
59     if begin < 0: return None
60     else: return s[begin:].rstrip()
61
62 URL_SAFE_P = 256*[False]
63 for ch in \
64     b"ABCDEFGHIJKLMNOPQRSTUVWXYZ" \
65     b"abcdefghijklmnopqrstuvwxyz" \
66     b"0123456789" b"!$%-.,/":
67   URL_SAFE_P[ch] = True
68 def urlencode(s):
69   return "".join((URL_SAFE_P[ch] and chr(ch) or "%%%02x" % ch
70                   for ch in s.encode("UTF-8")))
71
72 PROG = OS.path.basename(SYS.argv[0])
73
74 class BaseLocation (object):
75   def report(me, exc):
76     SYS.stderr.write("%s: %s%s\n" % (PROG, me._loc(), exc))
77
78 class DummyLocation (BaseLocation):
79   def _loc(me): return ""
80
81 class FileLocation (BaseLocation):
82   def __init__(me, fn, lno = 1): me._fn, me._lno = fn, lno
83   def _loc(me): return "%s:%d: " % (me._fn, me._lno)
84   def stepline(me): me._lno += 1
85
86 LOC = DummyLocation()
87
88 class Source (object):
89   PREFIX = ""
90   TITLEP = CHAPTERP = False
91   def __init__(me, fn):
92     me.fn = fn
93     me.neps = None
94     me.used_titles = dict()
95     me.used_chapters = set()
96     me.nuses = 0
97   def url(me, title = None, start_chapter = None, end_chapter = None):
98     if title == "-":
99       if me.TITLEP: raise ExpectedError("missing title number")
100       if start_chapter is not None or end_chapter is not None:
101         raise ExpectedError("can't specify chapter without title")
102       suffix = ""
103     elif not me.TITLEP:
104       raise ExpectedError("can't specify title with `%s'" % me.fn)
105     elif start_chapter is None:
106       if end_chapter is not None:
107         raise ExpectedError("can't specify end chapter without start chapter")
108       suffix = "#%d" % title
109     elif not me.CHAPTERP:
110       raise ExpectedError("can't specify chapter with `%s'" % me.fn)
111     elif end_chapter is None:
112       suffix = "#%d:%d" % (title, start_chapter)
113     else:
114       suffix = "#%d:%d-%d:%d" % (title, start_chapter, title, end_chapter - 1)
115     if end_chapter is not None:
116       keys = [(title, ch) for ch in range(start_chapter, end_chapter)]
117       set = me.used_chapters
118     else:
119       keys, set = [title], me.used_titles
120     for k in keys:
121       if k in set:
122         if title == "-":
123           raise ExpectedError("`%s' already used" % me.fn)
124         elif end_chapter is None:
125           raise ExpectedError("`%s' title %d already used" % (me.fn, title))
126         else:
127           raise ExpectedError("`%s' title %d chapter %d already used" %
128                               (me.fn, title, k[1]))
129     if end_chapter is not None:
130       for ch in range(start_chapter, end_chapter):
131         me.used_chapters.add((title, ch))
132     return me.PREFIX + ROOT + urlencode(me.fn) + suffix
133
134 class VideoDisc (Source):
135   PREFIX = "dvd://"
136   TITLEP = CHAPTERP = True
137
138   def __init__(me, fn, *args, **kw):
139     super().__init__(fn, *args, **kw)
140     me.neps = 0
141
142 class VideoSeason (object):
143   def __init__(me, i, title):
144     me.i = i
145     me.title = title
146     me.episodes = {}
147   def set_episode_disc(me, i, disc):
148     if i in me.episodes:
149       raise ExpectedError("season %d episode %d already taken" % (me.i, i))
150     me.episodes[i] = disc; disc.neps += 1
151
152 def match_group(m, *groups, dflt = None, mustp = False):
153   for g in groups:
154     try: s = m.group(g)
155     except IndexError: continue
156     if s is not None: return s
157   if mustp: raise ValueError("no match found")
158   else: return dflt
159
160 class VideoDir (object):
161
162   _R_ISO_PRE = list(map(lambda pats:
163                           list(map(lambda pat:
164                                      RX.compile("^" + pat + r"\.iso$", RX.X),
165                                    pats)),
166     [[r""" S (?P<si> \d+) \. \ (?P<stitle> .*) — (?: D \d+ \. \ )?
167            (?P<epex> .*) """,
168       r""" S (?P<si> \d+) (?: D \d+)? \. \ (?P<epex> .*) """,
169       r""" S (?P<si> \d+) \. \ (?P<epex> E \d+ .*) """,
170       r""" S (?P<si> \d+) (?P<epex> E \d+) \. \ .* """],
171      [r""" (?P<si> \d+) [A-Z]? \. \ (?P<stitle> .*) — (?P<epex> .*) """],
172      [r""" \d+ \. \ (?P<epex> [ES] \d+ .*) """],
173      [r""" (?P<epnum> \d+ ) \. \ .* """]]))
174
175   _R_ISO_EP = RX.compile(r""" ^
176         (?: S (?P<si> \d+) \ )?
177         E (?P<ei> \d+) (?: – (?P<ej> \d+))? $
178   """, RX.X)
179
180   def __init__(me, dir):
181     me.dir = dir
182     fns = OS.listdir(OS.path.join(ROOT, dir))
183     fns.sort()
184     season = None
185     seasons = {}
186     styles = me._R_ISO_PRE
187     for fn in fns:
188       path = OS.path.join(dir, fn)
189       if not fn.endswith(".iso"): continue
190       #print(";; `%s'" % path, file = SYS.stderr)
191       for sty in styles:
192         for r in sty:
193           m = r.match(fn)
194           if m: styles = [sty]; break
195         else:
196           continue
197         break
198       else:
199         #print(";;\tignored (regex mismatch)", file = SYS.stderr)
200         continue
201
202       si = filter(match_group(m, "si"), int)
203       stitle = match_group(m, "stitle")
204
205       check(si is not None or stitle is None,
206             "explicit season title without number in `%s'" % fn)
207       if si is not None:
208         if season is None or si != season.i:
209           check(season is None or si == season.i + 1,
210                 "season %d /= %d" %
211                   (si, season is None and -1 or season.i + 1))
212           check(si not in seasons, "season %d already seen" % si)
213           seasons[si] = season = VideoSeason(si, stitle)
214         else:
215           check(stitle == season.title,
216                 "season title `%s' /= `%s'" % (stitle, season.title))
217
218       disc = VideoDisc(path)
219       ts = season
220       any, bad = False, False
221       epnum = match_group(m, "epnum")
222       if epnum is not None: eplist = ["E" + epnum]
223       else: eplist = match_group(m, "epex", mustp = True).split(", ")
224       for eprange in eplist:
225         mm = me._R_ISO_EP.match(eprange)
226         if mm is None:
227           #print(";;\t`%s'?" % eprange, file = SYS.stderr)
228           bad = True; continue
229         if not any: any = True
230         i = filter(mm.group("si"), int)
231         if i is not None:
232           try: ts = seasons[i]
233           except KeyError: ts = seasons[i] = VideoSeason(i, None)
234         if ts is None:
235           ts = season = seasons[1] = VideoSeason(1, None)
236         start = filter(mm.group("ei"), int)
237         end = filter(mm.group("ej"), int, start)
238         for k in range(start, end + 1):
239           ts.set_episode_disc(k, disc)
240           #print(";;\tepisode %d.%d" % (ts.i, k), file = SYS.stderr)
241       if not any:
242         #print(";;\tignored", file = SYS.stderr)
243         pass
244       elif bad:
245         raise ExpectedError("bad ep list in `%s'", fn)
246     me.seasons = seasons
247
248 class AudioDisc (Source):
249   PREFIX = "file://"
250   TITLEP = CHAPTERP = False
251
252 class AudioEpisode (Source):
253   PREFIX = "file://"
254   TITLEP = CHAPTERP = False
255   def __init__(me, fn, i, *args, **kw):
256     super().__init__(fn, *args, **kw)
257     me.i = i
258
259 class AudioDir (object):
260
261   _R_FLAC = RX.compile(r""" ^
262           E (\d+)
263           (?: \. \ (.*))?
264           \. flac $
265   """, RX.X)
266
267   def __init__(me, dir):
268     me.dir = dir
269     fns = OS.listdir(OS.path.join(ROOT, dir))
270     fns.sort()
271     episodes = {}
272     last_i = 0
273     for fn in fns:
274       path = OS.path.join(dir, fn)
275       if not fn.endswith(".flac"): continue
276       m = me._R_FLAC.match(fn)
277       if not m: continue
278       i = filter(m.group(1), int)
279       etitle = m.group(2)
280       check(i == last_i + 1, "episode %d /= %d" % (i, last_i + 1))
281       episodes[i] = AudioEpisode(path, i)
282       last_i = i
283     me.episodes = episodes
284
285 class Chapter (object):
286   def __init__(me, episode, title, i):
287     me.title, me.i = title, i
288     me.url = episode.source.url(episode.tno, i, i + 1)
289
290 class Episode (object):
291   def __init__(me, season, i, neps, title, src, tno = None,
292                startch = None, endch = None):
293     me.season = season
294     me.i, me.neps, me.title = i, neps, title
295     me.chapters = []
296     me.source, me.tno = src, tno
297     me.url = src.url(tno, startch, endch)
298   def add_chapter(me, title, j):
299     ch = Chapter(me, title, j)
300     me.chapters.append(ch)
301     return ch
302   def label(me):
303     return me.season._eplabel(me.i, me.neps, me.title)
304
305 class BaseSeason (object):
306   def __init__(me, series, implicitp = False):
307     me.series = series
308     me.episodes = []
309     me.implicitp = implicitp
310     me.ep_i, episodes = 1, []
311   def add_episode(me, j, neps, title, src, tno, startch, endch):
312     ep = Episode(me, j, neps, title, src, tno, startch, endch)
313     me.episodes.append(ep)
314     src.nuses += neps; me.ep_i += neps
315     return ep
316   def _epnames(me, i, neps):
317     playlist = me.series.playlist
318     if neps == 1: return playlist.epname, "%d" % i
319     elif neps == 2: return playlist.epnames, "%d, %d" % (i, i + 1)
320     else: return playlist.epnames, "%d–%d" % (i, i + neps - 1)
321
322 class Season (BaseSeason):
323   def __init__(me, series, title, i, *args, **kw):
324     super().__init__(series, *args, **kw)
325     me.title, me.i = title, i
326   def _eplabel(me, i, neps, title):
327     epname, epn = me._epnames(i, neps)
328     if title is None:
329       if me.implicitp: label = "%s %s" % (epname, epn)
330       elif me.title is None: label = "%s %d.%s" % (epname, me.i, epn)
331       else: label = "%s—%s %s" % (me.title, epname, epn)
332     else:
333       if me.implicitp: label = "%s. %s" % (epn, title)
334       elif me.title is None: label = "%d.%s. %s" % (me.i, epn, title)
335       else: label = "%s—%s. %s" % (me.title, epn, title)
336     return label
337
338 class MovieSeason (BaseSeason):
339   def __init__(me, series, title, *args, **kw):
340     super().__init__(series, *args, **kw)
341     me.title = title
342     me.i = None
343   def add_episode(me, j, neps, title, src, tno, startch, endch):
344     if me.title is None and title is None:
345       raise ExpectedError("movie or movie season must have a title")
346     return super().add_episode(j, neps, title, src, tno, startch, endch)
347   def _eplabel(me, i, neps, title):
348     if me.title is None:
349       label = title
350     elif title is None:
351       epname, epn = me._epnames(i, neps)
352       label = "%s—%s %s" % (me.title, epname, epn)
353     else:
354       label = "%s—%s" % (me.title, title)
355     return label
356
357 class Series (object):
358   def __init__(me, playlist, name, title = None, wantedp = True):
359     me.playlist = playlist
360     me.name, me.title = name, title
361     me.cur_season = None
362     me.wantedp = wantedp
363   def _add_season(me, season):
364     me.cur_season = season
365   def add_season(me, title, i, implicitp = False):
366     me._add_season(Season(me, title, i, implicitp))
367   def add_movies(me, title = None):
368     me._add_season(MovieSeason(me, title))
369   def ensure_season(me):
370     if me.cur_season is None: me.add_season(None, 1, implicitp = True)
371     return me.cur_season
372   def end_season(me):
373     me.cur_season = None
374
375 class Playlist (object):
376   def __init__(me):
377     me.seasons = []
378     me.episodes = []
379     me.epname, me.epnames = "Episode", "Episodes"
380     me.nseries = 0
381   def add_episode(me, episode):
382     me.episodes.append(episode)
383   def done_season(me):
384     if me.episodes:
385       me.seasons.append(me.episodes)
386       me.episodes = []
387   def write(me, f):
388     f.write("#EXTM3U\n")
389     for season in me.seasons:
390       f.write("\n")
391       for ep in season:
392         label = ep.label()
393         if me.nseries > 1: label = ep.season.series.title + " " + label
394         if not ep.chapters:
395           f.write("#EXTINF:0,,%s\n%s\n" % (label, ep.url))
396         else:
397           for ch in ep.chapters:
398             f.write("#EXTINF:0,,%s: %s\n%s\n" %
399                     (label, ch.title, ch.url))
400
401 MODE_UNSET = 0
402 MODE_SINGLE = 1
403 MODE_MULTI = 2
404
405 class EpisodeListParser (object):
406
407   def __init__(me, series_wanted = None, chapters_wanted_p = False):
408     me._pl = Playlist()
409     me._cur_episode = me._cur_chapter = None
410     me._series = {}; me._vdirs = {}; me._audirs = {}; me._isos = {}
411     me._series_wanted = series_wanted
412     me._chaptersp = chapters_wanted_p
413     if series_wanted is None: me._mode = MODE_UNSET
414     else: me._mode = MODE_MULTI
415
416   def _bad_keyval(me, cmd, k, v):
417     raise ExpectedError("invalid `!%s' option `%s'" %
418                           (cmd, v if k is None else k))
419
420   def _keyvals(me, opts):
421     if opts is not None:
422       for kv in opts.split(","):
423         try: sep = kv.index("=")
424         except ValueError: yield None, kv
425         else: yield kv[:sep], kv[sep + 1:]
426
427   def _set_mode(me, mode):
428     if me._mode == MODE_UNSET:
429       me._mode = mode
430     elif me._mode != mode:
431       raise ExpectedError("inconsistent single-/multi-series usage")
432
433   def _get_series(me, name):
434     if name is None:
435       me._set_mode(MODE_SINGLE)
436       try: series = me._series[None]
437       except KeyError:
438         series = me._series[None] = Series(me._pl, None)
439         me._pl.nseries += 1
440     else:
441       me._set_mode(MODE_MULTI)
442       series = lookup(me._series, name, "unknown series `%s'" % name)
443     return series
444
445   def _opts_series(me, cmd, opts):
446     name = None
447     for k, v in me._keyvals(opts):
448       if k is None: name = v
449       else: me._bad_keyval(cmd, k, v)
450     return me._get_series(name)
451
452   def _auto_epsrc(me, series):
453     dir = lookup(me._vdirs, series.name, "no active video directory")
454     season = series.ensure_season()
455     check(season.i is not None, "must use explicit iso for movie seasons")
456     vseason = lookup(dir.seasons, season.i,
457                      "season %d not found in video dir `%s'" %
458                        (season.i, dir.dir))
459     src = lookup(vseason.episodes, season.ep_i,
460                  "episode %d.%d not found in video dir `%s'" %
461                    (season.i, season.ep_i, dir.dir))
462     return src
463
464   def _process_cmd(me, ww):
465
466     cmd = ww.nextword(); check(cmd is not None, "missing command")
467     try: sep = cmd.index(":")
468     except ValueError: opts = None
469     else: cmd, opts = cmd[:sep], cmd[sep + 1:]
470
471     if cmd == "series":
472       name = None
473       for k, v in me._keyvals(opts):
474         if k is None: name = v
475         else: me._bad_keyval(cmd, k, v)
476       check(name is not None, "missing series name")
477       check(name not in me._series, "series `%s' already defined" % name)
478       title = ww.rest(); check(title is not None, "missing title")
479       me._set_mode(MODE_MULTI)
480       me._series[name] = series = Series(me._pl, name, title,
481                                          me._series_wanted is None or
482                                            name in me._series_wanted)
483       if series.wantedp: me._pl.nseries += 1
484
485     elif cmd == "season":
486       series = me._opts_series(cmd, opts)
487       w = ww.nextword();
488       check(w is not None, "missing season number")
489       if w == "-":
490         if not series.wantedp: return
491         series.add_movies(ww.rest())
492       else:
493         title = ww.rest(); i = getint(w)
494         if not series.wantedp: return
495         series.add_season(ww.rest(), getint(w), implicitp = False)
496       me._cur_episode = me._cur_chapter = None
497       me._pl.done_season()
498
499     elif cmd == "epname":
500       for k, v in me._keyvals(opts): me._bad_keyval("epname", k, v)
501       name = ww.rest(); check(name is not None, "missing episode name")
502       try: sep = name.index(",")
503       except ValueError: names = name + "s"
504       else: name, names = name[:sep], name[sep + 1:]
505       me._pl.epname, me._pl.epnames = name, names
506
507     elif cmd == "epno":
508       series = me._opts_series(cmd, opts)
509       w = ww.rest(); check(w is not None, "missing episode number")
510       epi = getint(w)
511       if not series.wantedp: return
512       series.ensure_season().ep_i = epi
513
514     elif cmd == "iso":
515       series = me._opts_series(cmd, opts)
516       fn = ww.rest(); check(fn is not None, "missing filename")
517       if not series.wantedp: return
518       if fn == "-": forget(me._isos, series.name)
519       else:
520         check(OS.path.exists(OS.path.join(ROOT, fn)),
521               "iso file `%s' not found" % fn)
522         me._isos[series.name] = VideoDisc(fn)
523
524     elif cmd == "vdir":
525       series = me._opts_series(cmd, opts)
526       dir = ww.rest(); check(dir is not None, "missing directory")
527       if not series.wantedp: return
528       if dir == "-": forget(me._vdirs, series.name)
529       else: me._vdirs[series.name] = VideoDir(dir)
530
531     elif cmd == "adir":
532       series = me._opts_series(cmd, opts)
533       dir = ww.rest(); check(dir is not None, "missing directory")
534       if not series.wantedp: return
535       if dir == "-": forget(me._audirs, series.name)
536       else: me._audirs[series.name] = AudioDir(dir)
537
538     elif cmd == "displaced":
539       series = me._opts_series(cmd, opts)
540       w = ww.rest(); check(w is not None, "missing count"); n = getint(w)
541       src = me._auto_epsrc(series)
542       src.nuses += n
543     else:
544       raise ExpectedError("unknown command `%s'" % cmd)
545
546   def _process_episode(me, ww):
547
548     opts = ww.nextword(); check(opts is not None, "missing title/options")
549     ti = None; sname = None; neps = 1; epi = None; loch = hich = None
550     for k, v in me._keyvals(opts):
551       if k is None:
552         if v.isdigit(): ti = int(v)
553         elif v == "-": ti = "-"
554         else: sname = v
555       elif k == "s": sname = v
556       elif k == "n": neps = getint(v)
557       elif k == "ep": epi = getint(v)
558       elif k == "ch":
559         try: sep = v.index("-")
560         except ValueError: loch, hich = getint(v), None
561         else: loch, hich = getint(v[:sep]), getint(v[sep + 1:]) + 1
562       else: raise ExpectedError("unknown episode option `%s'" % k)
563     check(ti is not None, "missing title number")
564     series = me._get_series(sname)
565     me._cur_chapter = None
566
567     title = ww.rest()
568     if not series.wantedp: return
569     season = series.ensure_season()
570     if epi is None: epi = season.ep_i
571
572     if ti == "-":
573       check(season.implicitp, "audio source, but explicit season")
574       dir = lookup(me._audirs, series.name,
575                    "no title, and no audio directory")
576       src = lookup(dir.episodes, season.ep_i,
577                    "episode %d not found in audio dir `%s'" % (epi, dir.dir))
578
579     else:
580       try: src = me._isos[series.name]
581       except KeyError: src = me._auto_epsrc(series)
582
583     episode = season.add_episode(epi, neps, title, src, ti, loch, hich)
584     me._pl.add_episode(episode)
585     me._cur_episode = episode
586
587   def _process_chapter(me, ww):
588     check(me._cur_episode is not None, "no current episode")
589     check(me._cur_episode.source.CHAPTERP,
590           "episode source doesn't allow chapters")
591     if me._chaptersp:
592       if me._cur_chapter is None: i = 1
593       else: i = me._cur_chapter.i + 1
594       me._cur_chapter = me._cur_episode.add_chapter(ww.rest(), i)
595
596   def parse_file(me, fn):
597     with location(FileLocation(fn, 0)) as floc:
598       with open(fn, "r") as f:
599         for line in f:
600           floc.stepline()
601           sline = line.lstrip()
602           if sline == "" or sline.startswith(";"): continue
603
604           if line.startswith("!"): me._process_cmd(Words(line[1:]))
605           elif not line[0].isspace(): me._process_episode(Words(line))
606           else: me._process_chapter(Words(line))
607     me._pl.done_season()
608
609   def done(me):
610     discs = set()
611     for name, vdir in me._vdirs.items():
612       if not me._series[name].wantedp: continue
613       for s in vdir.seasons.values():
614         for d in s.episodes.values():
615           discs.add(d)
616     for adir in me._audirs.values():
617       for d in adir.episodes.values():
618         discs.add(d)
619     for d in sorted(discs, key = lambda d: d.fn):
620       if d.neps is not None and d.neps != d.nuses:
621         raise ExpectedError("disc `%s' has %d episodes, used %d times" %
622                             (d.fn, d.neps, d.nuses))
623     return me._pl
624
625 ROOT = "/mnt/dvd/archive/"
626
627 op = OP.OptionParser \
628   (usage = "%prog [-c] [-s SERIES] EPLS",
629    description = "Generate M3U playlists from an episode list.")
630 op.add_option("-c", "--chapters",
631               dest = "chaptersp", action = "store_true", default = False,
632               help = "Output individual chapter names")
633 op.add_option("-s", "--series",
634               dest = "series", type = "str", default = None,
635               help = "Output only the listed SERIES (comma-separated)")
636 opts, argv = op.parse_args()
637 if len(argv) != 1: op.print_usage(file = SYS.stderr); SYS.exit(2)
638 if opts.series is None:
639   series_wanted = None
640 else:
641   series_wanted = set()
642   for name in opts.series.split(","): series_wanted.add(name)
643 try:
644   ep = EpisodeListParser(series_wanted, opts.chaptersp)
645   ep.parse_file(argv[0])
646   pl = ep.done()
647   pl.write(SYS.stdout)
648 except (ExpectedError, IOError, OSError) as e:
649   LOC.report(e)
650   SYS.exit(2)