chiark / gitweb /
WIP now has most of the ocr parts but does not work yet
[ypp-sc-tools.main.git] / pctb / show-thing.tcl
1 #!/usr/bin/wish
2
3 # usage:
4 #  run show-thing without args
5 #  then on stdin write
6 #     one line which is a Tcl list for foolist
7 #     the xpm in the format expected
8 #  then expect child to raise SIGSTOP or exit 0 or exit nonzero
9 #  if child raised SIGSTOP, check database was updated
10
11 proc manyset {list args} {
12     foreach val $list var $args {
13         upvar 1 $var my
14         set my $val
15     }
16 }
17
18 set foolist {
19     7 11 1 M
20     13 17 0 a
21     19 23 0 n
22 }
23 set unk_l 25
24 set unk_r 29
25 set unk_context 0
26
27
28
29 set mul 6
30 set inter 1
31 set rhsmost_max -1
32
33 set f [open text.xpm]
34 set o {}
35 set y -3
36 while 1 {
37     if {[gets $f l] < 0} { error "huh? "}
38     if {![regexp {^"(.*)",$} $l dummy l]} {
39         append o "$l\n"
40         if {[regexp {^\}\;$} $l]} break
41         continue
42     }
43     if {$y==-3} {
44         manyset $l cols rows colours cpp
45         #assert {$colours==2}
46         #assert {$cpp==1}
47         set mulcols [expr {$cols*$mul+$inter}]
48         set mulrows [expr {$rows*$mul+$inter}]
49         append o "\"$mulcols $mulrows 9 1\",\n"
50         for {set x 0} {$x<$cols} {incr x} { set wordmap($x) 0 }
51     } elseif {$y==-2} { # first pixel
52         append o \
53 "\"+ c #111\",
54 \"a c #800\",
55 \"A c #fcc\",
56 \"b c #00c\",
57 \"B c #fff\",
58 \"u c #000\",
59 \"U c #ff0\",
60 \"q c #000\",
61 \"Q c #ff0\",\n"
62     } elseif {$y==-1} { # 2nd pixel but we've already printed ours
63     } else {
64         set ybit [expr {1<<$y}]
65         set x 0
66         set ol "\"+"
67         set olh $ol
68         foreach c [split $l ""] {
69             set how "u"
70             if {$x >= $unk_l && $x <= $unk_r} {
71                 set how q
72             } else {
73                 set ab 0
74                 foreach {min max context got} $foolist {
75                     set rhsmost_max $max
76                     if {$x >= $min && $x <= $max} {
77                         set how [lindex {a b} $ab]
78                         break
79                     }
80                     set ab [expr {!$ab}]
81                 }
82             }
83             switch -exact $c {
84                 " " { set p $how }
85                 "o" {
86                     set p [string toupper $how]
87                     incr wordmap($x) $ybit
88                 }
89                 default { error "$c ?" }
90             }
91             append ol "[string repeat $p [expr {$mul-$inter}]][
92                          string repeat + $inter]"
93             append olh [string repeat + $mul]
94             incr x
95         }
96         set ole "\",\n"
97         append ol $ole
98         append olh $ole
99         set olhn [string repeat $olh $inter]
100         if {!$y} { append o $olhn }
101         append o [string repeat $ol [expr {$mul-1}]]
102         append o $olhn
103     }
104     incr y
105 }
106
107 #puts $o
108
109 set xpm [exec xpmtoppm << $o]
110
111 set gotsh 20
112 set csrh 20
113
114 frame .d -width $mulcols -height [expr {$csrh+$mulrows+$gotsh}]
115
116 set mi [image create photo -data $xpm]
117 label .d.mi -image $mi -borderwidth 0
118
119 frame .d.csr -bg black -width $mulcols -height $csrh
120 frame .d.got -bg black -width $mulcols -height $gotsh
121
122 foreach {min max context got} $foolist {
123     frame .d.got.m$min -bd 0 -background \#888
124     label .d.got.m$min.l -text "$got" -fg white -bg black -bd 0
125     pack .d.got.m$min.l -padx 1 -pady 1
126     place .d.got.m$min -x [expr {$min*$mul+$inter}] -y 0
127 }
128
129 set imcsr [image create bitmap -data \
130 {#define csr_width 11
131 #define csr_height 11
132 static unsigned char csr_bits[] = {
133    0x20, 0x00, 0x20, 0x00, 0x20, 0x00, 0x21, 0x04, 0x22, 0x02, 0x25, 0x05,
134    0xaa, 0x02, 0x74, 0x01, 0xa8, 0x00, 0x70, 0x00, 0x20, 0x00};
135 }]
136
137 frame .d.csr.csr
138 label .d.csr.csr.l -image $imcsr -compound left
139 entry .d.csr.csr.e -bd 0
140 pack .d.csr.csr.l -side left
141
142 frame .d.csr_0 -bg white -height $mulrows -width 1
143 frame .d.csr_1 -bg white -height $mulrows -width 1
144
145 place .d.csr -x 0 -y 0
146 place .d.mi -x 0 -y $csrh
147 place .d.got -x 0 -y [expr {$csrh+$mulrows}]
148 pack .d
149
150 frame .help
151 pack .help
152
153 set cur_already [expr {[llength $foolist]/4-1}]
154 set cur_mode 1 ;# one of:   0 1 already text
155
156 set cur_0 $unk_l
157 set cur_1 [expr {$unk_r+1}]
158 set last_ht {}
159
160 proc helptext {t} {
161     global last_ht
162     if {![string compare $t $last_ht]} return
163     eval destroy [grid slaves .help]
164     set y 0; foreach l $t {
165         set x 0; foreach c $l {
166             set w .help.at${x}x${y}
167             label $w -text $c
168             grid $w -row $y -column $x -padx 5
169             incr x
170         }
171         incr y
172     }
173     set last_ht $t
174 }
175
176 proc recursor/0 {} { recursor//01 0 }
177 proc recursor/1 {} { recursor//01 1 }
178 proc recursor//01 {z1} {
179     global mul rhsmost_max cols foolist
180     upvar #0 cur_$z1 cur
181     .d.csr.csr.l configure -text {adjust}
182     place .d.csr.csr -x [expr {$cur*$mul - 7}]
183     bind_key space { othercursor }
184     bind_leftright cur_$z1 0 [expr {$cols-1}]
185     if {[llength $foolist]} {
186         bind_key Tab { set cur_mode already; recursor }
187     } else {
188         bind_key Tab {}
189     }
190     bind_key Return {
191         if {$cur_0 != $cur_1} {
192             set cur_mode text
193             recursor
194         }
195     }
196     helptext {
197         {{<- ->}   {move cursor, adjusting area to define}}
198         {Space     {switch to moving other cursor}}
199         {Return    {confirm location, enter letter(s)}}
200         {Tab       {switch to correcting earlier ocr}}
201     }
202 }
203 proc othercursor {} {
204     global cur_mode
205     set cur_mode [expr {!$cur_mode}]
206     recursor
207 }
208
209 proc recursor/text {} {
210     helptext {
211         {Return   {confirm entry of new glyph}}
212         {Escape   {abandon entry}}
213     }
214     unbind_all_keys
215     .d.csr.csr.l configure -text {define:}
216     pack .d.csr.csr.e -side left
217     focus .d.csr.csr.e
218     bind_key Return {
219         binary scan [.d.csr.csr.e get] h* hex
220         if {[string length $hex]} {
221             RETURN_RESULT DEFINE "$cur_0 $cur_1 $hex"
222         }
223     }
224     bind_key Escape {
225         bind_key Escape {}
226         pack forget .d.csr.csr.e
227         set cur_mode 1
228         recursor
229     }
230 }
231
232 proc recursor/already {} {
233     global mul
234     global foolist
235     global cur_already mul
236     global foolist cur_already mul
237     .d.csr.csr.l configure -text {correct}
238     set rmax [lindex $foolist [expr {$cur_already*4}]]
239     place .d.csr.csr -x [expr {$rmax*$mul-3}]
240     bind_key Return {}
241     bind_key space {}
242     bind_leftright cur_already 0 [expr {[llength $foolist]/4-1}]
243     bind_key Tab { bind_key Delete {}; set cur_mode 1; recursor }
244     bind_key Delete {
245         RETURN_RESULT DELETE [lrange $foolist \
246                                   [expr $cur_already*4] \
247                                   [expr $cur_already*4+1]]
248     }
249     helptext {
250         {{<- ->}   {move cursor, selecting glyph to correct}}
251         {Del       {clear this glyph from the recognition database}}
252         {Tab       {switch to selecting area to define as new glyph}}
253     }
254 }
255
256 proc bind_key {k proc} {
257     global keybindings
258     bind . <Key-$k> $proc
259     set keybindings($k) [expr {!![string length $proc]}]
260 }
261 proc unbind_all_keys {} {
262     global keybindings
263     foreach k [array names keybindings] { bind_key $k {} }
264 }
265
266 proc bind_leftright {var min max} {
267     bind_key Left  [list leftright $var $min $max -1]
268     bind_key Right [list leftright $var $min $max +1]
269 }
270 proc leftright {var min max inc} {
271     upvar #0 $var v
272     set vnew $v
273     incr vnew $inc
274     if {$vnew < $min || $vnew > $max} return
275     set v $vnew
276     recursor
277 }
278
279 proc recursor {} {
280     global csrh cur_mode cur_0 cur_1 mul
281     foreach z1 {0 1} {
282         place .d.csr_$z1 -y $csrh -x [expr {[set cur_$z1] * $mul}]
283     }
284     recursor/$cur_mode
285 }
286
287
288 # database format:
289 # series of glyphs:
290 #   <context> <ncharacters> <hex>...
291 #   width
292 #   <hex-bitmap>
293
294 # $database($context 0x<bits> 0x<bits>...) = $hex
295
296 proc read_database {} {
297     global database
298     set f [open database r]
299     while {[gets $f l] >= 0} {
300         if {![regexp {^(\w+) (\d+) ((?:[0-9a-f]{2})+)$} $l \
301                   dummy context strl strh]} {
302             error "bad syntax"
303         }
304         if {[string length $strh] != $strl*2} { error "$strh $strl" }
305         gets $f l; set width [format %d $l]
306         set bm $context
307         for {set x 0} {$x < $width} {incr x} {
308             gets $f l; lappend bm [format %x 0x$l]
309         }
310         set database($bm) $strh
311     }
312     close $f
313 }
314
315 proc write_database {} {
316     global database
317     set ol {}
318     foreach bm [array names database] {
319         set strh $database($bm)
320         set strs [binary format h* $strh]
321         set strdo [format "%d %s" [expr {[string length $strh]/2}] $strh]
322         set o "[lindex $bm 0] $strdo\n"
323         append o [format "%d\n" [expr {[llength $bm]-1}]]
324         foreach x [lrange $bm 1 end] { append o "$x\n" }
325         lappend ol $o
326     }
327     set f [open database.new w]
328     foreach o [lsort $ol] {
329         puts -nonewline $f $o
330     }
331     close $f
332     file rename -force database.new database
333 }
334
335 proc update_database/DEFINE {c0 c1 strh} {
336     global foolist unk_l unk_context wordmap database
337     if {$c0 > $c1} { manyset [list $c0 $c1] c1 c0 }
338     if {$c0 == $unk_l} {
339         set ncontext $unk_context
340     } else {
341         foreach {l r context got} $foolist {
342             if {$l==$c0} { set ncontext $context; break }
343         }
344         if {![exists ncontext]} {
345             puts stderr "must start at letter LHS!"
346             return
347         }
348     }
349     set bm $ncontext
350     for {set x $c0} {$x < $c1} {incr x} {
351         lappend bm [format %x $wordmap($x)]
352     }
353     set database($bm) $strh
354     write_database
355 }
356     
357
358 proc RETURN_RESULT {how what} {
359     place forget .d.csr.csr
360     pack forget .d.csr.csr.e
361     helptext {{{ Processing }}}
362     unbind_all_keys
363     update idletasks
364     puts "$how $what"
365     eval update_database/$how $what
366 }
367
368 #    bind . <Key-space> {}
369
370 read_database
371 recursor