chiark / gitweb /
wip pager - before change to not converting until sure
[ypp-sc-tools.web-live.git] / pctb / ocr.h
index 0824404579f753ca9ba65dd4d224258f188fdb5f..d9a25f7a790da26812b5352a5d397f4c94e18352 100644 (file)
@@ -1,14 +1,28 @@
 #ifndef OCR_H
 #define OCR_H
 
+#define _GNU_SOURCE
+
 #include <pam.h>
 #include <stdint.h>
 #include <inttypes.h>
 #include <assert.h>
 #include <string.h>
 #include <stdlib.h>
+#include <stdio.h>
+#include <stdarg.h>
+#include <time.h>
+
 #include <sys/types.h>
 #include <sys/wait.h>
+#include <sys/time.h>
+
+
+typedef struct {
+  int w,h;
+  char d[];
+} CanonImage;
+
 
 typedef uint32_t Pixcol;
 #define PSPIXCOL(priscan) priscan##32
@@ -16,17 +30,37 @@ typedef uint32_t Pixcol;
 typedef struct {
   const char *s; /* valid until next call to ocr() */
   int l,r; /* column numbers */
-  int ctx; /* match context index */
+  unsigned ctxmap; /* match context index */
 } OcrResultGlyph;
 
-OcrResultGlyph *ocr(int w, int h, Pixcol cols[]);
+typedef const struct OcrCellTypeInfo *OcrCellType;
+extern const struct OcrCellTypeInfo ocr_celltype_text;
+extern const struct OcrCellTypeInfo ocr_celltype_number;
+
+typedef struct OcrReader OcrReader;
+OcrReader *ocr_init(int h);
+
+OcrResultGlyph *ocr(OcrReader *rd, OcrCellType, int w, Pixcol cols[]);
   /* return value is array terminated by {0,-1,-1}
    * array is valid until next call to ocr()
    */
 
-void ocr_init(void);
+void debug_flush(void);
 
 #define eassert assert
 #define debug stdout
 
+const char *get_vardir(void);
+
+CanonImage *file_read_image(FILE *f);
+int main_test(void);
+
+#define MAX_PAGES 100
+extern CanonImage *page_images[MAX_PAGES];
+extern int npages;
+
+
+#define DEBUG_RECTANGLES
+// #define DEBUG_OCR
+
 #endif /*OCR_H*/