chiark / gitweb /
OCR rejection infrastructure
[ypp-sc-tools.web-live.git] / pctb / README
index a8dc8d7b8f59cbb58b7330b99cc117f812fd8d2f..2a085b2011c9d0938e5ee37cb19fd9ed6420625c 100644 (file)
@@ -96,6 +96,14 @@ The program reads and writes the following files:
    double-check what you're doing before overriding the uploader by
    telling it to ignore an unrecognised commodity.
 
+ * #master-reject#.txt #local-reject#.txt
+
+   Dictionary of regexps which, when the OCR appears to match, we
+   reject instead.  At the moment this is used to stop us thinking
+   that `Butterfly weed' is `Butterflyweed'.  This happens if the
+   character set dictionary is missing the lowercase `y ' glyph.
+   See README.charset.
+
  * #master-char*#.txt  #local-char*#.txt
    #master-pixmap#.txt #local-pixmap#.txt