chiark / gitweb /
untested utf32_is_word_boundary() and associated table changes
[disorder] / lib / unidata.h
index 72147231288c53bc37f69c4f83857fb63324db5b..5e6df0db7a3a40ee447b78328fd35dab3d1de6e2 100644 (file)
@@ -1,3 +1,4 @@
+/* Automatically generated file, see scripts/make-unidata */
 #ifndef UNIDATA_H
 #define UNIDATA_H
 enum unicode_gc_cat {
@@ -32,12 +33,33 @@ enum unicode_gc_cat {
   unicode_gc_Zp,
   unicode_gc_Zs
 };
+enum unicode_Word_Break {
+  unicode_Word_Break_ALetter,
+  unicode_Word_Break_Extend,
+  unicode_Word_Break_ExtendNumLet,
+  unicode_Word_Break_Format,
+  unicode_Word_Break_Katakana,
+  unicode_Word_Break_MidLetter,
+  unicode_Word_Break_MidNum,
+  unicode_Word_Break_Numeric,
+  unicode_Word_Break_Other
+};
+enum unicode_flags {
+  unicode_normalize_before_casefold = 1
+};
+
 struct unidata {
-  enum unicode_gc_cat gc;
-  int ccc;
-  int upper_offset;
-  int lower_offset;
+  const uint32_t *compat;
+  const uint32_t *canon;
+  const uint32_t *casefold;
+  int16_t upper_offset;
+  int16_t lower_offset;
+  unsigned char ccc;
+  char gc;
+  uint8_t flags;
+  char word_break;
 };
 extern const struct unidata *const unidata[];
-#define UNICODE_NCHARS 195328
+#define UNICODE_NCHARS 195200
+#define UNICODE_MODULUS 128
 #endif