chiark / gitweb /
utf32_word_split() and utf8_word_split() splits a string into words
[disorder] / lib / words.c
1 /*
2  * This file is part of DisOrder
3  * Copyright (C) 2004, 2007 Richard Kettlewell
4  *
5  * This program is free software; you can redistribute it and/or modify
6  * it under the terms of the GNU General Public License as published by
7  * the Free Software Foundation; either version 2 of the License, or
8  * (at your option) any later version.
9  *
10  * This program is distributed in the hope that it will be useful, but
11  * WITHOUT ANY WARRANTY; without even the implied warranty of
12  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
13  * General Public License for more details.
14  *
15  * You should have received a copy of the GNU General Public License
16  * along with this program; if not, write to the Free Software
17  * Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA 02111-1307
18  * USA
19  */
20
21 #include <config.h>
22 #include "types.h"
23
24 #include <string.h>
25 #include <stddef.h>
26
27 #include "mem.h"
28 #include "vector.h"
29 #include "table.h"
30 #include "words.h"
31 #include "utf8.h"
32 #include "log.h"
33 #include "charset.h"
34
35 #include "unidata.h"
36 #include "unicode.h"
37
38 const char *casefold(const char *ptr) {
39   return utf8_casefold_compat(ptr, strlen(ptr), 0);
40 }
41
42 char **words(const char *s, int *nvecp) {
43   size_t nv;
44   char **v;
45
46   v = utf8_word_split(s, strlen(s), &nv);
47   *nvecp = nv;
48   return v;
49 }
50
51 /*
52 Local Variables:
53 c-basic-offset:2
54 comment-column:40
55 End:
56 */