chiark / gitweb /
Add .gitignore for upstream files
[pcre3.git] / NEWS
1 News about PCRE releases
2 ------------------------
3
4 Release 8.39 14-June-2016
5 -------------------------
6
7 Some appropriate PCRE2 JIT improvements have been retro-fitted to PCRE1. Apart
8 from that, this is another bug-fix release. Note that this library (now called
9 PCRE1) is now being maintained for bug fixes only. New projects are advised to
10 use the new PCRE2 libraries.
11
12
13 Release 8.38 23-November-2015
14 -----------------------------
15
16 This is bug-fix release. Note that this library (now called PCRE1) is now being
17 maintained for bug fixes only. New projects are advised to use the new PCRE2
18 libraries.
19
20
21 Release 8.37 28-April-2015
22 --------------------------
23
24 This is bug-fix release. Note that this library (now called PCRE1) is now being
25 maintained for bug fixes only. New projects are advised to use the new PCRE2
26 libraries.
27
28
29 Release 8.36 26-September-2014
30 ------------------------------
31
32 This is primarily a bug-fix release. However, in addition, the Unicode data
33 tables have been updated to Unicode 7.0.0.
34
35
36 Release 8.35 04-April-2014
37 --------------------------
38
39 There have been performance improvements for classes containing non-ASCII
40 characters and the "auto-possessification" feature has been extended. Other
41 minor improvements have been implemented and bugs fixed. There is a new callout
42 feature to enable applications to do detailed stack checks at compile time, to
43 avoid running out of stack for deeply nested parentheses. The JIT compiler has
44 been extended with experimental support for ARM-64, MIPS-64, and PPC-LE.
45
46
47 Release 8.34 15-December-2013
48 -----------------------------
49
50 As well as fixing the inevitable bugs, performance has been improved by
51 refactoring and extending the amount of "auto-possessification" that PCRE does.
52 Other notable changes:
53
54 .  Implemented PCRE_INFO_MATCH_EMPTY, which yields 1 if the pattern can match
55    an empty string. If it can, pcretest shows this in its information output.
56
57 .  A back reference to a named subpattern when there is more than one of the
58    same name now checks them in the order in which they appear in the pattern.
59    The first one that is set is used for the reference. Previously only the
60    first one was inspected. This change makes PCRE more compatible with Perl.
61
62 .  Unicode character properties were updated from Unicode 6.3.0.
63
64 .  The character VT has been added to the set of characters that match \s and
65    are generally treated as white space, following this same change in Perl
66    5.18. There is now no difference between "Perl space" and "POSIX space".
67
68 .  Perl has changed its handling of \8 and \9. If there is no previously
69    encountered capturing group of those numbers, they are treated as the
70    literal characters 8 and 9 instead of a binary zero followed by the
71    literals. PCRE now does the same.
72
73 .  Following Perl, added \o{} to specify codepoints in octal, making it
74    possible to specify values greater than 0777 and also making them
75    unambiguous.
76
77 .  In UCP mode, \s was not matching two of the characters that Perl matches,
78    namely NEL (U+0085) and MONGOLIAN VOWEL SEPARATOR (U+180E), though they
79    were matched by \h.
80
81 .  Add JIT support for the 64 bit TileGX architecture.
82
83 .  Upgraded the handling of the POSIX classes [:graph:], [:print:], and
84    [:punct:] when PCRE_UCP is set so as to include the same characters as Perl
85    does in Unicode mode.
86
87 .  Perl no longer allows group names to start with digits, so I have made this
88    change also in PCRE.
89
90 .  Added support for [[:<:]] and [[:>:]] as used in the BSD POSIX library to
91    mean "start of word" and "end of word", respectively, as a transition aid.
92
93
94 Release 8.33 28-May-2013
95 --------------------------
96
97 A number of bugs are fixed, and some performance improvements have been made.
98 There are also some new features, of which these are the most important:
99
100 .  The behaviour of the backtracking verbs has been rationalized and
101    documented in more detail.
102
103 .  JIT now supports callouts and all of the backtracking verbs.
104
105 .  Unicode validation has been updated in the light of Unicode Corrigendum #9,
106    which points out that "non characters" are not "characters that may not
107    appear in Unicode strings" but rather "characters that are reserved for
108    internal use and have only local meaning".
109
110 .  (*LIMIT_MATCH=d) and (*LIMIT_RECURSION=d) have been added so that the
111    creator of a pattern can specify lower (but not higher) limits for the
112    matching process.
113
114 .  The PCRE_NEVER_UTF option is available to prevent pattern-writers from using
115    the (*UTF) feature, as this could be a security issue.
116
117
118 Release 8.32 30-November-2012
119 -----------------------------
120
121 This release fixes a number of bugs, but also has some new features. These are
122 the highlights:
123
124 .  There is now support for 32-bit character strings and UTF-32. Like the
125    16-bit support, this is done by compiling a separate 32-bit library.
126
127 .  \X now matches a Unicode extended grapheme cluster.
128
129 .  Case-independent matching of Unicode characters that have more than one
130    "other case" now makes all three (or more) characters equivalent. This
131    applies, for example, to Greek Sigma, which has two lowercase versions.
132
133 .  Unicode character properties are updated to Unicode 6.2.0.
134
135 .  The EBCDIC support, which had decayed, has had a spring clean.
136
137 .  A number of JIT optimizations have been added, which give faster JIT
138    execution speed. In addition, a new direct interface to JIT execution is
139    available. This bypasses some of the sanity checks of pcre_exec() to give a
140    noticeable speed-up.
141
142 .  A number of issues in pcregrep have been fixed, making it more compatible
143    with GNU grep. In particular, --exclude and --include (and variants) apply
144    to all files now, not just those obtained from scanning a directory
145    recursively. In Windows environments, the default action for directories is
146    now "skip" instead of "read" (which provokes an error).
147
148 .  If the --only-matching (-o) option in pcregrep is specified multiple
149    times, each one causes appropriate output. For example, -o1 -o2 outputs the
150    substrings matched by the 1st and 2nd capturing parentheses. A separating
151    string can be specified by --om-separator (default empty).
152
153 .  When PCRE is built via Autotools using a version of gcc that has the
154    "visibility" feature, it is used to hide internal library functions that are
155    not part of the public API.
156
157
158 Release 8.31 06-July-2012
159 -------------------------
160
161 This is mainly a bug-fixing release, with a small number of developments:
162
163 . The JIT compiler now supports partial matching and the (*MARK) and
164   (*COMMIT) verbs.
165
166 . PCRE_INFO_MAXLOOKBEHIND can be used to find the longest lookbehind in a
167   pattern.
168
169 . There should be a performance improvement when using the heap instead of the
170   stack for recursion.
171
172 . pcregrep can now be linked with libedit as an alternative to libreadline.
173
174 . pcregrep now has a --file-list option where the list of files to scan is
175   given as a file.
176
177 . pcregrep now recognizes binary files and there are related options.
178
179 . The Unicode tables have been updated to 6.1.0.
180
181 As always, the full list of changes is in the ChangeLog file.
182
183
184 Release 8.30 04-February-2012
185 -----------------------------
186
187 Release 8.30 introduces a major new feature: support for 16-bit character
188 strings, compiled as a separate library. There are a few changes to the
189 8-bit library, in addition to some bug fixes.
190
191 . The pcre_info() function, which has been obsolete for over 10 years, has
192   been removed.
193
194 . When a compiled pattern was saved to a file and later reloaded on a host
195   with different endianness, PCRE used automatically to swap the bytes in some
196   of the data fields. With the advent of the 16-bit library, where more of this
197   swapping is needed, it is no longer done automatically. Instead, the bad
198   endianness is detected and a specific error is given. The user can then call
199   a new function called pcre_pattern_to_host_byte_order() (or an equivalent
200   16-bit function) to do the swap.
201
202 . In UTF-8 mode, the values 0xd800 to 0xdfff are not legal Unicode
203   code points and are now faulted. (They are the so-called "surrogates"
204   that are reserved for coding high values in UTF-16.)
205
206
207 Release 8.21 12-Dec-2011
208 ------------------------
209
210 This is almost entirely a bug-fix release. The only new feature is the ability
211 to obtain the size of the memory used by the JIT compiler.
212
213
214 Release 8.20 21-Oct-2011
215 ------------------------
216
217 The main change in this release is the inclusion of Zoltan Herczeg's
218 just-in-time compiler support, which can be accessed by building PCRE with
219 --enable-jit. Large performance benefits can be had in many situations. 8.20
220 also fixes an unfortunate bug that was introduced in 8.13 as well as tidying up
221 a number of infelicities and differences from Perl.
222
223
224 Release 8.13 16-Aug-2011
225 ------------------------
226
227 This is mainly a bug-fix release. There has been a lot of internal refactoring.
228 The Unicode tables have been updated. The only new feature in the library is
229 the passing of *MARK information to callouts. Some additions have been made to
230 pcretest to make testing easier and more comprehensive. There is a new option
231 for pcregrep to adjust its internal buffer size.
232
233
234 Release 8.12 15-Jan-2011
235 ------------------------
236
237 This release fixes some bugs in pcregrep, one of which caused the tests to fail
238 on 64-bit big-endian systems. There are no changes to the code of the library.
239
240
241 Release 8.11 10-Dec-2010
242 ------------------------
243
244 A number of bugs in the library and in pcregrep have been fixed. As always, see
245 ChangeLog for details. The following are the non-bug-fix changes:
246
247 . Added --match-limit and --recursion-limit to pcregrep.
248
249 . Added an optional parentheses number to the -o and --only-matching options
250   of pcregrep.
251
252 . Changed the way PCRE_PARTIAL_HARD affects the matching of $, \z, \Z, \b, and
253   \B.
254
255 . Added PCRE_ERROR_SHORTUTF8 to make it possible to distinguish between a
256   bad UTF-8 sequence and one that is incomplete when using PCRE_PARTIAL_HARD.
257
258 . Recognize (*NO_START_OPT) at the start of a pattern to set the PCRE_NO_
259   START_OPTIMIZE option, which is now allowed at compile time
260
261
262 Release 8.10 25-Jun-2010
263 ------------------------
264
265 There are two major additions: support for (*MARK) and friends, and the option
266 PCRE_UCP, which changes the behaviour of \b, \d, \s, and \w (and their
267 opposites) so that they make use of Unicode properties. There are also a number
268 of lesser new features, and several bugs have been fixed. A new option,
269 --line-buffered, has been added to pcregrep, for use when it is connected to
270 pipes.
271
272
273 Release 8.02 19-Mar-2010
274 ------------------------
275
276 Another bug-fix release.
277
278
279 Release 8.01 19-Jan-2010
280 ------------------------
281
282 This is a bug-fix release. Several bugs in the code itself and some bugs and
283 infelicities in the build system have been fixed.
284
285
286 Release 8.00 19-Oct-09
287 ----------------------
288
289 Bugs have been fixed in the library and in pcregrep. There are also some
290 enhancements. Restrictions on patterns used for partial matching have been
291 removed, extra information is given for partial matches, the partial matching
292 process has been improved, and an option to make a partial match override a
293 full match is available. The "study" process has been enhanced by finding a
294 lower bound matching length. Groups with duplicate numbers may now have
295 duplicated names without the use of PCRE_DUPNAMES. However, they may not have
296 different names. The documentation has been revised to reflect these changes.
297 The version number has been expanded to 3 digits as it is clear that the rate
298 of change is not slowing down.
299
300
301 Release 7.9 11-Apr-09
302 ---------------------
303
304 Mostly bugfixes and tidies with just a couple of minor functional additions.
305
306
307 Release 7.8 05-Sep-08
308 ---------------------
309
310 More bug fixes, plus a performance improvement in Unicode character property
311 lookup.
312
313
314 Release 7.7 07-May-08
315 ---------------------
316
317 This is once again mainly a bug-fix release, but there are a couple of new
318 features.
319
320
321 Release 7.6 28-Jan-08
322 ---------------------
323
324 The main reason for having this release so soon after 7.5 is because it fixes a
325 potential buffer overflow problem in pcre_compile() when run in UTF-8 mode. In
326 addition, the CMake configuration files have been brought up to date.
327
328
329 Release 7.5 10-Jan-08
330 ---------------------
331
332 This is mainly a bug-fix release. However the ability to link pcregrep with
333 libz or libbz2 and the ability to link pcretest with libreadline have been
334 added. Also the --line-offsets and --file-offsets options were added to
335 pcregrep.
336
337
338 Release 7.4 21-Sep-07
339 ---------------------
340
341 The only change of specification is the addition of options to control whether
342 \R matches any Unicode line ending (the default) or just CR, LF, and CRLF.
343 Otherwise, the changes are bug fixes and a refactoring to reduce the number of
344 relocations needed in a shared library. There have also been some documentation
345 updates, in particular, some more information about using CMake to build PCRE
346 has been added to the NON-UNIX-USE file.
347
348
349 Release 7.3 28-Aug-07
350 ---------------------
351
352 Most changes are bug fixes. Some that are not:
353
354 1. There is some support for Perl 5.10's experimental "backtracking control
355    verbs" such as (*PRUNE).
356
357 2. UTF-8 checking is now as per RFC 3629 instead of RFC 2279; this is more
358    restrictive in the strings it accepts.
359
360 3. Checking for potential integer overflow has been made more dynamic, and as a
361    consequence there is no longer a hard limit on the size of a subpattern that
362    has a limited repeat count.
363
364 4. When CRLF is a valid line-ending sequence, pcre_exec() and pcre_dfa_exec()
365    no longer advance by two characters instead of one when an unanchored match
366    fails at CRLF if there are explicit CR or LF matches within the pattern.
367    This gets rid of some anomalous effects that previously occurred.
368
369 5. Some PCRE-specific settings for varying the newline options at the start of
370    a pattern have been added.
371
372
373 Release 7.2 19-Jun-07
374 ---------------------
375
376 WARNING: saved patterns that were compiled by earlier versions of PCRE must be
377 recompiled for use with 7.2 (necessitated by the addition of \K, \h, \H, \v,
378 and \V).
379
380 Correction to the notes for 7.1: the note about shared libraries for Windows is
381 wrong. Previously, three libraries were built, but each could function
382 independently. For example, the pcreposix library also included all the
383 functions from the basic pcre library. The change is that the three libraries
384 are no longer independent. They are like the Unix libraries. To use the
385 pcreposix functions, for example, you need to link with both the pcreposix and
386 the basic pcre library.
387
388 Some more features from Perl 5.10 have been added:
389
390   (?-n) and (?+n) relative references for recursion and subroutines.
391
392   (?(-n) and (?(+n) relative references as conditions.
393
394   \k{name} and \g{name} are synonyms for \k<name>.
395
396   \K to reset the start of the matched string; for example, (foo)\Kbar
397   matches bar preceded by foo, but only sets bar as the matched string.
398
399   (?| introduces a group where the capturing parentheses in each alternative
400   start from the same number; for example, (?|(abc)|(xyz)) sets capturing
401   parentheses number 1 in both cases.
402
403   \h, \H, \v, \V match horizontal and vertical whitespace, respectively.
404
405
406 Release 7.1 24-Apr-07
407 ---------------------
408
409 There is only one new feature in this release: a linebreak setting of
410 PCRE_NEWLINE_ANYCRLF. It is a cut-down version of PCRE_NEWLINE_ANY, which
411 recognizes only CRLF, CR, and LF as linebreaks.
412
413 A few bugs are fixed (see ChangeLog for details), but the major change is a
414 complete re-implementation of the build system. This now has full Autotools
415 support and so is now "standard" in some sense. It should help with compiling
416 PCRE in a wide variety of environments.
417
418 NOTE: when building shared libraries for Windows, three dlls are now built,
419 called libpcre, libpcreposix, and libpcrecpp. Previously, everything was
420 included in a single dll.
421
422 Another important change is that the dftables auxiliary program is no longer
423 compiled and run at "make" time by default. Instead, a default set of character
424 tables (assuming ASCII coding) is used. If you want to use dftables to generate
425 the character tables as previously, add --enable-rebuild-chartables to the
426 "configure" command. You must do this if you are compiling PCRE to run on a
427 system that uses EBCDIC code.
428
429 There is a discussion about character tables in the README file. The default is
430 not to use dftables so that that there is no problem when cross-compiling.
431
432
433 Release 7.0 19-Dec-06
434 ---------------------
435
436 This release has a new major number because there have been some internal
437 upheavals to facilitate the addition of new optimizations and other facilities,
438 and to make subsequent maintenance and extension easier. Compilation is likely
439 to be a bit slower, but there should be no major effect on runtime performance.
440 Previously compiled patterns are NOT upwards compatible with this release. If
441 you have saved compiled patterns from a previous release, you will have to
442 re-compile them. Important changes that are visible to users are:
443
444 1. The Unicode property tables have been updated to Unicode 5.0.0, which adds
445    some more scripts.
446
447 2. The option PCRE_NEWLINE_ANY causes PCRE to recognize any Unicode newline
448    sequence as a newline.
449
450 3. The \R escape matches a single Unicode newline sequence as a single unit.
451
452 4. New features that will appear in Perl 5.10 are now in PCRE. These include
453    alternative Perl syntax for named parentheses, and Perl syntax for
454    recursion.
455
456 5. The C++ wrapper interface has been extended by the addition of a
457    QuoteMeta function and the ability to allow copy construction and
458    assignment.
459
460 For a complete list of changes, see the ChangeLog file.
461
462
463 Release 6.7 04-Jul-06
464 ---------------------
465
466 The main additions to this release are the ability to use the same name for
467 multiple sets of parentheses, and support for CRLF line endings in both the
468 library and pcregrep (and in pcretest for testing).
469
470 Thanks to Ian Taylor, the stack usage for many kinds of pattern has been
471 significantly reduced for certain subject strings.
472
473
474 Release 6.5 01-Feb-06
475 ---------------------
476
477 Important changes in this release:
478
479 1. A number of new features have been added to pcregrep.
480
481 2. The Unicode property tables have been updated to Unicode 4.1.0, and the
482    supported properties have been extended with script names such as "Arabic",
483    and the derived properties "Any" and "L&". This has necessitated a change to
484    the interal format of compiled patterns. Any saved compiled patterns that
485    use \p or \P must be recompiled.
486
487 3. The specification of recursion in patterns has been changed so that all
488    recursive subpatterns are automatically treated as atomic groups. Thus, for
489    example, (?R) is treated as if it were (?>(?R)). This is necessary because
490    otherwise there are situations where recursion does not work.
491
492 See the ChangeLog for a complete list of changes, which include a number of bug
493 fixes and tidies.
494
495
496 Release 6.0 07-Jun-05
497 ---------------------
498
499 The release number has been increased to 6.0 because of the addition of several
500 major new pieces of functionality.
501
502 A new function, pcre_dfa_exec(), which implements pattern matching using a DFA
503 algorithm, has been added. This has a number of advantages for certain cases,
504 though it does run more slowly, and lacks the ability to capture substrings. On
505 the other hand, it does find all matches, not just the first, and it works
506 better for partial matching. The pcrematching man page discusses the
507 differences.
508
509 The pcretest program has been enhanced so that it can make use of the new
510 pcre_dfa_exec() matching function and the extra features it provides.
511
512 The distribution now includes a C++ wrapper library. This is built
513 automatically if a C++ compiler is found. The pcrecpp man page discusses this
514 interface.
515
516 The code itself has been re-organized into many more files, one for each
517 function, so it no longer requires everything to be linked in when static
518 linkage is used. As a consequence, some internal functions have had to have
519 their names exposed. These functions all have names starting with _pcre_. They
520 are undocumented, and are not intended for use by outside callers.
521
522 The pcregrep program has been enhanced with new functionality such as
523 multiline-matching and options for output more matching context. See the
524 ChangeLog for a complete list of changes to the library and the utility
525 programs.
526
527
528 Release 5.0 13-Sep-04
529 ---------------------
530
531 The licence under which PCRE is released has been changed to the more
532 conventional "BSD" licence.
533
534 In the code, some bugs have been fixed, and there are also some major changes
535 in this release (which is why I've increased the number to 5.0). Some changes
536 are internal rearrangements, and some provide a number of new facilities. The
537 new features are:
538
539 1. There's an "automatic callout" feature that inserts callouts before every
540    item in the regex, and there's a new callout field that gives the position
541    in the pattern - useful for debugging and tracing.
542
543 2. The extra_data structure can now be used to pass in a set of character
544    tables at exec time. This is useful if compiled regex are saved and re-used
545    at a later time when the tables may not be at the same address. If the
546    default internal tables are used, the pointer saved with the compiled
547    pattern is now set to NULL, which means that you don't need to do anything
548    special unless you are using custom tables.
549
550 3. It is possible, with some restrictions on the content of the regex, to
551    request "partial" matching. A special return code is given if all of the
552    subject string matched part of the regex. This could be useful for testing
553    an input field as it is being typed.
554
555 4. There is now some optional support for Unicode character properties, which
556    means that the patterns items such as \p{Lu} and \X can now be used. Only
557    the general category properties are supported. If PCRE is compiled with this
558    support, an additional 90K data structure is include, which increases the
559    size of the library dramatically.
560
561 5. There is support for saving compiled patterns and re-using them later.
562
563 6. There is support for running regular expressions that were compiled on a
564    different host with the opposite endianness.
565
566 7. The pcretest program has been extended to accommodate the new features.
567
568 The main internal rearrangement is that sequences of literal characters are no
569 longer handled as strings. Instead, each character is handled on its own. This
570 makes some UTF-8 handling easier, and makes the support of partial matching
571 possible. Compiled patterns containing long literal strings will be larger as a
572 result of this change; I hope that performance will not be much affected.
573
574
575 Release 4.5 01-Dec-03
576 ---------------------
577
578 Again mainly a bug-fix and tidying release, with only a couple of new features:
579
580 1. It's possible now to compile PCRE so that it does not use recursive
581 function calls when matching. Instead it gets memory from the heap. This slows
582 things down, but may be necessary on systems with limited stacks.
583
584 2. UTF-8 string checking has been tightened to reject overlong sequences and to
585 check that a starting offset points to the start of a character. Failure of the
586 latter returns a new error code: PCRE_ERROR_BADUTF8_OFFSET.
587
588 3. PCRE can now be compiled for systems that use EBCDIC code.
589
590
591 Release 4.4 21-Aug-03
592 ---------------------
593
594 This is mainly a bug-fix and tidying release. The only new feature is that PCRE
595 checks UTF-8 strings for validity by default. There is an option to suppress
596 this, just in case anybody wants that teeny extra bit of performance.
597
598
599 Releases 4.1 - 4.3
600 ------------------
601
602 Sorry, I forgot about updating the NEWS file for these releases. Please take a
603 look at ChangeLog.
604
605
606 Release 4.0 17-Feb-03
607 ---------------------
608
609 There have been a lot of changes for the 4.0 release, adding additional
610 functionality and mending bugs. Below is a list of the highlights of the new
611 functionality. For full details of these features, please consult the
612 documentation. For a complete list of changes, see the ChangeLog file.
613
614 1. Support for Perl's \Q...\E escapes.
615
616 2. "Possessive quantifiers" ?+, *+, ++, and {,}+ which come from Sun's Java
617 package. They provide some syntactic sugar for simple cases of "atomic
618 grouping".
619
620 3. Support for the \G assertion. It is true when the current matching position
621 is at the start point of the match.
622
623 4. A new feature that provides some of the functionality that Perl provides
624 with (?{...}). The facility is termed a "callout". The way it is done in PCRE
625 is for the caller to provide an optional function, by setting pcre_callout to
626 its entry point. To get the function called, the regex must include (?C) at
627 appropriate points.
628
629 5. Support for recursive calls to individual subpatterns. This makes it really
630 easy to get totally confused.
631
632 6. Support for named subpatterns. The Python syntax (?P<name>...) is used to
633 name a group.
634
635 7. Several extensions to UTF-8 support; it is now fairly complete. There is an
636 option for pcregrep to make it operate in UTF-8 mode.
637
638 8. The single man page has been split into a number of separate man pages.
639 These also give rise to individual HTML pages which are put in a separate
640 directory. There is an index.html page that lists them all. Some hyperlinking
641 between the pages has been installed.
642
643
644 Release 3.5 15-Aug-01
645 ---------------------
646
647 1. The configuring system has been upgraded to use later versions of autoconf
648 and libtool. By default it builds both a shared and a static library if the OS
649 supports it. You can use --disable-shared or --disable-static on the configure
650 command if you want only one of them.
651
652 2. The pcretest utility is now installed along with pcregrep because it is
653 useful for users (to test regexs) and by doing this, it automatically gets
654 relinked by libtool. The documentation has been turned into a man page, so
655 there are now .1, .txt, and .html versions in /doc.
656
657 3. Upgrades to pcregrep:
658    (i)   Added long-form option names like gnu grep.
659    (ii)  Added --help to list all options with an explanatory phrase.
660    (iii) Added -r, --recursive to recurse into sub-directories.
661    (iv)  Added -f, --file to read patterns from a file.
662
663 4. Added --enable-newline-is-cr and --enable-newline-is-lf to the configure
664 script, to force use of CR or LF instead of \n in the source. On non-Unix
665 systems, the value can be set in config.h.
666
667 5. The limit of 200 on non-capturing parentheses is a _nesting_ limit, not an
668 absolute limit. Changed the text of the error message to make this clear, and
669 likewise updated the man page.
670
671 6. The limit of 99 on the number of capturing subpatterns has been removed.
672 The new limit is 65535, which I hope will not be a "real" limit.
673
674
675 Release 3.3 01-Aug-00
676 ---------------------
677
678 There is some support for UTF-8 character strings. This is incomplete and
679 experimental. The documentation describes what is and what is not implemented.
680 Otherwise, this is just a bug-fixing release.
681
682
683 Release 3.0 01-Feb-00
684 ---------------------
685
686 1. A "configure" script is now used to configure PCRE for Unix systems. It
687 builds a Makefile, a config.h file, and the pcre-config script.
688
689 2. PCRE is built as a shared library by default.
690
691 3. There is support for POSIX classes such as [:alpha:].
692
693 5. There is an experimental recursion feature.
694
695 ----------------------------------------------------------------------------
696           IMPORTANT FOR THOSE UPGRADING FROM VERSIONS BEFORE 2.00
697
698 Please note that there has been a change in the API such that a larger
699 ovector is required at matching time, to provide some additional workspace.
700 The new man page has details. This change was necessary in order to support
701 some of the new functionality in Perl 5.005.
702
703           IMPORTANT FOR THOSE UPGRADING FROM VERSION 2.00
704
705 Another (I hope this is the last!) change has been made to the API for the
706 pcre_compile() function. An additional argument has been added to make it
707 possible to pass over a pointer to character tables built in the current
708 locale by pcre_maketables(). To use the default tables, this new argument
709 should be passed as NULL.
710
711           IMPORTANT FOR THOSE UPGRADING FROM VERSION 2.05
712
713 Yet another (and again I hope this really is the last) change has been made
714 to the API for the pcre_exec() function. An additional argument has been
715 added to make it possible to start the match other than at the start of the
716 subject string. This is important if there are lookbehinds. The new man
717 page has the details, but you just want to convert existing programs, all
718 you need to do is to stick in a new fifth argument to pcre_exec(), with a
719 value of zero. For example, change
720
721   pcre_exec(pattern, extra, subject, length, options, ovec, ovecsize)
722 to
723   pcre_exec(pattern, extra, subject, length, 0, options, ovec, ovecsize)
724
725 ****