[metze/test/web/.git] / searchhelp.html
1 <!--#include virtual="/samba/header.html" -->
3 <p align=center>
4 <H1 align=center>Search Help</H1>
5 <HR size=4 width=75% align=center>
6 <p align=center>Extracted from the <a href="">Glimpse Man Page</a>
7 <br>The font size is increased here so you can read the commas, quotes, and
8 semi colins.
9 <p>
10 <font size=+1>
11 <B>Boolean operations</B><BR>
12  <B>Glimpse</B> (the search engine) supports an `AND' operation denoted
13 by the symbol `;' an `OR' operation denoted by the
14 symbol `,', or any combination. For example, `<I>pizza</I>;<I>cheeseburger</I>' will output all
15 lines containing both patterns. <I>define</I>;<I>DEFAULT</I>'
16 will output all lines containing both `define' and
17 `DEFAULT' (anywhere in the line, not necessarily in
18 order). `{<I>political</I>,<I>computer</I>};<I>science</I>'
19 will match `political science' or `science of computers'.<P>
20 <B>Wild cards</B><BR>
21  The symbol `#' is used to denote a sequence of any
22 number (including 0) of arbitrary characters.
23 The symbol # is equivalent to .* in egrep. In fact,
24 .* will work too, because it is a valid regular expression
25 (see below), but unless this is part of an actual regular
26 expression, # will work faster. (Currently glimpse
27 is experiencing some problems with #.)<P>
28 <B>Combination of exact and approximate matching</B>
29 Any pattern inside angle brackets &lt;&gt; must match
30 the text exactly even if the match is with errors.
31 For example, &lt;mathemat&gt;ics matches mathematical
32 with one error (replacing the last s with an a), but
33 mathe&lt;matics&gt; does not match mathematical no
34 matter how many errors are allowed. (This option is
35 buggy at the moment.)<P>
36 <B>Regular expressions</B><BR>
37  Since the index is word based, a regular expression
38 must match words that appear in the index for glimpse
39 to find it. Glimpse first strips the regular expression
40 from all non-alphabetic characters, and searches the
41 index for all remaining words. It then applies the
42 regular expression matching algorithm to the files
43 found in the index. For example, `abc.*xyz'
44 will search the index for all files that contain both
45 `abc' and `xyz', and then search directly for `abc.*xyz'
46 in those files. The syntax of regular expressions in <B>glimpse</B>
47 is in general the same as that for <B>agrep</B>. The
48 union operation `|', Kleene closure `*', and parentheses
49 () are all supported. Currently `+' is not supported.
50 Regular expressions are currently limited to approximately
51 30 characters (generally excluding meta characters). The maximal number of
52 errors for regular expressions that use `*' or `|'
53 is 4. 
54 </font>
56 <!--#include virtual="/samba/footer.html" -->