old fixes I forgot to commit
[sfrench/samba-autobuild/.git] / source3 / lib / util_unistr.c
index 01ec262f609b0f73ac4431cbda19ec38633d5c21..7d690ecb9c6e011e3eb74788aa6c367c07deae94 100644 (file)
@@ -1,8 +1,8 @@
 /* 
    Unix SMB/Netbios implementation.
-   Version 1.9.
+   Version 3.0
    Samba utility functions
-   Copyright (C) Andrew Tridgell 1992-1998
+   Copyright (C) Andrew Tridgell 1992-2001
    
    This program is free software; you can redistribute it and/or modify
    it under the terms of the GNU General Public License as published by
 
 #include "includes.h"
 
-/*******************************************************************
- Put an ASCII string into a UNICODE buffer (little endian).
- ********************************************************************/
+#ifndef MAXUNI
+#define MAXUNI 1024
+#endif
+
+/* these 3 tables define the unicode case handling.  They are loaded
+   at startup either via mmap() or read() from the lib directory */
+static smb_ucs2_t *upcase_table;
+static smb_ucs2_t *lowcase_table;
+static uint8 *valid_table;
 
-char *ascii_to_unibuf(char *dest, const char *src, int maxlen)
+/*******************************************************************
+load the case handling tables
+********************************************************************/
+void load_case_tables(void)
 {
-       char *destend = dest + maxlen;
-       register char c;
+       static int initialised;
+       int i;
+
+       if (initialised) return;
+       initialised = 1;
+
+       upcase_table = map_file(lib_path("upcase.dat"), 0x20000);
+       lowcase_table = map_file(lib_path("lowcase.dat"), 0x20000);
+       valid_table = map_file(lib_path("valid.dat"), 0x10000);
+
+       /* we would like Samba to limp along even if these tables are
+          not available */
+       if (!upcase_table) {
+               DEBUG(1,("creating lame upcase table\n"));
+               upcase_table = malloc(0x20000);
+               for (i=0;i<256;i++) upcase_table[i] = islower(i)?toupper(i):i;
+               for (;i<0x10000;i++) upcase_table[i] = i;
+       }
 
-       while (dest < destend)
-       {
-               c = *(src++);
-               if (c == 0)
-               {
-                       break;
-               }
+       if (!lowcase_table) {
+               DEBUG(1,("creating lame lowcase table\n"));
+               lowcase_table = malloc(0x20000);
+               for (i=0;i<256;i++) lowcase_table[i] = isupper(i)?tolower(i):i;
+               for (;i<0x10000;i++) lowcase_table[i] = i;
+       }
 
-               *(dest++) = c;
-               *(dest++) = 0;
+       if (!valid_table) {
+               const char *allowed = "!#$%&'()_-.@^`{}~";
+               DEBUG(1,("creating lame valid table\n"));
+               valid_table = malloc(0x10000);
+               for (i=0;i<256;i++) valid_table[i] = isalnum(i) || strchr(allowed,i);
+               for (;i<0x10000;i++) valid_table[i] = 0;
        }
+}
 
-       *dest++ = 0;
-       *dest++ = 0;
-       return dest;
+
+/*******************************************************************
+ Write a string in (little-endian) unicode format. src is in
+ the current DOS codepage. len is the length in bytes of the
+ string pointed to by dst.
+
+ if null_terminate is True then null terminate the packet (adds 2 bytes)
+
+ the return value is the length in bytes consumed by the string, including the
+ null termination if applied
+********************************************************************/
+
+size_t dos_PutUniCode(char *dst,const char *src, ssize_t len, BOOL null_terminate)
+{
+       return push_ucs2(NULL, dst, src, len, 
+                        STR_UNICODE|STR_NOALIGN | (null_terminate?STR_TERMINATE:0));
 }
 
 
 /*******************************************************************
- Pull an ASCII string out of a UNICODE buffer (little endian).
- ********************************************************************/
+ Skip past a unicode string, but not more than len. Always move
+ past a terminating zero if found.
+********************************************************************/
 
-void unibuf_to_ascii(char *dest, const char *src, int maxlen)
+char *skip_unibuf(char *src, size_t len)
 {
-       char *destend = dest + maxlen;
-       register char c;
+    char *srcend = src + len;
 
-       while (dest < destend)
-       {
-               c = *(src++);
-               if ((c == 0) && (*src == 0))
-               {
-                       break;
-               }
+    while (src < srcend && SVAL(src,0))
+        src += 2;
 
-               *dest++ = c;
-               src++;
-       }
+    if(!SVAL(src,0))
+        src += 2;
 
-       *dest = 0;
+    return src;
 }
 
+/* Copy a string from little-endian or big-endian unicode source (depending
+ * on flags) to internal samba format destination
+ */ 
+int rpcstr_pull(char* dest, void *src, int dest_len, int src_len, int flags)
+{
+       if(dest_len==-1) dest_len=MAXUNI-3;
+       return pull_ucs2(NULL, dest, src, dest_len, src_len, flags|STR_UNICODE|STR_NOALIGN);
+}
 
-/*******************************************************************
- Put an ASCII string into a UNICODE array (uint16's).
********************************************************************/
+/* Copy a string from a unistr2 source to internal samba format
+   destination.  Use this instead of direct calls to rpcstr_pull() to avoid
  having to determine whether the source string is null terminated. */
 
-void ascii_to_unistr(uint16 *dest, const char *src, int maxlen)
+int rpcstr_pull_unistr2_fstring(char *dest, UNISTR2 *src)
 {
-       uint16 *destend = dest + maxlen;
-       register char c;
+        return pull_ucs2(NULL, dest, src->buffer, sizeof(fstring),
+                         src->uni_str_len * 2, 0);
+}
 
-       while (dest < destend)
-       {
-               c = *(src++);
-               if (c == 0)
-               {
-                       break;
-               }
+/* Converts a string from internal samba format to unicode
+ */ 
+int rpcstr_push(void* dest, const char *src, int dest_len, int flags)
+{
+       return push_ucs2(NULL, dest, src, dest_len, flags|STR_UNICODE|STR_NOALIGN);
+}
 
-               *(dest++) = (uint16)c;
-       }
+/*******************************************************************
+ Return a DOS codepage version of a little-endian unicode string.
+ len is the filename length (ignoring any terminating zero) in uin16
+ units. Always null terminates.
+ Hack alert: uses fixed buffer(s).
+********************************************************************/
+char *dos_unistrn2(const uint16 *src, int len)
+{
+       static char lbufs[8][MAXUNI];
+       static int nexti;
+       char *lbuf = lbufs[nexti];
+       nexti = (nexti+1)%8;
+       pull_ucs2(NULL, lbuf, src, MAXUNI-3, len*2, STR_NOALIGN);
+       return lbuf;
+}
 
-       *dest = 0;
+/*******************************************************************
+ Convert a (little-endian) UNISTR2 structure to an ASCII string
+********************************************************************/
+void unistr2_to_ascii(char *dest, const UNISTR2 *str, size_t maxlen)
+{
+       if (str == NULL) {
+               *dest='\0';
+               return;
+       }
+       pull_ucs2(NULL, dest, str->buffer, maxlen, str->uni_str_len*2, STR_NOALIGN);
 }
 
 
 /*******************************************************************
- Pull an ASCII string out of a UNICODE array (uint16's).
- ********************************************************************/
+Return a number stored in a buffer
+********************************************************************/
 
-void unistr_to_ascii(char *dest, const uint16 *src, int len)
+uint32 buffer2_to_uint32(BUFFER2 *str)
 {
-       char *destend = dest + len;
-       register uint16 c;
+       if (str->buf_len == 4)
+               return IVAL(str->buffer, 0);
+       else
+               return 0;
+}
 
-       while (dest < destend)
-       {
-               c = *(src++);
-               if (c == 0)
-               {
-                       break;
-               }
+/*******************************************************************
+ Convert a wchar to upper case.
+********************************************************************/
 
-               *(dest++) = (char)c;
-       }
+smb_ucs2_t toupper_w(smb_ucs2_t val)
+{
+       return upcase_table[SVAL(&val,0)];
+}
 
-       *dest = 0;
+/*******************************************************************
+ Convert a wchar to lower case.
+********************************************************************/
+
+smb_ucs2_t tolower_w( smb_ucs2_t val )
+{
+       return lowcase_table[SVAL(&val,0)];
 }
 
+/*******************************************************************
+determine if a character is lowercase
+********************************************************************/
+BOOL islower_w(smb_ucs2_t c)
+{
+       return upcase_table[SVAL(&c,0)] != c;
+}
 
 /*******************************************************************
- Convert a UNISTR2 structure to an ASCII string
- ********************************************************************/
+determine if a character is uppercase
+********************************************************************/
+BOOL isupper_w(smb_ucs2_t c)
+{
+       return lowcase_table[SVAL(&c,0)] != c;
+}
+
 
-void unistr2_to_ascii(char *dest, const UNISTR2 *str, int maxlen)
+/*******************************************************************
+determine if a character is valid in a 8.3 name
+********************************************************************/
+BOOL isvalid83_w(smb_ucs2_t c)
 {
-       char *destend;
-       const uint16 *src;
-       int len;
-       register uint16 c;
+       return valid_table[SVAL(&c,0)] != 0;
+}
 
-       src = str->buffer;
-       len = MIN(str->uni_str_len, maxlen);
-       destend = dest + len;
+/*******************************************************************
+ Count the number of characters in a smb_ucs2_t string.
+********************************************************************/
+size_t strlen_w(const smb_ucs2_t *src)
+{
+       size_t len;
 
-       while (dest < destend)
-       {
-               c = *(src++);
-               if (c == 0)
-               {
-                       break;
-               }
+       for(len = 0; *src++; len++) ;
 
-               *(dest++) = (char)c;
-       }
+       return len;
+}
 
-       *dest = 0;
+/*******************************************************************
+wide strchr()
+********************************************************************/
+smb_ucs2_t *strchr_w(const smb_ucs2_t *s, smb_ucs2_t c)
+{
+       while (*s != 0) {
+               if (c == *s) return (smb_ucs2_t *)s;
+               s++;
+       }
+       return NULL;
 }
 
 
 /*******************************************************************
Skip a UNICODE string in a little endian buffer.
- ********************************************************************/
-
-char *skip_unibuf(char *srcbuf, int len)
Convert a string to lower case.
+ return True if any char is converted
+********************************************************************/
+BOOL strlower_w(smb_ucs2_t *s)
 {
-       uint16 *src = (uint16 *)srcbuf;
-       uint16 *srcend = src + len/2;
+       BOOL ret = False;
+       while (*s) {
+               smb_ucs2_t v = tolower_w(*s);
+               if (v != *s) {
+                       *s = v;
+                       ret = True;
+               }
+               s++;
+       }
+       return ret;
+}
 
-       while ((src < srcend) && (*(src++) != 0))
-       {
+/*******************************************************************
+ Convert a string to upper case.
+ return True if any char is converted
+********************************************************************/
+BOOL strupper_w(smb_ucs2_t *s)
+{
+       BOOL ret = False;
+       while (*s) {
+               smb_ucs2_t v = toupper_w(*s);
+               if (v != *s) {
+                       *s = v;
+                       ret = True;
+               }
+               s++;
        }
+       return ret;
+}
 
-       return (char *)src;
+/*******************************************************************
+case insensitive string comparison
+********************************************************************/
+int strcasecmp_w(const smb_ucs2_t *a, const smb_ucs2_t *b)
+{
+       while (*b && toupper_w(*a) == toupper_w(*b)) { a++; b++; }
+       return (tolower_w(*a) - tolower_w(*b));
 }
 
 
 /*******************************************************************
- UNICODE strcpy between buffers.
- ********************************************************************/
+duplicate string
+********************************************************************/
+smb_ucs2_t *strdup_w(const smb_ucs2_t *src)
+{
+       smb_ucs2_t *dest;
+       uint32 len;
+       
+       len = strlen_w(src) + 1;
+       dest = (smb_ucs2_t *)malloc(len*sizeof(smb_ucs2_t));
+       if (!dest) {
+               DEBUG(0,("strdup_w: out of memory!\n"));
+               return NULL;
+       }
+
+       memcpy(dest, src, len*sizeof(smb_ucs2_t));
+       
+       return dest;
+}
 
-char *uni_strncpy(char *destbuf, const char *srcbuf, int len)
+/*******************************************************************
+copy a string with max len
+********************************************************************/
+
+smb_ucs2_t *strncpy_w(smb_ucs2_t *dest, const smb_ucs2_t *src, const size_t max)
 {
-       const uint16 *src = (const uint16 *)srcbuf;
-       uint16 *dest = (uint16 *)destbuf;
-       uint16 *destend = dest + len/2;
-       register uint16 c;
+       size_t len;
+       
+       if (!dest || !src) return NULL;
+       
+       for (len = 0; (src[len] != 0) && (len < max); len++)
+               dest[len] = src[len];
+       while (len < max)
+               dest[len++] = 0;
+       
+       return dest;
+}
 
-       while (dest < destend)
-       {
-               c = *(src++);
-               if (c == 0)
-               {
-                       break;
-               }
 
-               *(dest++) = c;
+/*******************************************************************
+append a string of len bytes and add a terminator
+********************************************************************/
+
+smb_ucs2_t *strncat_w(smb_ucs2_t *dest, const smb_ucs2_t *src, const size_t max)
+{      
+       size_t start;
+       size_t len;     
+       
+       if (!dest || !src) return NULL;
+       
+       start = strlen_w(dest);
+       len = strlen_w(src);
+       if (len > max) len = max;
+
+       memcpy(&dest[start], src, len*sizeof(smb_ucs2_t));                      
+       dest[start+len] = 0;
+       
+       return dest;
+}
+
+
+/*
+  The *_wa() functions take a combination of 7 bit ascii
+  and wide characters They are used so that you can use string
+  functions combining C string constants with ucs2 strings
+
+  The char* arguments must NOT be multibyte - to be completely sure
+  of this only pass string constants */
+
+
+void pstrcpy_wa(smb_ucs2_t *dest, const char *src)
+{
+       int i;
+       for (i=0;i<PSTRING_LEN;i++) {
+               dest[i] = UCS2_CHAR(src[i]);
+               if (src[i] == 0) return;
        }
+}
 
-       *dest++ = 0;
-       return (char *)dest;
+int strcmp_wa(const smb_ucs2_t *a, const char *b)
+{
+       while (*b && *a == UCS2_CHAR(*b)) { a++; b++; }
+       return (*a - UCS2_CHAR(*b));
 }
 
 
-/*******************************************************************
- Return a number stored in a buffer
- ********************************************************************/
 
-uint32 buffer2_to_uint32(const BUFFER2 *str)
+smb_ucs2_t *strchr_wa(const smb_ucs2_t *s, char c)
 {
-       if (str->buf_len == 4)
-       {
-               const char *src = (const char*)str->buffer;
-               return IVAL(src, 0);
+       while (*s != 0) {
+               if (UCS2_CHAR(c) == *s) return (smb_ucs2_t *)s;
+               s++;
        }
-       else
-       {
-               return 0;
+       return NULL;
+}
+
+smb_ucs2_t *strrchr_wa(const smb_ucs2_t *s, char c)
+{
+       const smb_ucs2_t *p = s;
+       int len = strlen_w(s);
+       if (len == 0) return NULL;
+       p += (len-1);
+       do {
+               if (UCS2_CHAR(c) == *p) return (smb_ucs2_t *)p;
+       } while (p-- != s);
+       return NULL;
+}
+
+smb_ucs2_t *strpbrk_wa(const smb_ucs2_t *s, const char *p)
+{
+       while (*s != 0) {
+               int i;
+               for (i=0; p[i] && *s != UCS2_CHAR(p[i]); i++) 
+                       ;
+               if (p[i]) return (smb_ucs2_t *)s;
+               s++;
        }
+       return NULL;
 }
 
 
 /*******************************************************************
-  Convert a 'multi-string' buffer to space-separated ASCII.
- ********************************************************************/
+copy a string with max len
+********************************************************************/
 
-void buffer2_to_multistr(char *dest, const BUFFER2 *str, int maxlen)
+smb_ucs2_t *strncpy_wa(smb_ucs2_t *dest, const char *src, const size_t max)
 {
-       char *destend;
-       const uint16 *src;
-       int len;
-       register uint16 c;
-
-       src = str->buffer;
-       len = MIN(str->buf_len/2, maxlen);
-       destend = dest + len;
+       smb_ucs2_t *ucs2_src;
 
-       while (dest < destend)
-       {
-               c = *(src++);
-               *(dest++) = (c == 0) ? ' ' : (char)c;
+       if (!dest || !src) return NULL;
+       ucs2_src = (smb_ucs2_t *)malloc((strlen(src)+1)*sizeof(smb_ucs2_t));
+       if (!ucs2_src) {
+               DEBUG(0,("strncpy_wa: out of memory!\n"));
+               return NULL;
        }
+       push_ucs2(NULL, ucs2_src, src, -1, STR_TERMINATE|STR_NOALIGN);
+       
+       strncpy_w(dest, ucs2_src, max);
+       SAFE_FREE(ucs2_src);
+       return dest;
+}
+
 
-       *dest = 0;
+/*******************************************************************
+append a string of len bytes and add a terminator
+********************************************************************/
+
+smb_ucs2_t *strncat_wa(smb_ucs2_t *dest, const char *src, const size_t max)
+{
+       smb_ucs2_t *ucs2_src;
+
+       if (!dest || !src) return NULL;
+       ucs2_src = (smb_ucs2_t *)malloc((strlen(src)+1)*sizeof(smb_ucs2_t));
+       if (!ucs2_src) {
+               DEBUG(0,("strncat_wa: out of memory!\n"));
+               return NULL;
+       }
+       push_ucs2(NULL, ucs2_src, src, -1, STR_TERMINATE|STR_NOALIGN);
+       
+       strncat_w(dest, ucs2_src, max);
+       SAFE_FREE(ucs2_src);
+       return dest;
 }