radiotap: Updates to the radiotap dissector to avoid confusion.
[metze/wireshark/wip.git] / epan / dvb_chartbl.c
1 /* dvb_chartbl.c
2  * Routines for handling DVB-SI character tables (as defined in EN 300 468)
3  *
4  * Wireshark - Network traffic analyzer
5  * By Gerald Combs <gerald@wireshark.org>
6  * Copyright 1998 Gerald Combs
7  *
8  * This program is free software; you can redistribute it and/or
9  * modify it under the terms of the GNU General Public License
10  * as published by the Free Software Foundation; either version 2
11  * of the License, or (at your option) any later version.
12  *
13  * This program is distributed in the hope that it will be useful,
14  * but WITHOUT ANY WARRANTY; without even the implied warranty of
15  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
16  * GNU General Public License for more details.
17  *
18  * You should have received a copy of the GNU General Public License
19  * along with this program; if not, write to the Free Software
20  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA.
21  */
22
23 #include "config.h"
24
25 #include <glib.h>
26
27 #include <epan/proto.h>
28 #include <epan/tvbuff.h>
29 #include <epan/value_string.h>
30
31 #include "dvb_chartbl.h"
32
33
34 static const value_string dvb_string_encoding_vals[] = {
35    { DVB_ENCODING_INVALID,  "Incorrect length for encoding" },
36    { DVB_ENCODING_RESERVED, "Reserved for future use" },
37    { DVB_ENCODING_UNKNOWN,  "Unknown/undefined encoding" },
38
39    { DVB_ENCODING_LATIN,    "Latin (default table)" },
40
41    { DVB_ENCODING_ISO_8859_1,         "ISO/IEC 8859-1 (West European)" },
42    { DVB_ENCODING_ISO_8859_2,         "ISO/IEC 8859-2 (East European)" },
43    { DVB_ENCODING_ISO_8859_3,         "ISO/IEC 8859-3 (South European)" },
44    { DVB_ENCODING_ISO_8859_4,         "ISO/IEC 8859-4 (North and North-East European)" },
45    { DVB_ENCODING_ISO_8859_5,         "ISO/IEC 8859-5 (Latin/Cyrillic)" },
46    { DVB_ENCODING_ISO_8859_6,         "ISO/IEC 8859-6 (Latin/Arabic)" },
47    { DVB_ENCODING_ISO_8859_7,         "ISO/IEC 8859-7 (Latin/Greek)" },
48    { DVB_ENCODING_ISO_8859_8,         "ISO/IEC 8859-8 (Latin/Hebrew)" },
49    { DVB_ENCODING_ISO_8859_9,         "ISO/IEC 8859-9 (West European & Turkish)" },
50    { DVB_ENCODING_ISO_8859_10,        "ISO/IEC 8859-10 (North European)" },
51    { DVB_ENCODING_ISO_8859_11,        "ISO/IEC 8859-11 (Thai)" },
52    { DVB_ENCODING_ISO_8859_13,        "ISO/IEC 8859-13 (Baltic)" },
53    { DVB_ENCODING_ISO_8859_14,        "ISO/IEC 8859-14 (Celtic)" },
54    { DVB_ENCODING_ISO_8859_15,        "ISO/IEC 8859-15 (West European)" },
55    { DVB_ENCODING_ISO_10646_BMP,      "ISO/IEC 10646 Basic Multilingual Plane" },
56    { DVB_ENCODING_KSX_1001,           "KSX 1001-2004 (Korean character set)" },
57    { DVB_ENCODING_GB_2312,            "GB-2312-1980 (Simplified Chinese)" },
58    { DVB_ENCODING_ISO_10646_BIG5,     "ISO/IEC 10646 BIG5 subset" },
59    { DVB_ENCODING_ISO_10646_UTF8_BMP,
60        "ISO/IEC 10646 Basic Multilingual Plane, UTF-8 encoded" },
61
62    { 0, NULL }
63 };
64
65
66 static dvb_encoding_e
67 dvb_analyze_string_charset0(guint8 byte0)
68 {
69     switch (byte0) {
70         case 0x01:
71             return DVB_ENCODING_ISO_8859_5;
72         case 0x02:
73             return DVB_ENCODING_ISO_8859_6;
74         case 0x03:
75             return DVB_ENCODING_ISO_8859_7;
76         case 0x04:
77             return DVB_ENCODING_ISO_8859_8;
78         case 0x05:
79             return DVB_ENCODING_ISO_8859_9;
80         case 0x06:
81             return DVB_ENCODING_ISO_8859_10;
82         case 0x07:
83             return DVB_ENCODING_ISO_8859_11;
84         case 0x08:
85             return DVB_ENCODING_RESERVED; /* was reserved for ISO-8859-12 */
86         case 0x09:
87             return DVB_ENCODING_ISO_8859_13;
88         case 0x0A:
89             return DVB_ENCODING_ISO_8859_14;
90         case 0x0B:
91             return DVB_ENCODING_ISO_8859_15;
92         case 0x11:
93             return DVB_ENCODING_ISO_10646_BMP;
94         case 0x12:
95             return DVB_ENCODING_KSX_1001;
96         case 0x13:
97             return DVB_ENCODING_GB_2312;
98         case 0x14:
99             return DVB_ENCODING_ISO_10646_BIG5;
100         case 0x15:
101             return DVB_ENCODING_ISO_10646_UTF8_BMP;
102
103         default:
104             return DVB_ENCODING_UNKNOWN;
105     }
106 }
107
108
109 static dvb_encoding_e
110 dvb_analyze_string_charset0_10(guint16 byte12)
111 {
112     switch (byte12) {
113         case 0x0000:
114              return DVB_ENCODING_RESERVED;
115         case 0x0001:
116          return DVB_ENCODING_ISO_8859_1;
117         case 0x0002:
118          return DVB_ENCODING_ISO_8859_2;
119         case 0x0003:
120          return DVB_ENCODING_ISO_8859_3;
121         case 0x0004:
122          return DVB_ENCODING_ISO_8859_4;
123         case 0x0005:
124          return DVB_ENCODING_ISO_8859_5;
125         case 0x0006:
126          return DVB_ENCODING_ISO_8859_6;
127         case 0x0007:
128          return DVB_ENCODING_ISO_8859_7;
129         case 0x0008:
130          return DVB_ENCODING_ISO_8859_8;
131         case 0x0009:
132          return DVB_ENCODING_ISO_8859_9;
133         case 0x000A:
134          return DVB_ENCODING_ISO_8859_10;
135         case 0x000B:
136          return DVB_ENCODING_ISO_8859_11;
137         case 0x000C:
138          return DVB_ENCODING_RESERVED;
139         case 0x000D:
140          return DVB_ENCODING_ISO_8859_13;
141         case 0x000E:
142          return DVB_ENCODING_ISO_8859_14;
143         case 0x000F:
144          return DVB_ENCODING_ISO_8859_15;
145
146         default: /* 0x10 XX XX */
147             return DVB_ENCODING_UNKNOWN;
148     }
149 }
150
151
152 static dvb_encoding_e
153 dvb_analyze_string_charset0_1F(guint8 byte1)
154 {
155    /* http://www.dvbservices.com/identifiers/encoding_type_id */
156
157     switch (byte1) {
158        case 0x00: /* 0x1F 0x00 */
159           return DVB_ENCODING_RESERVED;
160        case 0x01:
161        case 0x02:
162        case 0x03:
163        case 0x04:
164           /* XXX: BBC */
165           return DVB_ENCODING_RESERVED;
166        case 0x05:
167        case 0x06:
168           /* XXX: Malaysian Technical Standards Forum Bhd */
169           return DVB_ENCODING_RESERVED;
170
171        default: /* 0x1F XX */
172           return DVB_ENCODING_RESERVED;
173     }
174 }
175
176
177 guint
178 dvb_analyze_string_charset(tvbuff_t *tvb, int offset, int length, dvb_encoding_e *encoding)
179 {
180    if (length >= 1) {
181       guint8 byte0 = tvb_get_guint8(tvb, offset + 0);
182
183       if (byte0 >= 0x20) {
184          /* the first byte is a normal character, not the number of a character table */
185          *encoding = DVB_ENCODING_LATIN;
186          return 0;
187
188       } else if (byte0 == 0x1F) {
189          if (length >= 2) {
190             *encoding = dvb_analyze_string_charset0_1F(tvb_get_guint8(tvb, offset + 1));
191             return 2;
192          }
193          *encoding = DVB_ENCODING_INVALID;
194          return 1;
195
196       } else if (byte0 >= 0x16) { /* 16 ... 1E */
197          *encoding = DVB_ENCODING_RESERVED;
198          return 1;
199
200       } else if (byte0 == 0x10) {
201          if (length >= 3) {
202             *encoding = dvb_analyze_string_charset0_10(tvb_get_ntohs(tvb, offset + 1));
203             return 3;
204          }
205          *encoding = DVB_ENCODING_INVALID;
206          return 1;
207
208       } else if ((byte0 >= 0x0C && byte0 <= 0x0F)) {
209          *encoding = DVB_ENCODING_RESERVED;
210          return 1;
211       } else {
212          *encoding = dvb_analyze_string_charset0(byte0);
213          return 1;
214       }
215    } else
216       *encoding = DVB_ENCODING_LATIN;
217
218    return 0;
219 }
220
221
222 guint
223 dvb_enc_to_item_enc(dvb_encoding_e encoding)
224 {
225    /* XXX: take ISO control codes into account,
226       e.g. 0x86 - turn emphasis on ; 0x87 - turn emphasis off */
227
228    switch (encoding) {
229       case DVB_ENCODING_ISO_8859_1:
230          return ENC_ISO_8859_1 | ENC_NA;
231
232       case DVB_ENCODING_ISO_8859_2:
233          return ENC_ISO_8859_2 | ENC_NA;
234
235       case DVB_ENCODING_ISO_8859_3:
236          return ENC_ISO_8859_3 | ENC_NA;
237
238       case DVB_ENCODING_ISO_8859_4:
239          return ENC_ISO_8859_4 | ENC_NA;
240
241       case DVB_ENCODING_ISO_8859_5:
242          return ENC_ISO_8859_5 | ENC_NA;
243
244       case DVB_ENCODING_ISO_8859_6:
245          return ENC_ISO_8859_6 | ENC_NA;
246
247       case DVB_ENCODING_ISO_8859_7:
248          return ENC_ISO_8859_7 | ENC_NA;
249
250       case DVB_ENCODING_ISO_8859_8:
251          return ENC_ISO_8859_8 | ENC_NA;
252
253       case DVB_ENCODING_ISO_8859_9:
254          return ENC_ISO_8859_9 | ENC_NA;
255
256       case DVB_ENCODING_ISO_8859_10:
257          return ENC_ISO_8859_10 | ENC_NA;
258
259       case DVB_ENCODING_ISO_8859_11:
260          return ENC_ISO_8859_11 | ENC_NA;
261
262       case DVB_ENCODING_ISO_8859_13:
263          return ENC_ISO_8859_13 | ENC_NA;
264
265       case DVB_ENCODING_ISO_8859_14:
266          return ENC_ISO_8859_14 | ENC_NA;
267
268       case DVB_ENCODING_ISO_8859_15:
269          return ENC_ISO_8859_15 | ENC_NA;
270
271       case DVB_ENCODING_ISO_10646_UTF8_BMP:
272          return ENC_UTF_8 | ENC_NA;
273
274       default: /* not supported */
275          return ENC_ASCII | ENC_NA;
276    }
277 }
278
279
280 void
281 dvb_add_chartbl(proto_tree *tree, int hf,
282         tvbuff_t *tvb, gint offset, gint length, dvb_encoding_e encoding)
283 {
284     if (length==0) {
285         proto_item *pi;
286
287         pi = proto_tree_add_bytes_format(tree, hf, tvb, 0, 0, NULL,
288                 "Default character table (Latin)");
289         PROTO_ITEM_SET_GENERATED(pi);
290     }
291     else {
292         proto_tree_add_bytes_format_value(tree, hf,
293             tvb, offset, length, NULL, "%s (%s)",
294             val_to_str_const(encoding, dvb_string_encoding_vals, "Unknown"),
295             tvb_bytes_to_str_punct(wmem_packet_scope(), tvb, offset, length, ' '));
296     }
297 }
298
299 /*
300  * Editor modelines  -  http://www.wireshark.org/tools/modelines.html
301  *
302  * Local variables:
303  * c-basic-offset: 4
304  * tab-width: 8
305  * indent-tabs-mode: nil
306  * End:
307  *
308  * vi: set shiftwidth=4 tabstop=8 expandtab:
309  * :indentSize=4:tabSize=8:noTabs=true:
310  */