From Joerg Mayer:
[obnox/wireshark/wip.git] / text2pcap.c
1 /**-*-C-*-**********************************************************************
2  *
3  * text2pcap.c
4  *
5  * Utility to convert an ASCII hexdump into a libpcap-format capture file
6  *
7  * (c) Copyright 2001 Ashok Narayanan <ashokn@cisco.com>
8  *
9  * $Id: text2pcap.c,v 1.19 2002/07/15 20:57:13 guy Exp $
10  * 
11  * Ethereal - Network traffic analyzer
12  * By Gerald Combs <gerald@ethereal.com>
13  * Copyright 1998 Gerald Combs
14  * 
15  * This program is free software; you can redistribute it and/or
16  * modify it under the terms of the GNU General Public License
17  * as published by the Free Software Foundation; either version 2
18  * of the License, or (at your option) any later version.
19  * 
20  * This program is distributed in the hope that it will be useful,
21  * but WITHOUT ANY WARRANTY; without even the implied warranty of
22  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
23  * GNU General Public License for more details.
24  * 
25  * You should have received a copy of the GNU General Public License
26  * along with this program; if not, write to the Free Software
27  * Foundation, Inc., 59 Temple Place - Suite 330, Boston, MA  02111-1307, USA.
28  *
29  *******************************************************************************/
30
31 /*******************************************************************************
32  *
33  * This utility reads in an ASCII hexdump of this common format:
34  *
35  * 00000000  00 E0 1E A7 05 6F 00 10 5A A0 B9 12 08 00 46 00 .....o..Z.....F.
36  * 00000010  03 68 00 00 00 00 0A 2E EE 33 0F 19 08 7F 0F 19 .h.......3...\7f..
37  * 00000020  03 80 94 04 00 00 10 01 16 A2 0A 00 03 50 00 0C .............P..
38  * 00000030  01 01 0F 19 03 80 11 01 1E 61 00 0C 03 01 0F 19 .........a......
39  *
40  * Each bytestring line consists of an offset, one or more bytes, and
41  * text at the end. An offset is defined as a hex string of more than
42  * two characters. A byte is defined as a hex string of exactly two
43  * characters. The text at the end is ignored, as is any text before
44  * the offset. Bytes read from a bytestring line are added to the
45  * current packet only if all the following conditions are satisfied:
46  *
47  * - No text appears between the offset and the bytes (any bytes appearing after
48  *   such text would be ignored)
49  *
50  * - The offset must be arithmetically correct, i.e. if the offset is 00000020, then
51  *   exactly 32 bytes must have been read into this packet before this. If the offset
52  *   is wrong, the packet is immediately terminated
53  *
54  * A packet start is signalled by a zero offset.
55  *
56  * Lines starting with #TEXT2PCAP are directives. These allow the user
57  * to embed instructions into the capture file which allows text2pcap
58  * to take some actions (e.g. specifying the encapsulation
59  * etc.). Currently no directives are implemented.
60  *
61  * Lines beginning with # which are not directives are ignored as
62  * comments. Currently all non-hexdump text is ignored by text2pcap;
63  * in the future, text processing may be added, but lines prefixed
64  * with '#' will still be ignored.
65  *
66  * The output is a libpcap packet containing Ethernet frames by
67  * default. This program takes options which allow the user to add
68  * dummy Ethernet, IP and UDP headers to the packets in order to allow
69  * dumps of L3 or higher protocols to be decoded.
70  *
71  * Considerable flexibility is built into this code to read hexdumps
72  * of slightly different formats. For example, any text prefixing the
73  * hexdump line is dropped (including mail forwarding '>'). The offset
74  * can be any hex number of four digits or greater.
75  *
76  * This converter cannot read a single packet greater than 64K. Packet
77  * snaplength is automatically set to 64K.
78  */
79
80 #ifdef HAVE_CONFIG_H
81 # include "config.h"
82 #endif
83
84 #include <ctype.h>
85 #include <stdio.h>
86 #include <stdlib.h>
87 #include <string.h>
88
89 /*
90  * Just make sure we include the prototype for strptime as well
91  * (needed for glibc 2.2)
92  */
93 #define __USE_XOPEN
94
95 #include <time.h>
96 #include <glib.h>
97
98 #ifdef HAVE_SYS_TYPES_H
99 # include <sys/types.h>
100 #endif
101
102 #ifdef HAVE_UNISTD_H
103 # include <unistd.h>
104 #endif
105
106 #ifdef HAVE_NETINET_IN_H
107 # include <netinet/in.h>
108 #endif
109
110 #ifdef HAVE_WINSOCK2_H
111 # include <winsock2.h>
112 #endif
113
114 #include <errno.h>
115 #include <assert.h>
116
117 #ifdef NEED_GETOPT_H
118 # include "getopt.h"
119 #endif
120
121 #ifdef NEED_STRPTIME_H
122 # include "strptime.h"
123 #endif
124
125 #include "text2pcap.h"
126
127 /*--- Options --------------------------------------------------------------------*/
128
129 /* Debug level */
130 static int debug = 0; 
131 /* Be quiet */
132 static int quiet = FALSE;
133
134 /* Dummy Ethernet header */
135 static int hdr_ethernet = FALSE;
136 static unsigned long hdr_ethernet_proto = 0;
137
138 /* Dummy IP header */
139 static int hdr_ip = FALSE;
140 static unsigned long hdr_ip_proto = 0;
141
142 /* Dummy UDP header */
143 static int hdr_udp = FALSE;
144 static unsigned long hdr_udp_dest = 0;
145 static unsigned long hdr_udp_src = 0;
146
147 /* Dummy SCTP header */
148 static int hdr_sctp = FALSE;
149 static unsigned long hdr_sctp_src  = 0;
150 static unsigned long hdr_sctp_dest = 0;
151 static unsigned long hdr_sctp_tag  = 0;
152
153 /* Dummy DATA chunk header */
154 static int hdr_data_chunk = FALSE;
155 static unsigned char  hdr_data_chunk_type = 0;
156 static unsigned char  hdr_data_chunk_bits = 3;
157 static unsigned long  hdr_data_chunk_tsn  = 0;
158 static unsigned short hdr_data_chunk_sid  = 0;
159 static unsigned short hdr_data_chunk_ssn  = 0;
160 static unsigned long  hdr_data_chunk_ppid = 0;
161
162
163 /*--- Local date -----------------------------------------------------------------*/
164
165 /* This is where we store the packet currently being built */
166 #define MAX_PACKET 64000
167 static unsigned char packet_buf[MAX_PACKET];
168 static unsigned long curr_offset = 0;
169
170 /* This buffer contains strings present before the packet offset 0 */
171 #define PACKET_PREAMBLE_MAX_LEN 2048
172 static unsigned char packet_preamble[PACKET_PREAMBLE_MAX_LEN+1];
173 static int packet_preamble_len = 0;
174
175 /* Number of packets read and written */
176 static unsigned long num_packets_read = 0;
177 static unsigned long num_packets_written = 0;
178
179 /* Time code of packet, derived from packet_preamble */
180 static unsigned long ts_sec  = 0;
181 static unsigned long ts_usec = 0;
182 static char *ts_fmt = NULL;
183
184 /* Input file */
185 static char *input_filename;
186 static FILE *input_file = NULL;
187 /* Output file */
188 static char *output_filename;
189 static FILE *output_file = NULL;
190
191 /* Offset base to parse */
192 static unsigned long offset_base = 16;
193
194 static FILE *yyin;
195
196 /* ----- State machine -----------------------------------------------------------*/
197
198 /* Current state of parser */
199 typedef enum {
200     INIT,             /* Waiting for start of new packet */
201     START_OF_LINE,    /* Starting from beginning of line */
202     READ_OFFSET,      /* Just read the offset */
203     READ_BYTE,        /* Just read a byte */
204     READ_TEXT,        /* Just read text - ignore until EOL */
205 } parser_state_t;
206 static parser_state_t state = INIT;
207
208 static const char *state_str[] = {"Init", 
209                            "Start-of-line", 
210                            "Offset",
211                            "Byte",
212                            "Text"
213 };
214
215 static const char *token_str[] = {"",
216                            "Byte", 
217                            "Offset",
218                            "Directive",
219                            "Text",
220                            "End-of-line"
221 };
222
223 /* ----- Skeleton Packet Headers --------------------------------------------------*/
224
225 typedef struct {
226     unsigned char   src_addr[6];
227     unsigned char   dest_addr[6];
228     unsigned short l3pid;
229 } hdr_ethernet_t;
230
231 static hdr_ethernet_t HDR_ETHERNET = {
232     {0x01, 0x01, 0x01, 0x01, 0x01, 0x01}, 
233     {0x02, 0x02, 0x02, 0x02, 0x02, 0x02},
234     0};
235
236 typedef struct {
237     unsigned char   ver_hdrlen;
238     unsigned char   dscp;
239     unsigned short packet_length;
240     unsigned short identification;
241     unsigned char   flags;
242     unsigned char   fragment;
243     unsigned char   ttl;
244     unsigned char   protocol;
245     unsigned short hdr_checksum;
246     unsigned long src_addr;
247     unsigned long dest_addr;
248 } hdr_ip_t;
249
250 static hdr_ip_t HDR_IP = {0x45, 0, 0, 0x3412, 0, 0, 0xff, 0, 0, 0x01010101, 0x02020202};
251
252 typedef struct {
253     unsigned short source_port;
254     unsigned short dest_port;
255     unsigned short length;
256     unsigned short checksum;
257 } hdr_udp_t;
258
259 static hdr_udp_t HDR_UDP = {0, 0, 0, 0};
260
261 typedef struct {
262     unsigned short src_port;
263     unsigned short dest_port;
264     unsigned long  tag;
265     unsigned long  checksum;
266 } hdr_sctp_t;
267
268 static hdr_sctp_t HDR_SCTP = {0, 0, 0, 0};
269
270 typedef struct {
271     unsigned char  type;
272     unsigned char  bits;
273     unsigned short length;
274     unsigned long  tsn;
275     unsigned short sid;
276     unsigned short ssn;
277     unsigned long  ppid;
278 } hdr_data_chunk_t;
279
280 static hdr_data_chunk_t HDR_DATA_CHUNK = {0, 0, 0, 0, 0, 0, 0};
281
282 static char tempbuf[64];
283
284 /*----------------------------------------------------------------------
285  * Stuff for writing a PCap file
286  */
287 #define PCAP_MAGIC                      0xa1b2c3d4
288
289 /* "libpcap" file header (minus magic number). */
290 struct pcap_hdr {
291     unsigned long    magic;          /* magic */
292     unsigned short      version_major;  /* major version number */
293     unsigned short      version_minor;  /* minor version number */
294     unsigned long       thiszone;       /* GMT to local correction */
295     unsigned long       sigfigs;        /* accuracy of timestamps */
296     unsigned long       snaplen;        /* max length of captured packets, in octets */
297     unsigned long       network;        /* data link type */
298 };
299
300 /* "libpcap" record header. */
301 struct pcaprec_hdr {
302     unsigned long       ts_sec;         /* timestamp seconds */
303     unsigned long       ts_usec;        /* timestamp microseconds */
304     unsigned long       incl_len;       /* number of octets of packet saved in file */
305     unsigned long       orig_len;       /* actual length of packet */
306 };
307
308 /* Link-layer type; see net/bpf.h for details */
309 static unsigned long pcap_link_type = 1;   /* Default is DLT-EN10MB */
310
311 /*----------------------------------------------------------------------
312  * Parse a single hex number
313  * Will abort the program if it can't parse the number
314  * Pass in TRUE if this is an offset, FALSE if not
315  */
316 static unsigned long
317 parse_num (char *str, int offset)
318 {
319     unsigned long num;
320     char *c;
321
322     num = strtoul(str, &c, offset ? offset_base : 16);
323     if (c==str) {
324         fprintf(stderr, "FATAL ERROR: Bad hex number? [%s]\n", str);
325         exit(-1);
326     }
327     return num;
328 }
329
330 /*----------------------------------------------------------------------
331  * Write this byte into current packet
332  */
333 static void
334 write_byte (char *str)
335 {
336     unsigned long num;
337
338     num = parse_num(str, FALSE);
339     packet_buf[curr_offset] = num;
340     curr_offset ++;
341 }
342
343 /*----------------------------------------------------------------------
344  * Remove bytes from the current packet
345  */
346 static void
347 unwrite_bytes (unsigned long nbytes)
348 {
349     curr_offset -= nbytes;
350 }
351
352 /*----------------------------------------------------------------------
353  * Compute one's complement checksum (from RFC1071)
354  */
355 static unsigned short
356 in_checksum (void *buf, unsigned long count)
357 {
358     unsigned long sum = 0;
359     unsigned short *addr = buf;
360
361     while( count > 1 )  {
362         /*  This is the inner loop */
363         sum += ntohs(* (unsigned short *) addr++);
364         count -= 2;
365     }
366
367     /*  Add left-over byte, if any */
368     if( count > 0 ) 
369         sum += * (unsigned char *) addr;
370
371     /*  Fold 32-bit sum to 16 bits */
372     while (sum>>16)
373         sum = (sum & 0xffff) + (sum >> 16);
374
375     return htons(~sum);
376 }
377
378 /* The CRC32C code is taken from draft-ietf-tsvwg-sctpcsum-01.txt.
379  * That code is copyrighted by D. Otis and has been modified.
380  */
381   
382 #define CRC32C(c,d) (c=(c>>8)^crc_c[(c^(d))&0xFF]) 
383 static unsigned long crc_c[256] = 
384
385 0x00000000L, 0xF26B8303L, 0xE13B70F7L, 0x1350F3F4L,  
386 0xC79A971FL, 0x35F1141CL, 0x26A1E7E8L, 0xD4CA64EBL,  
387 0x8AD958CFL, 0x78B2DBCCL, 0x6BE22838L, 0x9989AB3BL,  
388 0x4D43CFD0L, 0xBF284CD3L, 0xAC78BF27L, 0x5E133C24L,  
389 0x105EC76FL, 0xE235446CL, 0xF165B798L, 0x030E349BL,  
390 0xD7C45070L, 0x25AFD373L, 0x36FF2087L, 0xC494A384L,  
391 0x9A879FA0L, 0x68EC1CA3L, 0x7BBCEF57L, 0x89D76C54L,  
392 0x5D1D08BFL, 0xAF768BBCL, 0xBC267848L, 0x4E4DFB4BL,  
393 0x20BD8EDEL, 0xD2D60DDDL, 0xC186FE29L, 0x33ED7D2AL,  
394 0xE72719C1L, 0x154C9AC2L, 0x061C6936L, 0xF477EA35L,  
395 0xAA64D611L, 0x580F5512L, 0x4B5FA6E6L, 0xB93425E5L,  
396 0x6DFE410EL, 0x9F95C20DL, 0x8CC531F9L, 0x7EAEB2FAL,  
397 0x30E349B1L, 0xC288CAB2L, 0xD1D83946L, 0x23B3BA45L,  
398 0xF779DEAEL, 0x05125DADL, 0x1642AE59L, 0xE4292D5AL,  
399 0xBA3A117EL, 0x4851927DL, 0x5B016189L, 0xA96AE28AL,  
400 0x7DA08661L, 0x8FCB0562L, 0x9C9BF696L, 0x6EF07595L,  
401 0x417B1DBCL, 0xB3109EBFL, 0xA0406D4BL, 0x522BEE48L,  
402 0x86E18AA3L, 0x748A09A0L, 0x67DAFA54L, 0x95B17957L,  
403 0xCBA24573L, 0x39C9C670L, 0x2A993584L, 0xD8F2B687L,  
404 0x0C38D26CL, 0xFE53516FL, 0xED03A29BL, 0x1F682198L,  
405 0x5125DAD3L, 0xA34E59D0L, 0xB01EAA24L, 0x42752927L,  
406 0x96BF4DCCL, 0x64D4CECFL, 0x77843D3BL, 0x85EFBE38L,  
407 0xDBFC821CL, 0x2997011FL, 0x3AC7F2EBL, 0xC8AC71E8L,  
408 0x1C661503L, 0xEE0D9600L, 0xFD5D65F4L, 0x0F36E6F7L,  
409 0x61C69362L, 0x93AD1061L, 0x80FDE395L, 0x72966096L,  
410 0xA65C047DL, 0x5437877EL, 0x4767748AL, 0xB50CF789L,  
411 0xEB1FCBADL, 0x197448AEL, 0x0A24BB5AL, 0xF84F3859L,  
412 0x2C855CB2L, 0xDEEEDFB1L, 0xCDBE2C45L, 0x3FD5AF46L,  
413 0x7198540DL, 0x83F3D70EL, 0x90A324FAL, 0x62C8A7F9L,  
414 0xB602C312L, 0x44694011L, 0x5739B3E5L, 0xA55230E6L,  
415 0xFB410CC2L, 0x092A8FC1L, 0x1A7A7C35L, 0xE811FF36L,  
416 0x3CDB9BDDL, 0xCEB018DEL, 0xDDE0EB2AL, 0x2F8B6829L,  
417 0x82F63B78L, 0x709DB87BL, 0x63CD4B8FL, 0x91A6C88CL,  
418 0x456CAC67L, 0xB7072F64L, 0xA457DC90L, 0x563C5F93L,  
419 0x082F63B7L, 0xFA44E0B4L, 0xE9141340L, 0x1B7F9043L,  
420 0xCFB5F4A8L, 0x3DDE77ABL, 0x2E8E845FL, 0xDCE5075CL,  
421 0x92A8FC17L, 0x60C37F14L, 0x73938CE0L, 0x81F80FE3L,  
422 0x55326B08L, 0xA759E80BL, 0xB4091BFFL, 0x466298FCL,  
423 0x1871A4D8L, 0xEA1A27DBL, 0xF94AD42FL, 0x0B21572CL,  
424 0xDFEB33C7L, 0x2D80B0C4L, 0x3ED04330L, 0xCCBBC033L,  
425 0xA24BB5A6L, 0x502036A5L, 0x4370C551L, 0xB11B4652L,  
426 0x65D122B9L, 0x97BAA1BAL, 0x84EA524EL, 0x7681D14DL,  
427 0x2892ED69L, 0xDAF96E6AL, 0xC9A99D9EL, 0x3BC21E9DL,  
428 0xEF087A76L, 0x1D63F975L, 0x0E330A81L, 0xFC588982L,  
429 0xB21572C9L, 0x407EF1CAL, 0x532E023EL, 0xA145813DL,  
430 0x758FE5D6L, 0x87E466D5L, 0x94B49521L, 0x66DF1622L,  
431 0x38CC2A06L, 0xCAA7A905L, 0xD9F75AF1L, 0x2B9CD9F2L,  
432 0xFF56BD19L, 0x0D3D3E1AL, 0x1E6DCDEEL, 0xEC064EEDL,  
433 0xC38D26C4L, 0x31E6A5C7L, 0x22B65633L, 0xD0DDD530L,  
434 0x0417B1DBL, 0xF67C32D8L, 0xE52CC12CL, 0x1747422FL,  
435 0x49547E0BL, 0xBB3FFD08L, 0xA86F0EFCL, 0x5A048DFFL,  
436 0x8ECEE914L, 0x7CA56A17L, 0x6FF599E3L, 0x9D9E1AE0L,  
437 0xD3D3E1ABL, 0x21B862A8L, 0x32E8915CL, 0xC083125FL,  
438 0x144976B4L, 0xE622F5B7L, 0xF5720643L, 0x07198540L,  
439 0x590AB964L, 0xAB613A67L, 0xB831C993L, 0x4A5A4A90L,  
440 0x9E902E7BL, 0x6CFBAD78L, 0x7FAB5E8CL, 0x8DC0DD8FL,  
441 0xE330A81AL, 0x115B2B19L, 0x020BD8EDL, 0xF0605BEEL,  
442 0x24AA3F05L, 0xD6C1BC06L, 0xC5914FF2L, 0x37FACCF1L,  
443 0x69E9F0D5L, 0x9B8273D6L, 0x88D28022L, 0x7AB90321L,  
444 0xAE7367CAL, 0x5C18E4C9L, 0x4F48173DL, 0xBD23943EL,  
445 0xF36E6F75L, 0x0105EC76L, 0x12551F82L, 0xE03E9C81L,  
446 0x34F4F86AL, 0xC69F7B69L, 0xD5CF889DL, 0x27A40B9EL,  
447 0x79B737BAL, 0x8BDCB4B9L, 0x988C474DL, 0x6AE7C44EL,  
448 0xBE2DA0A5L, 0x4C4623A6L, 0x5F16D052L, 0xAD7D5351L,  
449 }; 
450      
451 static unsigned long
452 crc32c(const unsigned char* buf, unsigned int len, unsigned long crc32_init)
453 {
454   unsigned int i; 
455   unsigned long crc32; 
456             
457   crc32 = crc32_init;
458   for (i = 0; i < len; i++)  
459     CRC32C(crc32, buf[i]); 
460
461   return ( crc32 );
462 }
463
464 static unsigned long
465 finalize_crc32c(unsigned long crc32)
466 {
467   unsigned long result;
468   unsigned char byte0,byte1,byte2,byte3;
469     
470   result = ~crc32;
471   byte0 = result & 0xff;
472   byte1 = (result>>8) & 0xff;
473   byte2 = (result>>16) & 0xff;
474   byte3 = (result>>24) & 0xff;
475   result = ((byte0 << 24) | (byte1 << 16) | (byte2 << 8) | byte3);
476   return ( result );
477 }
478
479 static unsigned long
480 number_of_padding_bytes (unsigned long length)
481 {
482   unsigned long remainder;
483
484   remainder = length % 4;
485
486   if (remainder == 0)
487     return 0;
488   else
489     return 4 - remainder;
490 }
491
492 /*----------------------------------------------------------------------
493  * Write current packet out 
494  */
495 static void
496 write_current_packet (void)
497 {
498     int length = 0;
499     int udp_length = 0;
500     int ip_length = 0;
501     int eth_trailer_length = 0;
502     int i, padding_length;
503     struct pcaprec_hdr ph;
504
505     if (curr_offset > 0) {
506         /* Write the packet */
507
508         /* Compute packet length */
509         length = curr_offset;
510         if (hdr_data_chunk) { length += sizeof(HDR_DATA_CHUNK) + number_of_padding_bytes(curr_offset); }
511         if (hdr_sctp) { length += sizeof(HDR_SCTP); }
512         if (hdr_udp) { length += sizeof(HDR_UDP); udp_length = length; }
513         if (hdr_ip) { length += sizeof(HDR_IP); ip_length = length; }
514         if (hdr_ethernet) {
515             length += sizeof(HDR_ETHERNET);
516             /* Pad trailer */
517             if (length < 60) {
518                 eth_trailer_length = 60 - length;
519                 length = 60;
520             }
521         }
522
523         /* Write PCap header */
524         ph.ts_sec = ts_sec;
525         ph.ts_usec = ts_usec;
526         ph.incl_len = length;
527         ph.orig_len = length;
528         fwrite(&ph, sizeof(ph), 1, output_file);
529         
530         /* Write Ethernet header */
531         if (hdr_ethernet) {
532             HDR_ETHERNET.l3pid = htons(hdr_ethernet_proto);
533             fwrite(&HDR_ETHERNET, sizeof(HDR_ETHERNET), 1, output_file);
534         }
535
536         /* Write IP header */
537         if (hdr_ip) {
538             HDR_IP.packet_length = htons(ip_length);
539             HDR_IP.protocol = hdr_ip_proto;
540             HDR_IP.hdr_checksum = 0;
541             HDR_IP.hdr_checksum = in_checksum(&HDR_IP, sizeof(HDR_IP));
542             fwrite(&HDR_IP, sizeof(HDR_IP), 1, output_file);
543         }
544
545         /* Write UDP header */
546         if (hdr_udp) {
547             HDR_UDP.source_port = htons(hdr_udp_src);
548             HDR_UDP.dest_port = htons(hdr_udp_dest);
549             HDR_UDP.length = htons(udp_length);
550             
551             fwrite(&HDR_UDP, sizeof(HDR_UDP), 1, output_file);
552         }
553         
554         /* Compute DATA chunk header and append padding */
555         if (hdr_data_chunk) {
556             HDR_DATA_CHUNK.type   = hdr_data_chunk_type;
557             HDR_DATA_CHUNK.bits   = hdr_data_chunk_bits;
558             HDR_DATA_CHUNK.length = htons(curr_offset + sizeof(HDR_DATA_CHUNK));
559             HDR_DATA_CHUNK.tsn    = htonl(hdr_data_chunk_tsn);
560             HDR_DATA_CHUNK.sid    = htons(hdr_data_chunk_sid);
561             HDR_DATA_CHUNK.ssn    = htons(hdr_data_chunk_ssn);
562             HDR_DATA_CHUNK.ppid   = htonl(hdr_data_chunk_ppid);
563             
564             padding_length = number_of_padding_bytes(curr_offset);
565             for (i=0; i<padding_length; i++)
566               write_byte("0");
567         }
568         
569         /* Write SCTP header */
570         if (hdr_sctp) {
571             HDR_SCTP.src_port  = htons(hdr_sctp_src);
572             HDR_SCTP.dest_port = htons(hdr_sctp_dest);
573             HDR_SCTP.tag       = htonl(hdr_sctp_tag);
574             HDR_SCTP.checksum  = htonl(0);
575             HDR_SCTP.checksum  = crc32c((unsigned char *)&HDR_SCTP, sizeof(HDR_SCTP), ~0L);
576             if (hdr_data_chunk)
577               HDR_SCTP.checksum  = crc32c((unsigned char *)&HDR_DATA_CHUNK, sizeof(HDR_DATA_CHUNK), HDR_SCTP.checksum);
578             HDR_SCTP.checksum  = htonl(finalize_crc32c(crc32c(packet_buf, curr_offset, HDR_SCTP.checksum)));
579             
580             fwrite(&HDR_SCTP, sizeof(HDR_SCTP), 1, output_file);
581         }
582         
583         /* Write DATA chunk header */
584         if (hdr_data_chunk) {
585             fwrite(&HDR_DATA_CHUNK, sizeof(HDR_DATA_CHUNK), 1, output_file);
586         }
587         /* Write packet */
588         fwrite(packet_buf, curr_offset, 1, output_file);
589
590         /* Write Ethernet trailer */
591         if (hdr_ethernet && eth_trailer_length > 0) {
592             memset(tempbuf, 0, eth_trailer_length);
593             fwrite(tempbuf, eth_trailer_length, 1, output_file);
594         }
595
596         if (!quiet)
597             fprintf(stderr, "Wrote packet of %lu bytes\n", curr_offset);
598         num_packets_written ++;
599     }
600     curr_offset = 0;
601 }
602
603 /*----------------------------------------------------------------------
604  * Write the PCap file header 
605  */
606 static void
607 write_file_header (void)
608 {
609     struct pcap_hdr fh;
610
611     fh.magic = PCAP_MAGIC;
612     fh.version_major = 2;
613     fh.version_minor = 4;
614     fh.thiszone = 0;
615     fh.sigfigs = 0;
616     fh.snaplen = 102400;
617     fh.network = pcap_link_type;
618
619     fwrite(&fh, sizeof(fh), 1, output_file);
620 }
621
622 /*----------------------------------------------------------------------
623  * Append a token to the packet preamble.
624  */
625 static void
626 append_to_preamble(char *str)
627 {
628     size_t toklen;
629
630     if (packet_preamble_len != 0) {
631         if (packet_preamble_len == PACKET_PREAMBLE_MAX_LEN)
632             return;     /* no room to add more preamble */
633         /* Add a blank separator between the previous token and this token. */
634         packet_preamble[packet_preamble_len++] = ' ';
635     }
636     toklen = strlen(str);
637     if (toklen != 0) {
638         if (packet_preamble_len + toklen > PACKET_PREAMBLE_MAX_LEN)
639             return;     /* no room to add the token to the preamble */
640         strcpy(&packet_preamble[packet_preamble_len], str);
641         packet_preamble_len += toklen;
642     }
643 }
644
645 /*----------------------------------------------------------------------
646  * Parse the preamble to get the timecode.
647  */
648 static void
649 parse_preamble (void)
650 {
651         struct tm timecode;
652         char *subsecs;
653         char *p;
654         int  subseclen;
655         int  i;
656
657         /*
658          * If no "-t" flag was specified, don't attempt to parse a packet
659          * preamble to extract a time stamp.
660          */
661         if (ts_fmt == NULL)
662             return;
663
664         ts_sec  = 0;
665         ts_usec = 0;
666
667         /*
668          * Null-terminate the preamble.
669          */
670         packet_preamble[packet_preamble_len] = '\0';
671
672         /* Ensure preamble has more than two chars before atempting to parse.
673          * This should cover line breaks etc that get counted.
674          */
675         if ( strlen(packet_preamble) > 2 ) {
676                 /*
677                  * Initialize to the Epoch, just in case not all fields
678                  * of the date and time are specified.
679                  */
680                 timecode.tm_sec = 0;
681                 timecode.tm_min = 0;
682                 timecode.tm_hour = 0;
683                 timecode.tm_mday = 1;
684                 timecode.tm_mon = 0;
685                 timecode.tm_year = 70;
686                 timecode.tm_wday = 0;
687                 timecode.tm_yday = 0;
688                 timecode.tm_isdst = -1;
689
690                 /* Get Time leaving subseconds */
691                 subsecs = strptime( packet_preamble, ts_fmt, &timecode );
692                 if (subsecs != NULL) {
693                         /* Get the long time from the tm structure */
694                         ts_sec  = (unsigned long)mktime( &timecode );
695                 } else
696                         ts_sec = -1;    /* we failed to parse it */
697
698                 /* This will ensure incorrectly parsed dates get set to zero */
699                 if ( -1L == (long)ts_sec ) 
700                 {
701                         ts_sec  = 0;
702                         ts_usec = 0;
703                 }
704                 else
705                 {
706                         /* Parse subseconds */
707                         ts_usec = strtol(subsecs, &p, 10);
708                         if (subsecs == p) {
709                                 /* Error */
710                                 ts_usec = 0;
711                         } else {
712                                 /*
713                                  * Convert that number to a number
714                                  * of microseconds; if it's N digits
715                                  * long, it's in units of 10^(-N) seconds,
716                                  * so, to convert it to units of
717                                  * 10^-6 seconds, we multiply by
718                                  * 10^(6-N).
719                                  */
720                                 subseclen = p - subsecs;
721                                 if (subseclen > 6) {
722                                         /*
723                                          * *More* than 6 digits; 6-N is
724                                          * negative, so we divide by
725                                          * 10^(N-6).
726                                          */
727                                         for (i = subseclen - 6; i != 0; i--)
728                                                 ts_usec /= 10;
729                                 } else if (subseclen < 6) {
730                                         for (i = 6 - subseclen; i != 0; i--)
731                                                 ts_usec *= 10;
732                                 }
733                         }
734                 }
735         }
736
737
738         /*printf("Format(%s), time(%u), subsecs(%u)\n\n", ts_fmt, ts_sec, ts_usec);*/
739         
740         /* Clear Preamble */
741         packet_preamble_len = 0;
742 }
743
744 /*----------------------------------------------------------------------
745  * Start a new packet 
746  */
747 static void
748 start_new_packet (void)
749 {
750     if (debug>=1) 
751         fprintf(stderr, "Start new packet\n");
752
753     /* Write out the current packet, if required */
754     write_current_packet();
755     curr_offset = 0;
756     num_packets_read ++;
757
758     /* Ensure we parse the packet preamble as it may contain the time */
759     parse_preamble();
760 }
761
762 /*----------------------------------------------------------------------
763  * Process a directive
764  */
765 static void
766 process_directive (char *str)
767 {
768     fprintf(stderr, "\n--- Directive [%s] currently unsupported ---\n", str+10);
769
770 }
771
772 /*----------------------------------------------------------------------
773  * Parse a single token (called from the scanner)
774  */
775 void 
776 parse_token (token_t token, char *str)
777 {
778     unsigned long num;
779
780     /* 
781      * This is implemented as a simple state machine of five states. 
782      * State transitions are caused by tokens being received from the 
783      * scanner. The code should be self_documenting.
784      */
785
786     if (debug>=2) {
787         /* Sanitize - remove all '\r' */
788         char *c;
789         if (str!=NULL) { while ((c = strchr(str, '\r')) != NULL) *c=' '; }
790         
791         fprintf(stderr, "(%s, %s \"%s\") -> (", 
792                 state_str[state], token_str[token], str ? str : "");
793     }
794
795     switch(state) {
796
797     /* ----- Waiting for new packet -------------------------------------------*/
798     case INIT:
799         switch(token) {
800         case T_TEXT:
801             append_to_preamble(str);
802             break;
803         case T_DIRECTIVE:
804             process_directive(str);
805             break;
806         case T_OFFSET:
807             num = parse_num(str, TRUE);
808             if (num==0) {
809                 /* New packet starts here */
810                 start_new_packet();
811                 state = READ_OFFSET;
812             }
813             break;
814         default:
815             break;
816         }
817         break;
818
819     /* ----- Processing packet, start of new line -----------------------------*/
820     case START_OF_LINE:
821         switch(token) {
822         case T_TEXT:
823             append_to_preamble(str);
824             break;
825         case T_DIRECTIVE:
826             process_directive(str);
827             break;
828         case T_OFFSET:
829             num = parse_num(str, TRUE);
830             if (num==0) {
831                 /* New packet starts here */
832                 start_new_packet();
833                 state = READ_OFFSET;
834             } else if (num != curr_offset) {
835                 /*
836                  * The offset we read isn't the one we expected.
837                  * This may only mean that we mistakenly interpreted
838                  * some text as byte values (e.g., if the text dump
839                  * of packet data included a number with spaces around
840                  * it).  If the offset is less than what we expected,
841                  * assume that's the problem, and throw away the putative
842                  * extra byte values.
843                  */
844                 if (num < curr_offset) {
845                     unwrite_bytes(curr_offset - num);
846                     state = READ_OFFSET;
847                 } else {
848                     /* Bad offset; switch to INIT state */
849                     if (debug>=1)
850                         fprintf(stderr, "Inconsistent offset. Expecting %0lX, got %0lX. Ignoring rest of packet\n", 
851                                 curr_offset, num);
852                     write_current_packet();
853                     state = INIT;
854                 }
855             } else 
856                 state = READ_OFFSET;
857             break;
858         default:
859             break;
860         }
861         break;
862
863     /* ----- Processing packet, read offset -----------------------------------*/
864     case READ_OFFSET:
865         switch(token) {
866         case T_BYTE:
867             /* Record the byte */
868             state = READ_BYTE;
869             write_byte(str);
870             break;
871         case T_TEXT:
872         case T_DIRECTIVE:
873         case T_OFFSET:
874             state = READ_TEXT;
875             break;
876         case T_EOL:
877             state = START_OF_LINE;
878             break;
879         default:
880             break;
881         }
882         break;
883
884     /* ----- Processing packet, read byte -------------------------------------*/
885     case READ_BYTE:
886         switch(token) {
887         case T_BYTE:
888             /* Record the byte */
889             write_byte(str);
890             break;
891         case T_TEXT:
892         case T_DIRECTIVE:
893         case T_OFFSET:
894             state = READ_TEXT;
895             break;
896         case T_EOL:
897             state = START_OF_LINE;
898             break;
899         default:
900             break;
901         }
902         break;
903
904     /* ----- Processing packet, read text -------------------------------------*/
905     case READ_TEXT:
906         switch(token) {
907         case T_EOL:
908             state = START_OF_LINE;
909             break;
910         default:
911             break;
912         }
913         break;
914
915     default:
916         fprintf(stderr, "FATAL ERROR: Bad state (%d)", state);
917         exit(-1);
918     }
919
920     if (debug>=2) 
921         fprintf(stderr, ", %s)\n", state_str[state]);
922
923 }
924
925 /*----------------------------------------------------------------------
926  * Print helpstring and exit
927  */
928 static void
929 help (char *progname)
930 {
931     fprintf(stderr, 
932             "\n"
933             "Usage: %s [-d] [-q] [-o h|o] [-l typenum] [-e l3pid] [-i proto] \n"
934             "          [-u srcp,destp] [-s srcp,destp,tag] [-S srcp,destp,tag] [-t timefmt] <input-filename> <output-filename>\n"
935             "\n"
936             "where <input-filename> specifies input filename (use - for standard input)\n"
937             "      <output-filename> specifies output filename (use - for standard output)\n"
938             "\n"
939             "[options] are one or more of the following \n"
940             "\n"
941             " -w filename     : Write capfile to <filename>. Default is standard output\n"
942             " -h              : Display this help message \n"
943             " -d              : Generate detailed debug of parser states \n"
944             " -o hex|oct      : Parse offsets as (h)ex or (o)ctal. Default is hex\n"
945             " -l typenum      : Specify link-layer type number. Default is 1 (Ethernet). \n"
946             "                   See net/bpf.h for list of numbers.\n"
947             " -q              : Generate no output at all (automatically turns off -d)\n"
948             " -e l3pid        : Prepend dummy Ethernet II header with specified L3PID (in HEX)\n"
949             "                   Example: -e 0x800\n"
950             " -i proto        : Prepend dummy IP header with specified IP protocol (in DECIMAL). \n"
951             "                   Automatically prepends Ethernet header as well. Example: -i 46\n"
952             " -u srcp,destp   : Prepend dummy UDP header with specified dest and source ports (in DECIMAL).\n"
953             "                   Automatically prepends Ethernet and IP headers as well\n"
954             "                   Example: -u 30,40\n"
955             " -s srcp,dstp,tag: Prepend dummy SCTP header with specified dest/source ports and\n"
956             "                   verification tag (in DECIMAL).\n"
957             "                   Automatically prepends Ethernet and IP headers as well\n"
958             "                   Example: -s 30,40,34\n"
959             " -S srcp,dstp,ppi: Prepend dummy SCTP header with specified dest/source ports and\n"
960             "                   verification tag 0. It also prepends a dummy SCTP DATA chunk header\n"
961             "                   with payload protocol identifier ppi.\n"
962             "                   Example: -S 30,40,34\n"                               
963             " -t timefmt      : Treats the text before the packet as a date/time code; the\n"
964             "                   specified argument is a format string of the sort supported\n"
965             "                   by strptime.\n"
966             "                   Example: The time \"10:15:14.5476\" has the format code\n"
967             "                   \"%%H:%%M:%%S.\"\n"
968             "                   NOTE:    The subsecond component delimiter must be specified\n"
969             "                            (.) but no pattern is required; the remaining number\n"
970             "                            is assumed to be fractions of a second.\n"
971             "",
972             progname);
973
974     exit(-1);
975 }
976
977 /*----------------------------------------------------------------------
978  * Parse CLI options 
979  */
980 static void
981 parse_options (int argc, char *argv[])
982 {
983     int c;
984     char *p;
985
986     /* Scan CLI parameters */
987     while ((c = getopt(argc, argv, "dqr:w:e:i:l:o:u:s:S:t:")) != -1) {
988         switch(c) {
989         case '?': help(argv[0]); break;
990         case 'h': help(argv[0]); break;
991         case 'd': if (!quiet) debug++; break;
992         case 'q': quiet = TRUE; debug = FALSE; break;
993         case 'l': pcap_link_type = atoi(optarg); break;
994         case 'o': 
995             if (optarg[0]!='h' && optarg[0] != 'o') {
996                 fprintf(stderr, "Bad argument for '-e': %s\n", optarg);
997                 help(argv[0]);
998             }
999             offset_base = (optarg[0]=='o') ? 8 : 16;
1000             break;
1001         case 'e':
1002             hdr_ethernet = TRUE;
1003             if (sscanf(optarg, "%lx", &hdr_ethernet_proto) < 1) {
1004                 fprintf(stderr, "Bad argument for '-e': %s\n", optarg);
1005                 help(argv[0]);
1006             }
1007             break;
1008             
1009         case 'i':
1010             hdr_ip = TRUE;
1011             if (sscanf(optarg, "%ld", &hdr_ip_proto) < 1) {
1012                 fprintf(stderr, "Bad argument for '-i': %s\n", optarg);
1013                 help(argv[0]);
1014             }
1015             hdr_ethernet = TRUE;
1016             hdr_ethernet_proto = 0x800;
1017             break;
1018             
1019         case 's':
1020             hdr_sctp       = TRUE;
1021             hdr_sctp_src   = strtol(optarg, &p, 10);
1022             if (p == optarg || (*p != ',' && *p != '\0')) {
1023                 fprintf(stderr, "Bad src port for '-%c'\n", c);
1024                 help(argv[0]);
1025             }
1026             if (*p == '\0') {
1027                 fprintf(stderr, "No dest port specified for '-%c'\n", c);
1028                 help(argv[0]);
1029             }
1030             p++;
1031             optarg = p;
1032             hdr_sctp_dest = strtol(optarg, &p, 10);
1033             if (p == optarg || (*p != ',' && *p != '\0')) {
1034                 fprintf(stderr, "Bad dest port for '-s'\n");
1035                 help(argv[0]);
1036             }            
1037             if (*p == '\0') {
1038                 fprintf(stderr, "No tag specified for '-%c'\n", c);
1039                 help(argv[0]);
1040             }
1041             p++;
1042             optarg = p;
1043             hdr_sctp_tag = strtol(optarg, &p, 10);
1044             if (p == optarg || *p != '\0') {
1045                 fprintf(stderr, "Bad tag for '-%c'\n", c);
1046                 help(argv[0]);
1047             }
1048
1049             hdr_ip = TRUE;
1050             hdr_ip_proto = 132;
1051             hdr_ethernet = TRUE;
1052             hdr_ethernet_proto = 0x800;
1053             break;
1054         case 'S':
1055             hdr_sctp       = TRUE;
1056             hdr_data_chunk = TRUE;
1057             hdr_sctp_src   = strtol(optarg, &p, 10);
1058             if (p == optarg || (*p != ',' && *p != '\0')) {
1059                 fprintf(stderr, "Bad src port for '-%c'\n", c);
1060                 help(argv[0]);
1061             }
1062             if (*p == '\0') {
1063                 fprintf(stderr, "No dest port specified for '-%c'\n", c);
1064                 help(argv[0]);
1065             }
1066             p++;
1067             optarg = p;
1068             hdr_sctp_dest = strtol(optarg, &p, 10);
1069             if (p == optarg || (*p != ',' && *p != '\0')) {
1070                 fprintf(stderr, "Bad dest port for '-s'\n");
1071                 help(argv[0]);
1072             }            if (*p == '\0') {
1073                 fprintf(stderr, "No ppi specified for '-%c'\n", c);
1074                 help(argv[0]);
1075             }
1076             p++;
1077             optarg = p;
1078             hdr_data_chunk_ppid = strtoul(optarg, &p, 10);
1079             if (p == optarg || *p != '\0') {
1080                 fprintf(stderr, "Bad ppi for '-%c'\n", c);
1081                 help(argv[0]);
1082             }
1083
1084             hdr_ip = TRUE;
1085             hdr_ip_proto = 132;
1086             hdr_ethernet = TRUE;
1087             hdr_ethernet_proto = 0x800;
1088             break;
1089
1090         case 't':
1091             ts_fmt = optarg;
1092             break;
1093             
1094         case 'u':
1095             hdr_udp = TRUE;
1096             hdr_udp_src = strtol(optarg, &p, 10);
1097             if (p == optarg || (*p != ',' && *p != '\0')) {
1098                 fprintf(stderr, "Bad src port for '-u'\n");
1099                 help(argv[0]);
1100             }
1101             if (*p == '\0') {
1102                 fprintf(stderr, "No dest port specified for '-u'\n");
1103                 help(argv[0]);
1104             }
1105             p++;
1106             optarg = p;
1107             hdr_udp_dest = strtol(optarg, &p, 10);
1108             if (p == optarg || *p != '\0') {
1109                 fprintf(stderr, "Bad dest port for '-u'\n");
1110                 help(argv[0]);
1111             }
1112             hdr_ip = TRUE;
1113             hdr_ip_proto = 17;
1114             hdr_ethernet = TRUE;
1115             hdr_ethernet_proto = 0x800;
1116             break;
1117             
1118         default:
1119             help(argv[0]);
1120         }
1121     }
1122
1123     if (optind >= argc || argc-optind < 2) {
1124         fprintf(stderr, "Must specify input and output filename\n");
1125         help(argv[0]);
1126     }
1127
1128     if (strcmp(argv[optind], "-")) {
1129         input_filename = strdup(argv[optind]);
1130         input_file = fopen(input_filename, "rb");
1131         if (!input_file) {
1132             fprintf(stderr, "Cannot open file [%s] for reading: %s\n", 
1133                     input_filename, strerror(errno));
1134             exit(-1);
1135         }
1136     } else {
1137         input_filename = "Standard input";
1138         input_file = stdin;
1139     }
1140
1141     if (strcmp(argv[optind+1], "-")) {
1142         output_filename = strdup(argv[optind+1]);
1143         output_file = fopen(output_filename, "wb");
1144         if (!output_file) {
1145             fprintf(stderr, "Cannot open file [%s] for writing: %s\n", 
1146                     output_filename, strerror(errno));
1147             exit(-1);
1148         }
1149     } else {
1150         output_filename = "Standard output";
1151         output_file = stdout;
1152     }
1153
1154     /* Some validation */
1155     if (pcap_link_type != 1 && hdr_ethernet) {
1156         fprintf(stderr, "Dummy headers (-e, -i, -u, -s, -S) cannot be specified with link type override (-l)\n");
1157         exit(-1);
1158     }
1159
1160     /* Set up our variables */
1161     if (!input_file) {
1162         input_file = stdin;
1163         input_filename = "Standard input";
1164     }
1165     if (!output_file) {
1166         output_file = stdout;
1167         output_filename = "Standard output";
1168     }
1169     
1170     /* Display summary of our state */
1171     if (!quiet) {
1172         fprintf(stderr, "Input from: %s\n", input_filename);
1173         fprintf(stderr, "Output to: %s\n", output_filename);
1174
1175         if (hdr_ethernet) fprintf(stderr, "Generate dummy Ethernet header: Protocol: 0x%0lX\n", 
1176                                   hdr_ethernet_proto); 
1177         if (hdr_ip) fprintf(stderr, "Generate dummy IP header: Protocol: %ld\n", 
1178                             hdr_ip_proto); 
1179         if (hdr_udp) fprintf(stderr, "Generate dummy UDP header: Source port: %ld. Dest port: %ld\n", 
1180                              hdr_udp_src, hdr_udp_dest); 
1181         if (hdr_sctp) fprintf(stderr, "Generate dummy SCTP header: Source port: %ld. Dest port: %ld. Tag: %ld\n", 
1182                               hdr_sctp_src, hdr_sctp_dest, hdr_sctp_tag); 
1183         if (hdr_data_chunk) fprintf(stderr, "Generate dummy DATA chunk header: TSN: %lu. SID: %d. SSN: %d. PPID: %lu\n", 
1184                                     hdr_data_chunk_tsn, hdr_data_chunk_sid, hdr_data_chunk_ssn, hdr_data_chunk_ppid); 
1185     }
1186 }
1187
1188 int main(int argc, char *argv[])
1189 {
1190     parse_options(argc, argv);
1191
1192     assert(input_file != NULL);
1193     assert(output_file != NULL);
1194
1195     write_file_header();
1196
1197     yyin = input_file;
1198     yylex();
1199
1200     write_current_packet();
1201     if (debug)
1202         fprintf(stderr, "\n-------------------------\n");
1203     if (!quiet) {
1204     fprintf(stderr, "Read %ld potential packets, wrote %ld packets\n", 
1205             num_packets_read, num_packets_written);
1206     }
1207     return 0;
1208 }