17b43d2338b398e7d085e2539fb74325d249aabf
[obnox/wireshark/wip.git] / text2pcap.c
1 /**-*-C-*-**********************************************************************
2  *
3  * text2pcap.c
4  *
5  * Utility to convert an ASCII hexdump into a libpcap-format capture file
6  *
7  * (c) Copyright 2001 Ashok Narayanan <ashokn@cisco.com>
8  *
9  * $Id: text2pcap.c,v 1.12 2002/01/29 22:57:30 gram Exp $
10  * 
11  * Ethereal - Network traffic analyzer
12  * By Gerald Combs <gerald@ethereal.com>
13  * Copyright 1998 Gerald Combs
14  * 
15  * This program is free software; you can redistribute it and/or
16  * modify it under the terms of the GNU General Public License
17  * as published by the Free Software Foundation; either version 2
18  * of the License, or (at your option) any later version.
19  * 
20  * This program is distributed in the hope that it will be useful,
21  * but WITHOUT ANY WARRANTY; without even the implied warranty of
22  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
23  * GNU General Public License for more details.
24  * 
25  * You should have received a copy of the GNU General Public License
26  * along with this program; if not, write to the Free Software
27  * Foundation, Inc., 59 Temple Place - Suite 330, Boston, MA  02111-1307, USA.
28  *
29  *******************************************************************************/
30
31 /*******************************************************************************
32  *
33  * This utility reads in an ASCII hexdump of this common format:
34  *
35  * 00000000  00 E0 1E A7 05 6F 00 10 5A A0 B9 12 08 00 46 00 .....o..Z.....F.
36  * 00000010  03 68 00 00 00 00 0A 2E EE 33 0F 19 08 7F 0F 19 .h.......3...\7f..
37  * 00000020  03 80 94 04 00 00 10 01 16 A2 0A 00 03 50 00 0C .............P..
38  * 00000030  01 01 0F 19 03 80 11 01 1E 61 00 0C 03 01 0F 19 .........a......
39  *
40  * Each bytestring line consists of an offset, one or more bytes, and
41  * text at the end. An offset is defined as a hex string of more than
42  * two characters. A byte is defined as a hex string of exactly two
43  * characters. The text at the end is ignored, as is any text before
44  * the offset. Bytes read from a bytestring line are added to the
45  * current packet only if all the following conditions are satisfied:
46  *
47  * - No text appears between the offset and the bytes (any bytes appearing after
48  *   such text would be ignored)
49  *
50  * - The offset must be arithmetically correct, i.e. if the offset is 00000020, then
51  *   exactly 32 bytes must have been read into this packet before this. If the offset
52  *   is wrong, the packet is immediately terminated
53  *
54  * A packet start is signalled by a zero offset.
55  *
56  * Lines starting with #TEXT2PCAP are directives. These allow the user
57  * to embed instructions into the capture file which allows text2pcap
58  * to take some actions (e.g. specifying the encapsulation
59  * etc.). Currently no directives are implemented.
60  *
61  * Lines beginning with # which are not directives are ignored as
62  * comments. Currently all non-hexdump text is ignored by text2pcap;
63  * in the future, text processing may be added, but lines prefixed
64  * with '#' will still be ignored.
65  *
66  * The output is a libpcap packet containing Ethernet frames by
67  * default. This program takes options which allow the user to add
68  * dummy Ethernet, IP and UDP headers to the packets in order to allow
69  * dumps of L3 or higher protocols to be decoded.
70  *
71  * Considerable flexibility is built into this code to read hexdumps
72  * of slightly different formats. For example, any text prefixing the
73  * hexdump line is dropped (including mail forwarding '>'). The offset
74  * can be any hex number of four digits or greater.
75  *
76  * This converter cannot read a single packet greater than 64K. Packet
77  * snaplength is automatically set to 64K.
78  */
79
80 #ifdef HAVE_CONFIG_H
81 # include "config.h"
82 #endif
83
84 #include <ctype.h>
85 #include <stdio.h>
86 #include <stdlib.h>
87 #include <string.h>
88
89 /*
90  * Just make sure we include the prototype for strptime as well
91  * (needed for glibc 2.2)
92  */
93 #ifndef _XOPEN_SOURCE
94 #define _XOPEN_SOURCE 500
95 #endif
96 #define __USE_XOPEN
97
98 #include <time.h>
99
100 #include <sys/types.h>
101 #ifdef HAVE_UNISTD_H
102 # include <unistd.h>
103 #endif
104 #ifdef HAVE_NETINET_IN_H
105 # include <netinet/in.h>
106 #endif
107 #ifdef HAVE_WINSOCK_H
108 # include <winsock.h>
109 #endif
110 #include <errno.h>
111 #include <assert.h>
112
113 #ifdef NEED_GETOPT_H
114 # include "getopt.h"
115 #endif
116
117 #ifdef NEED_STRPTIME_H
118 # include "strptime.h"
119 #endif
120
121 #ifndef TRUE
122 #define TRUE 1
123 #endif
124
125 #ifndef FALSE
126 #define FALSE 0
127 #endif
128
129 #include "text2pcap.h"
130
131 /*--- Options --------------------------------------------------------------------*/
132
133 /* Debug level */
134 int debug = 0; 
135 /* Be quiet */
136 int quiet = FALSE;
137
138 /* Dummy Ethernet header */
139 int hdr_ethernet = FALSE;
140 unsigned long hdr_ethernet_proto = 0;
141
142 /* Dummy IP header */
143 int hdr_ip = FALSE;
144 unsigned long hdr_ip_proto = 0;
145
146 /* Dummy UDP header */
147 int hdr_udp = FALSE;
148 unsigned long hdr_udp_dest = 0;
149 unsigned long hdr_udp_src = 0;
150
151 /* Dummy SCTP header */
152 int hdr_sctp = FALSE;
153 unsigned long hdr_sctp_src  = 0;
154 unsigned long hdr_sctp_dest = 0;
155 unsigned long hdr_sctp_tag  = 0;
156
157 /* Dummy DATA chunk header */
158 int hdr_data_chunk = FALSE;
159 unsigned char  hdr_data_chunk_type = 0;
160 unsigned char  hdr_data_chunk_bits = 3;
161 unsigned long  hdr_data_chunk_tsn  = 0;
162 unsigned short hdr_data_chunk_sid  = 0;
163 unsigned short hdr_data_chunk_ssn  = 0;
164 unsigned long  hdr_data_chunk_ppid = 0;
165
166
167 /*--- Local date -----------------------------------------------------------------*/
168
169 /* This is where we store the packet currently being built */
170 #define MAX_PACKET 64000
171 unsigned char packet_buf[MAX_PACKET];
172 unsigned long curr_offset = 0;
173
174 /* This buffer contains strings present before the packet offset 0 */
175 #define PACKET_PREAMBLE_MAX_LEN 2048
176 static unsigned char packet_preamble[PACKET_PREAMBLE_MAX_LEN+1];
177 static int packet_preamble_len = 0;
178
179 /* Number of packets read and written */
180 unsigned long num_packets_read = 0;
181 unsigned long num_packets_written = 0;
182
183 /* Time code of packet, derived from packet_preamble */
184 static unsigned long ts_sec  = 0;
185 static unsigned long ts_usec = 0;
186 static char *ts_fmt = NULL;
187
188 /* Input file */
189 char *input_filename;
190 FILE *input_file = NULL;
191 /* Output file */
192 char *output_filename;
193 FILE *output_file = NULL;
194
195 /* Offset base to parse */
196 unsigned long offset_base = 16;
197
198 FILE *yyin;
199
200 /* ----- State machine -----------------------------------------------------------*/
201
202 /* Current state of parser */
203 typedef enum {
204     INIT,             /* Waiting for start of new packet */
205     START_OF_LINE,    /* Starting from beginning of line */
206     READ_OFFSET,      /* Just read the offset */
207     READ_BYTE,        /* Just read a byte */
208     READ_TEXT,        /* Just read text - ignore until EOL */
209 } parser_state_t;
210 parser_state_t state = INIT;
211
212 const char *state_str[] = {"Init", 
213                            "Start-of-line", 
214                            "Offset",
215                            "Byte",
216                            "Text"
217 };
218
219 const char *token_str[] = {"",
220                            "Byte", 
221                            "Offset",
222                            "Directive",
223                            "Text",
224                            "End-of-line"
225 };
226
227 /* ----- Skeleton Packet Headers --------------------------------------------------*/
228
229 typedef struct {
230     unsigned char   src_addr[6];
231     unsigned char   dest_addr[6];
232     unsigned short l3pid;
233 } hdr_ethernet_t;
234
235 hdr_ethernet_t HDR_ETHERNET = {
236     {0x01, 0x01, 0x01, 0x01, 0x01, 0x01}, 
237     {0x02, 0x02, 0x02, 0x02, 0x02, 0x02},
238     0};
239
240 typedef struct {
241     unsigned char   ver_hdrlen;
242     unsigned char   dscp;
243     unsigned short packet_length;
244     unsigned short identification;
245     unsigned char   flags;
246     unsigned char   fragment;
247     unsigned char   ttl;
248     unsigned char   protocol;
249     unsigned short hdr_checksum;
250     unsigned long src_addr;
251     unsigned long dest_addr;
252 } hdr_ip_t;
253
254 hdr_ip_t HDR_IP = {0x45, 0, 0, 0x3412, 0, 0, 0xff, 0, 0, 0x01010101, 0x02020202};
255
256 typedef struct {
257     unsigned short source_port;
258     unsigned short dest_port;
259     unsigned short length;
260     unsigned short checksum;
261 } hdr_udp_t;
262
263 hdr_udp_t HDR_UDP = {0, 0, 0, 0};
264
265 typedef struct {
266     unsigned short src_port;
267     unsigned short dest_port;
268     unsigned long  tag;
269     unsigned long  checksum;
270 } hdr_sctp_t;
271
272 hdr_sctp_t HDR_SCTP = {0, 0, 0, 0};
273
274 typedef struct {
275     unsigned char  type;
276     unsigned char  bits;
277     unsigned short length;
278     unsigned long  tsn;
279     unsigned short sid;
280     unsigned short ssn;
281     unsigned long  ppid;
282 } hdr_data_chunk_t;
283
284 hdr_data_chunk_t HDR_DATA_CHUNK = {0, 0, 0, 0, 0, 0, 0};
285
286 char tempbuf[64];
287
288 /*----------------------------------------------------------------------
289  * Stuff for writing a PCap file
290  */
291 #define PCAP_MAGIC                      0xa1b2c3d4
292
293 /* "libpcap" file header (minus magic number). */
294 struct pcap_hdr {
295     unsigned long    magic;          /* magic */
296     unsigned short      version_major;  /* major version number */
297     unsigned short      version_minor;  /* minor version number */
298     unsigned long       thiszone;       /* GMT to local correction */
299     unsigned long       sigfigs;        /* accuracy of timestamps */
300     unsigned long       snaplen;        /* max length of captured packets, in octets */
301     unsigned long       network;        /* data link type */
302 };
303
304 /* "libpcap" record header. */
305 struct pcaprec_hdr {
306     unsigned long       ts_sec;         /* timestamp seconds */
307     unsigned long       ts_usec;        /* timestamp microseconds */
308     unsigned long       incl_len;       /* number of octets of packet saved in file */
309     unsigned long       orig_len;       /* actual length of packet */
310 };
311
312 /* Link-layer type; see net/bpf.h for details */
313 unsigned long pcap_link_type = 1;   /* Default is DLT-EN10MB */
314
315 /*----------------------------------------------------------------------
316  * Parse a single hex number
317  * Will abort the program if it can't parse the number
318  * Pass in TRUE if this is an offset, FALSE if not
319  */
320 static unsigned long
321 parse_num (char *str, int offset)
322 {
323     unsigned long num;
324     char *c;
325
326     num = strtoul(str, &c, offset ? offset_base : 16);
327     if (c==str) {
328         fprintf(stderr, "FATAL ERROR: Bad hex number? [%s]\n", str);
329         exit(-1);
330     }
331     return num;
332 }
333
334 /*----------------------------------------------------------------------
335  * Write this byte into current packet
336  */
337 static void
338 write_byte (char *str)
339 {
340     unsigned long num;
341
342     num = parse_num(str, FALSE);
343     packet_buf[curr_offset] = num;
344     curr_offset ++;
345 }
346
347 /*----------------------------------------------------------------------
348  * Remove bytes from the current packet
349  */
350 static void
351 unwrite_bytes (unsigned long nbytes)
352 {
353     curr_offset -= nbytes;
354 }
355
356 /*----------------------------------------------------------------------
357  * Compute one's complement checksum (from RFC1071)
358  */
359 static unsigned short
360 in_checksum (void *buf, unsigned long count)
361 {
362     unsigned long sum = 0;
363     unsigned short *addr = buf;
364
365     while( count > 1 )  {
366         /*  This is the inner loop */
367         sum += ntohs(* (unsigned short *) addr++);
368         count -= 2;
369     }
370
371     /*  Add left-over byte, if any */
372     if( count > 0 ) 
373         sum += * (unsigned char *) addr;
374
375     /*  Fold 32-bit sum to 16 bits */
376     while (sum>>16)
377         sum = (sum & 0xffff) + (sum >> 16);
378
379     return htons(~sum);
380 }
381
382 /* The CRC32C code is taken from draft-ietf-tsvwg-sctpcsum-01.txt.
383  * That code is copyrighted by D. Otis and has been modified.
384  */
385   
386 #define CRC32C(c,d) (c=(c>>8)^crc_c[(c^(d))&0xFF]) 
387 static unsigned long crc_c[256] = 
388
389 0x00000000L, 0xF26B8303L, 0xE13B70F7L, 0x1350F3F4L,  
390 0xC79A971FL, 0x35F1141CL, 0x26A1E7E8L, 0xD4CA64EBL,  
391 0x8AD958CFL, 0x78B2DBCCL, 0x6BE22838L, 0x9989AB3BL,  
392 0x4D43CFD0L, 0xBF284CD3L, 0xAC78BF27L, 0x5E133C24L,  
393 0x105EC76FL, 0xE235446CL, 0xF165B798L, 0x030E349BL,  
394 0xD7C45070L, 0x25AFD373L, 0x36FF2087L, 0xC494A384L,  
395 0x9A879FA0L, 0x68EC1CA3L, 0x7BBCEF57L, 0x89D76C54L,  
396 0x5D1D08BFL, 0xAF768BBCL, 0xBC267848L, 0x4E4DFB4BL,  
397 0x20BD8EDEL, 0xD2D60DDDL, 0xC186FE29L, 0x33ED7D2AL,  
398 0xE72719C1L, 0x154C9AC2L, 0x061C6936L, 0xF477EA35L,  
399 0xAA64D611L, 0x580F5512L, 0x4B5FA6E6L, 0xB93425E5L,  
400 0x6DFE410EL, 0x9F95C20DL, 0x8CC531F9L, 0x7EAEB2FAL,  
401 0x30E349B1L, 0xC288CAB2L, 0xD1D83946L, 0x23B3BA45L,  
402 0xF779DEAEL, 0x05125DADL, 0x1642AE59L, 0xE4292D5AL,  
403 0xBA3A117EL, 0x4851927DL, 0x5B016189L, 0xA96AE28AL,  
404 0x7DA08661L, 0x8FCB0562L, 0x9C9BF696L, 0x6EF07595L,  
405 0x417B1DBCL, 0xB3109EBFL, 0xA0406D4BL, 0x522BEE48L,  
406 0x86E18AA3L, 0x748A09A0L, 0x67DAFA54L, 0x95B17957L,  
407 0xCBA24573L, 0x39C9C670L, 0x2A993584L, 0xD8F2B687L,  
408 0x0C38D26CL, 0xFE53516FL, 0xED03A29BL, 0x1F682198L,  
409 0x5125DAD3L, 0xA34E59D0L, 0xB01EAA24L, 0x42752927L,  
410 0x96BF4DCCL, 0x64D4CECFL, 0x77843D3BL, 0x85EFBE38L,  
411 0xDBFC821CL, 0x2997011FL, 0x3AC7F2EBL, 0xC8AC71E8L,  
412 0x1C661503L, 0xEE0D9600L, 0xFD5D65F4L, 0x0F36E6F7L,  
413 0x61C69362L, 0x93AD1061L, 0x80FDE395L, 0x72966096L,  
414 0xA65C047DL, 0x5437877EL, 0x4767748AL, 0xB50CF789L,  
415 0xEB1FCBADL, 0x197448AEL, 0x0A24BB5AL, 0xF84F3859L,  
416 0x2C855CB2L, 0xDEEEDFB1L, 0xCDBE2C45L, 0x3FD5AF46L,  
417 0x7198540DL, 0x83F3D70EL, 0x90A324FAL, 0x62C8A7F9L,  
418 0xB602C312L, 0x44694011L, 0x5739B3E5L, 0xA55230E6L,  
419 0xFB410CC2L, 0x092A8FC1L, 0x1A7A7C35L, 0xE811FF36L,  
420 0x3CDB9BDDL, 0xCEB018DEL, 0xDDE0EB2AL, 0x2F8B6829L,  
421 0x82F63B78L, 0x709DB87BL, 0x63CD4B8FL, 0x91A6C88CL,  
422 0x456CAC67L, 0xB7072F64L, 0xA457DC90L, 0x563C5F93L,  
423 0x082F63B7L, 0xFA44E0B4L, 0xE9141340L, 0x1B7F9043L,  
424 0xCFB5F4A8L, 0x3DDE77ABL, 0x2E8E845FL, 0xDCE5075CL,  
425 0x92A8FC17L, 0x60C37F14L, 0x73938CE0L, 0x81F80FE3L,  
426 0x55326B08L, 0xA759E80BL, 0xB4091BFFL, 0x466298FCL,  
427 0x1871A4D8L, 0xEA1A27DBL, 0xF94AD42FL, 0x0B21572CL,  
428 0xDFEB33C7L, 0x2D80B0C4L, 0x3ED04330L, 0xCCBBC033L,  
429 0xA24BB5A6L, 0x502036A5L, 0x4370C551L, 0xB11B4652L,  
430 0x65D122B9L, 0x97BAA1BAL, 0x84EA524EL, 0x7681D14DL,  
431 0x2892ED69L, 0xDAF96E6AL, 0xC9A99D9EL, 0x3BC21E9DL,  
432 0xEF087A76L, 0x1D63F975L, 0x0E330A81L, 0xFC588982L,  
433 0xB21572C9L, 0x407EF1CAL, 0x532E023EL, 0xA145813DL,  
434 0x758FE5D6L, 0x87E466D5L, 0x94B49521L, 0x66DF1622L,  
435 0x38CC2A06L, 0xCAA7A905L, 0xD9F75AF1L, 0x2B9CD9F2L,  
436 0xFF56BD19L, 0x0D3D3E1AL, 0x1E6DCDEEL, 0xEC064EEDL,  
437 0xC38D26C4L, 0x31E6A5C7L, 0x22B65633L, 0xD0DDD530L,  
438 0x0417B1DBL, 0xF67C32D8L, 0xE52CC12CL, 0x1747422FL,  
439 0x49547E0BL, 0xBB3FFD08L, 0xA86F0EFCL, 0x5A048DFFL,  
440 0x8ECEE914L, 0x7CA56A17L, 0x6FF599E3L, 0x9D9E1AE0L,  
441 0xD3D3E1ABL, 0x21B862A8L, 0x32E8915CL, 0xC083125FL,  
442 0x144976B4L, 0xE622F5B7L, 0xF5720643L, 0x07198540L,  
443 0x590AB964L, 0xAB613A67L, 0xB831C993L, 0x4A5A4A90L,  
444 0x9E902E7BL, 0x6CFBAD78L, 0x7FAB5E8CL, 0x8DC0DD8FL,  
445 0xE330A81AL, 0x115B2B19L, 0x020BD8EDL, 0xF0605BEEL,  
446 0x24AA3F05L, 0xD6C1BC06L, 0xC5914FF2L, 0x37FACCF1L,  
447 0x69E9F0D5L, 0x9B8273D6L, 0x88D28022L, 0x7AB90321L,  
448 0xAE7367CAL, 0x5C18E4C9L, 0x4F48173DL, 0xBD23943EL,  
449 0xF36E6F75L, 0x0105EC76L, 0x12551F82L, 0xE03E9C81L,  
450 0x34F4F86AL, 0xC69F7B69L, 0xD5CF889DL, 0x27A40B9EL,  
451 0x79B737BAL, 0x8BDCB4B9L, 0x988C474DL, 0x6AE7C44EL,  
452 0xBE2DA0A5L, 0x4C4623A6L, 0x5F16D052L, 0xAD7D5351L,  
453 }; 
454      
455 static unsigned int
456 crc32c(const unsigned char* buf, unsigned int len, unsigned long crc32_init)
457 {
458   unsigned int i; 
459   unsigned long crc32; 
460             
461   crc32 = crc32_init;
462   for (i = 0; i < len; i++)  
463     CRC32C(crc32, buf[i]); 
464   return crc32; 
465 }
466
467 static unsigned long
468 number_of_padding_bytes (unsigned long length)
469 {
470   unsigned long remainder;
471
472   remainder = length % 4;
473
474   if (remainder == 0)
475     return 0;
476   else
477     return 4 - remainder;
478 }
479
480 /*----------------------------------------------------------------------
481  * Write current packet out 
482  */
483 static void
484 write_current_packet (void)
485 {
486     int length = 0;
487     int udp_length = 0;
488     int ip_length = 0;
489     int eth_trailer_length = 0;
490     int i, padding_length;
491     struct pcaprec_hdr ph;
492
493     if (curr_offset > 0) {
494         /* Write the packet */
495
496         /* Compute packet length */
497         length = curr_offset;
498         if (hdr_data_chunk) { length += sizeof(HDR_DATA_CHUNK) + number_of_padding_bytes(curr_offset); }
499         if (hdr_sctp) { length += sizeof(HDR_SCTP); }
500         if (hdr_udp) { length += sizeof(HDR_UDP); udp_length = length; }
501         if (hdr_ip) { length += sizeof(HDR_IP); ip_length = length; }
502         if (hdr_ethernet) {
503             length += sizeof(HDR_ETHERNET);
504             /* Pad trailer */
505             if (length < 60) {
506                 eth_trailer_length = 60 - length;
507                 length = 60;
508             }
509         }
510
511         /* Write PCap header */
512         ph.ts_sec = ts_sec;
513         ph.ts_usec = ts_usec;
514         ph.incl_len = length;
515         ph.orig_len = length;
516         fwrite(&ph, sizeof(ph), 1, output_file);
517         
518         /* Write Ethernet header */
519         if (hdr_ethernet) {
520             HDR_ETHERNET.l3pid = htons(hdr_ethernet_proto);
521             fwrite(&HDR_ETHERNET, sizeof(HDR_ETHERNET), 1, output_file);
522         }
523
524         /* Write IP header */
525         if (hdr_ip) {
526             HDR_IP.packet_length = htons(ip_length);
527             HDR_IP.protocol = hdr_ip_proto;
528             HDR_IP.hdr_checksum = 0;
529             HDR_IP.hdr_checksum = in_checksum(&HDR_IP, sizeof(HDR_IP));
530             fwrite(&HDR_IP, sizeof(HDR_IP), 1, output_file);
531         }
532
533         /* Write UDP header */
534         if (hdr_udp) {
535             HDR_UDP.source_port = htons(hdr_udp_src);
536             HDR_UDP.dest_port = htons(hdr_udp_dest);
537             HDR_UDP.length = htons(udp_length);
538             
539             fwrite(&HDR_UDP, sizeof(HDR_UDP), 1, output_file);
540         }
541         
542         /* Compute DATA chunk header and append padding */
543         if (hdr_data_chunk) {
544             HDR_DATA_CHUNK.type   = hdr_data_chunk_type;
545             HDR_DATA_CHUNK.bits   = hdr_data_chunk_bits;
546             HDR_DATA_CHUNK.length = htons(curr_offset + sizeof(HDR_DATA_CHUNK));
547             HDR_DATA_CHUNK.tsn    = htonl(hdr_data_chunk_tsn);
548             HDR_DATA_CHUNK.sid    = htons(hdr_data_chunk_sid);
549             HDR_DATA_CHUNK.ssn    = htons(hdr_data_chunk_ssn);
550             HDR_DATA_CHUNK.ppid   = htonl(hdr_data_chunk_ppid);
551             
552             padding_length = number_of_padding_bytes(curr_offset);
553             for (i=0; i<padding_length; i++)
554               write_byte("0");
555         }
556         
557         /* Write SCTP header */
558         if (hdr_sctp) {
559             HDR_SCTP.src_port  = htons(hdr_sctp_src);
560             HDR_SCTP.dest_port = htons(hdr_sctp_dest);
561             HDR_SCTP.tag       = htonl(hdr_sctp_tag);
562             HDR_SCTP.checksum  = htonl(0);
563             HDR_SCTP.checksum  = crc32c((unsigned char *)&HDR_SCTP, sizeof(HDR_SCTP), ~0L);
564             if (hdr_data_chunk)
565               HDR_SCTP.checksum  = crc32c((unsigned char *)&HDR_DATA_CHUNK, sizeof(HDR_DATA_CHUNK), HDR_SCTP.checksum);
566             HDR_SCTP.checksum  = htonl(crc32c(packet_buf, curr_offset, HDR_SCTP.checksum));
567             
568             fwrite(&HDR_SCTP, sizeof(HDR_SCTP), 1, output_file);
569         }
570         
571         /* Write DATA chunk header */
572         if (hdr_data_chunk) {
573             fwrite(&HDR_DATA_CHUNK, sizeof(HDR_DATA_CHUNK), 1, output_file);
574         }
575         /* Write packet */
576         fwrite(packet_buf, curr_offset, 1, output_file);
577
578         /* Write Ethernet trailer */
579         if (hdr_ethernet && eth_trailer_length > 0) {
580             memset(tempbuf, 0, eth_trailer_length);
581             fwrite(tempbuf, eth_trailer_length, 1, output_file);
582         }
583
584         if (!quiet)
585             fprintf(stderr, "Wrote packet of %lu bytes\n", curr_offset);
586         num_packets_written ++;
587     }
588     curr_offset = 0;
589 }
590
591 /*----------------------------------------------------------------------
592  * Write the PCap file header 
593  */
594 static void
595 write_file_header (void)
596 {
597     struct pcap_hdr fh;
598
599     fh.magic = PCAP_MAGIC;
600     fh.version_major = 2;
601     fh.version_minor = 4;
602     fh.thiszone = 0;
603     fh.sigfigs = 0;
604     fh.snaplen = 102400;
605     fh.network = pcap_link_type;
606
607     fwrite(&fh, sizeof(fh), 1, output_file);
608 }
609
610 /*----------------------------------------------------------------------
611  * Append a token to the packet preamble.
612  */
613 static void
614 append_to_preamble(char *str)
615 {
616     size_t toklen;
617
618     if (packet_preamble_len != 0) {
619         if (packet_preamble_len == PACKET_PREAMBLE_MAX_LEN)
620             return;     /* no room to add more preamble */
621         /* Add a blank separator between the previous token and this token. */
622         packet_preamble[packet_preamble_len++] = ' ';
623     }
624     toklen = strlen(str);
625     if (toklen != 0) {
626         if (packet_preamble_len + toklen > PACKET_PREAMBLE_MAX_LEN)
627             return;     /* no room to add the token to the preamble */
628         strcpy(&packet_preamble[packet_preamble_len], str);
629         packet_preamble_len += toklen;
630     }
631 }
632
633 /*----------------------------------------------------------------------
634  * Parse the preamble to get the timecode.
635  */
636 static void
637 parse_preamble (void)
638 {
639         struct tm timecode;
640         char *subsecs;
641         char *p;
642         int  subseclen;
643         int  i;
644
645         /*
646          * If no "-t" flag was specified, don't attempt to parse a packet
647          * preamble to extract a time stamp.
648          */
649         if (ts_fmt == NULL)
650             return;
651
652         ts_sec  = 0;
653         ts_usec = 0;
654
655         /*
656          * Null-terminate the preamble.
657          */
658         packet_preamble[packet_preamble_len] = '\0';
659
660         /* Ensure preamble has more than two chars before atempting to parse.
661          * This should cover line breaks etc that get counted.
662          */
663         if ( strlen(packet_preamble) > 2 ) {
664                 /*
665                  * Initialize to the Epoch, just in case not all fields
666                  * of the date and time are specified.
667                  */
668                 timecode.tm_sec = 0;
669                 timecode.tm_min = 0;
670                 timecode.tm_hour = 0;
671                 timecode.tm_mday = 1;
672                 timecode.tm_mon = 0;
673                 timecode.tm_year = 70;
674                 timecode.tm_wday = 0;
675                 timecode.tm_yday = 0;
676                 timecode.tm_isdst = -1;
677
678                 /* Get Time leaving subseconds */
679                 subsecs = strptime( packet_preamble, ts_fmt, &timecode );
680                 if (subsecs != NULL) {
681                         /* Get the long time from the tm structure */
682                         ts_sec  = (unsigned long)mktime( &timecode );
683                 } else
684                         ts_sec = -1;    /* we failed to parse it */
685
686                 /* This will ensure incorrectly parsed dates get set to zero */
687                 if ( -1L == (long)ts_sec ) 
688                 {
689                         ts_sec  = 0;
690                         ts_usec = 0;
691                 }
692                 else
693                 {
694                         /* Parse subseconds */
695                         ts_usec = strtol(subsecs, &p, 10);
696                         if (subsecs == p) {
697                                 /* Error */
698                                 ts_usec = 0;
699                         } else {
700                                 /*
701                                  * Convert that number to a number
702                                  * of microseconds; if it's N digits
703                                  * long, it's in units of 10^(-N) seconds,
704                                  * so, to convert it to units of
705                                  * 10^-6 seconds, we multiply by
706                                  * 10^(6-N).
707                                  */
708                                 subseclen = p - subsecs;
709                                 if (subseclen > 6) {
710                                         /*
711                                          * *More* than 6 digits; 6-N is
712                                          * negative, so we divide by
713                                          * 10^(N-6).
714                                          */
715                                         for (i = subseclen - 6; i != 0; i--)
716                                                 ts_usec /= 10;
717                                 } else if (subseclen < 6) {
718                                         for (i = 6 - subseclen; i != 0; i--)
719                                                 ts_usec *= 10;
720                                 }
721                         }
722                 }
723         }
724
725
726         /*printf("Format(%s), time(%u), subsecs(%u)\n\n", ts_fmt, ts_sec, ts_usec);*/
727         
728         /* Clear Preamble */
729         packet_preamble_len = 0;
730 }
731
732 /*----------------------------------------------------------------------
733  * Start a new packet 
734  */
735 static void
736 start_new_packet (void)
737 {
738     if (debug>=1) 
739         fprintf(stderr, "Start new packet\n");
740
741     /* Write out the current packet, if required */
742     write_current_packet();
743     curr_offset = 0;
744     num_packets_read ++;
745
746     /* Ensure we parse the packet preamble as it may contain the time */
747     parse_preamble();
748 }
749
750 /*----------------------------------------------------------------------
751  * Process a directive
752  */
753 static void
754 process_directive (char *str)
755 {
756     fprintf(stderr, "\n--- Directive [%s] currently unsupported ---\n", str+10);
757
758 }
759
760 /*----------------------------------------------------------------------
761  * Parse a single token (called from the scanner)
762  */
763 void 
764 parse_token (token_t token, char *str)
765 {
766     unsigned long num;
767
768     /* 
769      * This is implemented as a simple state machine of five states. 
770      * State transitions are caused by tokens being received from the 
771      * scanner. The code should be self_documenting.
772      */
773
774     if (debug>=2) {
775         /* Sanitize - remove all '\r' */
776         char *c;
777         if (str!=NULL) { while ((c = strchr(str, '\r')) != NULL) *c=' '; }
778         
779         fprintf(stderr, "(%s, %s \"%s\") -> (", 
780                 state_str[state], token_str[token], str ? str : "");
781     }
782
783     switch(state) {
784
785     /* ----- Waiting for new packet -------------------------------------------*/
786     case INIT:
787         switch(token) {
788         case T_TEXT:
789             append_to_preamble(str);
790             break;
791         case T_DIRECTIVE:
792             process_directive(str);
793             break;
794         case T_OFFSET:
795             num = parse_num(str, TRUE);
796             if (num==0) {
797                 /* New packet starts here */
798                 start_new_packet();
799                 state = READ_OFFSET;
800             }
801             break;
802         default:
803             break;
804         }
805         break;
806
807     /* ----- Processing packet, start of new line -----------------------------*/
808     case START_OF_LINE:
809         switch(token) {
810         case T_TEXT:
811             append_to_preamble(str);
812             break;
813         case T_DIRECTIVE:
814             process_directive(str);
815             break;
816         case T_OFFSET:
817             num = parse_num(str, TRUE);
818             if (num==0) {
819                 /* New packet starts here */
820                 start_new_packet();
821                 state = READ_OFFSET;
822             } else if (num != curr_offset) {
823                 /*
824                  * The offset we read isn't the one we expected.
825                  * This may only mean that we mistakenly interpreted
826                  * some text as byte values (e.g., if the text dump
827                  * of packet data included a number with spaces around
828                  * it).  If the offset is less than what we expected,
829                  * assume that's the problem, and throw away the putative
830                  * extra byte values.
831                  */
832                 if (num < curr_offset) {
833                     unwrite_bytes(curr_offset - num);
834                     state = READ_OFFSET;
835                 } else {
836                     /* Bad offset; switch to INIT state */
837                     if (debug>=1)
838                         fprintf(stderr, "Inconsistent offset. Expecting %0lX, got %0lX. Ignoring rest of packet\n", 
839                                 curr_offset, num);
840                     write_current_packet();
841                     state = INIT;
842                 }
843             } else 
844                 state = READ_OFFSET;
845             break;
846         default:
847             break;
848         }
849         break;
850
851     /* ----- Processing packet, read offset -----------------------------------*/
852     case READ_OFFSET:
853         switch(token) {
854         case T_BYTE:
855             /* Record the byte */
856             state = READ_BYTE;
857             write_byte(str);
858             break;
859         case T_TEXT:
860         case T_DIRECTIVE:
861         case T_OFFSET:
862             state = READ_TEXT;
863             break;
864         case T_EOL:
865             state = START_OF_LINE;
866             break;
867         default:
868             break;
869         }
870         break;
871
872     /* ----- Processing packet, read byte -------------------------------------*/
873     case READ_BYTE:
874         switch(token) {
875         case T_BYTE:
876             /* Record the byte */
877             write_byte(str);
878             break;
879         case T_TEXT:
880         case T_DIRECTIVE:
881         case T_OFFSET:
882             state = READ_TEXT;
883             break;
884         case T_EOL:
885             state = START_OF_LINE;
886             break;
887         default:
888             break;
889         }
890         break;
891
892     /* ----- Processing packet, read text -------------------------------------*/
893     case READ_TEXT:
894         switch(token) {
895         case T_EOL:
896             state = START_OF_LINE;
897             break;
898         default:
899             break;
900         }
901         break;
902
903     default:
904         fprintf(stderr, "FATAL ERROR: Bad state (%d)", state);
905         exit(-1);
906     }
907
908     if (debug>=2) 
909         fprintf(stderr, ", %s)\n", state_str[state]);
910
911 }
912
913 /*----------------------------------------------------------------------
914  * Print helpstring and exit
915  */
916 static void
917 help (char *progname)
918 {
919     fprintf(stderr, 
920             "\n"
921             "Usage: %s [-d] [-q] [-o h|o] [-l typenum] [-e l3pid] [-i proto] \n"
922             "          [-u srcp,destp] [-s srcp,destp,tag] [-S srcp,destp,tag] [-t timefmt] <input-filename> <output-filename>\n"
923             "\n"
924             "where <input-filename> specifies input filename (use - for standard input)\n"
925             "      <output-filename> specifies output filename (use - for standard output)\n"
926             "\n"
927             "[options] are one or more of the following \n"
928             "\n"
929             " -w filename     : Write capfile to <filename>. Default is standard output\n"
930             " -h              : Display this help message \n"
931             " -d              : Generate detailed debug of parser states \n"
932             " -o hex|oct      : Parse offsets as (h)ex or (o)ctal. Default is hex\n"
933             " -l typenum      : Specify link-layer type number. Default is 1 (Ethernet). \n"
934             "                   See net/bpf.h for list of numbers.\n"
935             " -q              : Generate no output at all (automatically turns off -d)\n"
936             " -e l3pid        : Prepend dummy Ethernet II header with specified L3PID (in HEX)\n"
937             "                   Example: -e 0x800\n"
938             " -i proto        : Prepend dummy IP header with specified IP protocol (in DECIMAL). \n"
939             "                   Automatically prepends Ethernet header as well. Example: -i 46\n"
940             " -u srcp,destp   : Prepend dummy UDP header with specified dest and source ports (in DECIMAL).\n"
941             "                   Automatically prepends Ethernet and IP headers as well\n"
942             "                   Example: -u 30,40\n"
943             " -s srcp,dstp,tag: Prepend dummy SCTP header with specified dest/source ports and\n"
944             "                   verification tag (in DECIMAL).\n"
945             "                   Automatically prepends Ethernet and IP headers as well\n"
946             "                   Example: -s 30,40,34\n"
947             " -S srcp,dstp,tag: Same as -s srcp,dstp,tag but also prepends a DATA chunk header.\n"
948             "                   Example: -S 30,40,34\n"                               
949             " -t timefmt      : Treats the text before the packet as a date/time code; the\n"
950             "                   specified argument is a format string of the sort supported\n"
951             "                   by strptime.\n"
952             "                   Example: The time \"10:15:14.5476\" has the format code\n"
953             "                   \"%%H:%%M:%%S.\"\n"
954             "                   NOTE:    The subsecond component delimiter must be specified\n"
955             "                            (.) but no pattern is required; the remaining number\n"
956             "                            is assumed to be fractions of a second.\n"
957             "",
958             progname);
959
960     exit(-1);
961 }
962
963 /*----------------------------------------------------------------------
964  * Parse CLI options 
965  */
966 static void
967 parse_options (int argc, char *argv[])
968 {
969     int c;
970     char *p;
971
972     /* Scan CLI parameters */
973     while ((c = getopt(argc, argv, "dqr:w:e:i:l:o:u:s:S:t:")) != -1) {
974         switch(c) {
975         case '?': help(argv[0]); break;
976         case 'h': help(argv[0]); break;
977         case 'd': if (!quiet) debug++; break;
978         case 'q': quiet = TRUE; debug = FALSE; break;
979         case 'l': pcap_link_type = atoi(optarg); break;
980         case 'o': 
981             if (optarg[0]!='h' && optarg[0] != 'o') {
982                 fprintf(stderr, "Bad argument for '-e': %s\n", optarg);
983                 help(argv[0]);
984             }
985             offset_base = (optarg[0]=='o') ? 8 : 16;
986             break;
987         case 'e':
988             hdr_ethernet = TRUE;
989             if (sscanf(optarg, "%lx", &hdr_ethernet_proto) < 1) {
990                 fprintf(stderr, "Bad argument for '-e': %s\n", optarg);
991                 help(argv[0]);
992             }
993             break;
994             
995         case 'i':
996             hdr_ip = TRUE;
997             if (sscanf(optarg, "%ld", &hdr_ip_proto) < 1) {
998                 fprintf(stderr, "Bad argument for '-i': %s\n", optarg);
999                 help(argv[0]);
1000             }
1001             hdr_ethernet = TRUE;
1002             hdr_ethernet_proto = 0x800;
1003             break;
1004             
1005         case 'S':
1006             hdr_data_chunk = TRUE;
1007         case 's':
1008             hdr_sctp = TRUE;
1009             hdr_sctp_src = strtol(optarg, &p, 10);
1010             if (p == optarg || (*p != ',' && *p != '\0')) {
1011                 fprintf(stderr, "Bad src port for '-%c'\n", c);
1012                 help(argv[0]);
1013             }
1014             if (*p == '\0') {
1015                 fprintf(stderr, "No dest port specified for '-%c'\n", c);
1016                 help(argv[0]);
1017             }
1018             p++;
1019             optarg = p;
1020             hdr_sctp_dest = strtol(optarg, &p, 10);
1021             if (p == optarg || (*p != ',' && *p != '\0')) {
1022                 fprintf(stderr, "Bad dest port for '-s'\n");
1023                 help(argv[0]);
1024             }            if (*p == '\0') {
1025                 fprintf(stderr, "No dest port specified for '-%c'\n", c);
1026                 help(argv[0]);
1027             }
1028             p++;
1029             optarg = p;
1030             hdr_sctp_tag = strtol(optarg, &p, 10);
1031             if (p == optarg || *p != '\0') {
1032                 fprintf(stderr, "Bad tag for '-%c'\n", c);
1033                 help(argv[0]);
1034             }
1035
1036             hdr_ip = TRUE;
1037             hdr_ip_proto = 132;
1038             hdr_ethernet = TRUE;
1039             hdr_ethernet_proto = 0x800;
1040             break;
1041
1042         case 't':
1043             ts_fmt = optarg;
1044             break;
1045             
1046         case 'u':
1047             hdr_udp = TRUE;
1048             hdr_udp_src = strtol(optarg, &p, 10);
1049             if (p == optarg || (*p != ',' && *p != '\0')) {
1050                 fprintf(stderr, "Bad src port for '-u'\n");
1051                 help(argv[0]);
1052             }
1053             if (*p == '\0') {
1054                 fprintf(stderr, "No dest port specified for '-u'\n");
1055                 help(argv[0]);
1056             }
1057             p++;
1058             optarg = p;
1059             hdr_udp_dest = strtol(optarg, &p, 10);
1060             if (p == optarg || *p != '\0') {
1061                 fprintf(stderr, "Bad dest port for '-u'\n");
1062                 help(argv[0]);
1063             }
1064             hdr_ip = TRUE;
1065             hdr_ip_proto = 17;
1066             hdr_ethernet = TRUE;
1067             hdr_ethernet_proto = 0x800;
1068             break;
1069             
1070         default:
1071             help(argv[0]);
1072         }
1073     }
1074
1075     if (optind >= argc || argc-optind < 2) {
1076         fprintf(stderr, "Must specify input and output filename\n");
1077         help(argv[0]);
1078     }
1079
1080     if (strcmp(argv[optind], "-")) {
1081         input_filename = strdup(argv[optind]);
1082         input_file = fopen(input_filename, "rb");
1083         if (!input_file) {
1084             fprintf(stderr, "Cannot open file [%s] for reading: %s\n", 
1085                     input_filename, strerror(errno));
1086             exit(-1);
1087         }
1088     } else {
1089         input_filename = "Standard input";
1090         input_file = stdin;
1091     }
1092
1093     if (strcmp(argv[optind+1], "-")) {
1094         output_filename = strdup(argv[optind+1]);
1095         output_file = fopen(output_filename, "wb");
1096         if (!output_file) {
1097             fprintf(stderr, "Cannot open file [%s] for writing: %s\n", 
1098                     output_filename, strerror(errno));
1099             exit(-1);
1100         }
1101     } else {
1102         output_filename = "Standard output";
1103         output_file = stdout;
1104     }
1105
1106     /* Some validation */
1107     if (pcap_link_type != 1 && hdr_ethernet) {
1108         fprintf(stderr, "Dummy headers (-e, -i, -u, -s, -S) cannot be specified with link type override (-l)\n");
1109         exit(-1);
1110     }
1111
1112     /* Set up our variables */
1113     if (!input_file) {
1114         input_file = stdin;
1115         input_filename = "Standard input";
1116     }
1117     if (!output_file) {
1118         output_file = stdout;
1119         output_filename = "Standard output";
1120     }
1121     
1122     /* Display summary of our state */
1123     if (!quiet) {
1124         fprintf(stderr, "Input from: %s\n", input_filename);
1125         fprintf(stderr, "Output to: %s\n", output_filename);
1126
1127         if (hdr_ethernet) fprintf(stderr, "Generate dummy Ethernet header: Protocol: 0x%0lX\n", 
1128                                   hdr_ethernet_proto); 
1129         if (hdr_ip) fprintf(stderr, "Generate dummy IP header: Protocol: %ld\n", 
1130                             hdr_ip_proto); 
1131         if (hdr_udp) fprintf(stderr, "Generate dummy UDP header: Source port: %ld. Dest port: %ld\n", 
1132                              hdr_udp_src, hdr_udp_dest); 
1133         if (hdr_sctp) fprintf(stderr, "Generate dummy SCTP header: Source port: %ld. Dest port: %ld. Tag: %ld\n", 
1134                               hdr_sctp_src, hdr_sctp_dest, hdr_sctp_tag); 
1135         if (hdr_data_chunk) fprintf(stderr, "Generate dummy DATA chunk header: TSN: %ld. SID: %d. SSN: %d. PPID: %ld\n", 
1136                                     hdr_data_chunk_tsn, hdr_data_chunk_sid, hdr_data_chunk_ssn, hdr_data_chunk_ppid); 
1137     }
1138 }
1139
1140 int main(int argc, char *argv[])
1141 {
1142     parse_options(argc, argv);
1143
1144     assert(input_file != NULL);
1145     assert(output_file != NULL);
1146
1147     write_file_header();
1148
1149     yyin = input_file;
1150     yylex();
1151
1152     write_current_packet();
1153     if (debug)
1154         fprintf(stderr, "\n-------------------------\n");
1155     if (!quiet) {
1156     fprintf(stderr, "Read %ld potential packets, wrote %ld packets\n", 
1157             num_packets_read, num_packets_written);
1158     }
1159     return 0;
1160 }