7005fd802fea6c49fa63374bf860fbbef320193a
[samba.git] / ctdb / include / ctdb_private.h
1 /* 
2    ctdb database library
3
4    Copyright (C) Andrew Tridgell  2006
5
6    This program is free software; you can redistribute it and/or modify
7    it under the terms of the GNU General Public License as published by
8    the Free Software Foundation; either version 3 of the License, or
9    (at your option) any later version.
10    
11    This program is distributed in the hope that it will be useful,
12    but WITHOUT ANY WARRANTY; without even the implied warranty of
13    MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
14    GNU General Public License for more details.
15    
16    You should have received a copy of the GNU General Public License
17    along with this program; if not, see <http://www.gnu.org/licenses/>.
18 */
19
20 #ifndef _CTDB_PRIVATE_H
21 #define _CTDB_PRIVATE_H
22
23 #include "ctdb_client.h"
24 #include <sys/socket.h>
25
26 /*
27  * Structures to support SRVID requests and replies
28  */
29 struct srvid_request {
30         uint32_t pnn;
31         uint64_t srvid;
32 };
33
34 struct srvid_request_data {
35         uint32_t pnn;
36         uint64_t srvid;
37         uint32_t data;
38 };
39
40 /*
41   a tcp connection description
42   also used by tcp_add and tcp_remove controls
43  */
44 struct ctdb_tcp_connection {
45         ctdb_sock_addr src_addr;
46         ctdb_sock_addr dst_addr;
47 };
48
49 /* the wire representation for a tcp tickle array */
50 struct ctdb_tcp_wire_array {
51         uint32_t num;
52         struct ctdb_tcp_connection connections[1];
53 };      
54
55 /* the list of tcp tickles used by get/set tcp tickle list */
56 struct ctdb_control_tcp_tickle_list {
57         ctdb_sock_addr addr;
58         struct ctdb_tcp_wire_array tickles;
59 };
60
61 /*
62   array of tcp connections
63  */
64 struct ctdb_tcp_array {
65         uint32_t num;
66         struct ctdb_tcp_connection *connections;
67 };      
68
69
70 /* all tunable variables go in here */
71 struct ctdb_tunable {
72         uint32_t max_redirect_count;
73         uint32_t seqnum_interval; /* unit is ms */
74         uint32_t control_timeout;
75         uint32_t traverse_timeout;
76         uint32_t keepalive_interval;
77         uint32_t keepalive_limit;
78         uint32_t recover_timeout;
79         uint32_t recover_interval;
80         uint32_t election_timeout;
81         uint32_t takeover_timeout;
82         uint32_t monitor_interval;
83         uint32_t tickle_update_interval;
84         uint32_t script_timeout;
85         uint32_t script_timeout_count; /* allow dodgy scripts to hang this many times in a row before we mark the node unhealthy */
86         uint32_t script_unhealthy_on_timeout; /* obsolete */
87         uint32_t recovery_grace_period;
88         uint32_t recovery_ban_period;
89         uint32_t database_hash_size;
90         uint32_t database_max_dead;
91         uint32_t rerecovery_timeout;
92         uint32_t enable_bans;
93         uint32_t deterministic_public_ips;
94         uint32_t reclock_ping_period;
95         uint32_t no_ip_failback;
96         uint32_t disable_ip_failover;
97         uint32_t verbose_memory_names;
98         uint32_t recd_ping_timeout;
99         uint32_t recd_ping_failcount;
100         uint32_t log_latency_ms;
101         uint32_t reclock_latency_ms;
102         uint32_t recovery_drop_all_ips;
103         uint32_t verify_recovery_lock;
104         uint32_t vacuum_interval;
105         uint32_t vacuum_max_run_time;
106         uint32_t repack_limit;
107         uint32_t vacuum_limit;
108         uint32_t max_queue_depth_drop_msg;
109         uint32_t use_status_events_for_monitoring;
110         uint32_t allow_unhealthy_db_read;
111         uint32_t stat_history_interval;
112         uint32_t deferred_attach_timeout;
113         uint32_t vacuum_fast_path_count;
114         uint32_t lcp2_public_ip_assignment;
115         uint32_t allow_client_db_attach;
116         uint32_t recover_pdb_by_seqnum;
117         uint32_t deferred_rebalance_on_node_add;
118         uint32_t fetch_collapse;
119         uint32_t hopcount_make_sticky;
120         uint32_t sticky_duration;
121         uint32_t sticky_pindown;
122         uint32_t no_ip_takeover;
123         uint32_t db_record_count_warn;
124         uint32_t db_record_size_warn;
125         uint32_t db_size_warn;
126         uint32_t pulldb_preallocation_size;
127         uint32_t no_ip_host_on_all_disabled;
128         uint32_t samba3_hack;
129         uint32_t mutex_enabled;
130         uint32_t lock_processes_per_db;
131 };
132
133 /*
134   an installed ctdb remote call
135 */
136 struct ctdb_registered_call {
137         struct ctdb_registered_call *next, *prev;
138         uint32_t id;
139         ctdb_fn_t fn;
140 };
141
142 /*
143   this address structure might need to be generalised later for some
144   transports
145 */
146 struct ctdb_address {
147         const char *address;
148         int port;
149 };
150
151 /*
152   check that a pnn is valid
153  */
154 #define ctdb_validate_pnn(ctdb, pnn) (((uint32_t)(pnn)) < (ctdb)->num_nodes)
155
156
157 /* called from the queue code when a packet comes in. Called with data==NULL
158    on error */
159 typedef void (*ctdb_queue_cb_fn_t)(uint8_t *data, size_t length,
160                                    void *private_data);
161
162 /* used for callbacks in ctdb_control requests */
163 typedef void (*ctdb_control_callback_fn_t)(struct ctdb_context *,
164                                            int32_t status, TDB_DATA data, 
165                                            const char *errormsg,
166                                            void *private_data);
167 /*
168   structure describing a connected client in the daemon
169  */
170 struct ctdb_client {
171         struct ctdb_context *ctdb;
172         int fd;
173         struct ctdb_queue *queue;
174         uint32_t client_id;
175         pid_t pid;
176         struct ctdb_tcp_list *tcp_list;
177         uint32_t db_id;
178         uint32_t num_persistent_updates;
179         struct ctdb_client_notify_list *notify;
180 };
181
182 struct ctdb_iface;
183
184 /* state associated with a public ip address */
185 struct ctdb_vnn {
186         struct ctdb_vnn *prev, *next;
187
188         struct ctdb_iface *iface;
189         const char **ifaces;
190         ctdb_sock_addr public_address;
191         uint8_t public_netmask_bits;
192
193         /* the node number that is serving this public address, if any. 
194            If no node serves this ip it is set to -1 */
195         int32_t pnn;
196
197         /* List of clients to tickle for this public address */
198         struct ctdb_tcp_array *tcp_array;
199
200         /* whether we need to update the other nodes with changes to our list
201            of connected clients */
202         bool tcp_update_needed;
203
204         /* a context to hang sending gratious arp events off */
205         TALLOC_CTX *takeover_ctx;
206
207         struct ctdb_kill_tcp *killtcp;
208
209         /* Set to true any time an update to this VNN is in flight.
210            This helps to avoid races. */
211         bool update_in_flight;
212
213         /* If CTDB_CONTROL_DEL_PUBLIC_IP is received for this IP
214          * address then this flag is set.  It will be deleted in the
215          * release IP callback. */
216         bool delete_pending;
217 };
218
219 /*
220   state associated with one node
221 */
222 struct ctdb_node {
223         struct ctdb_context *ctdb;
224         struct ctdb_address address;
225         const char *name; /* for debug messages */
226         void *private_data; /* private to transport */
227         uint32_t pnn;
228         uint32_t flags;
229
230         /* used by the dead node monitoring */
231         uint32_t dead_count;
232         uint32_t rx_cnt;
233         uint32_t tx_cnt;
234
235         /* used to track node capabilities, is only valid/tracked inside the
236            recovery daemon.
237         */
238         uint32_t capabilities;
239
240         /* a list of controls pending to this node, so we can time them out quickly
241            if the node becomes disconnected */
242         struct daemon_control_state *pending_controls;
243
244         /* used by the recovery daemon when distributing ip addresses 
245            across the nodes.  it needs to know which public ip's can be handled
246            by each node.
247         */
248         struct ctdb_all_public_ips *known_public_ips;
249         struct ctdb_all_public_ips *available_public_ips;
250         /* used by the recovery dameon to track when a node should be banned */
251         struct ctdb_banning_state *ban_state; 
252 };
253
254 /*
255   transport specific methods
256 */
257 struct ctdb_methods {
258         int (*initialise)(struct ctdb_context *); /* initialise transport structures */ 
259         int (*start)(struct ctdb_context *); /* start the transport */
260         int (*add_node)(struct ctdb_node *); /* setup a new node */     
261         int (*connect_node)(struct ctdb_node *); /* connect to node */
262         int (*queue_pkt)(struct ctdb_node *, uint8_t *data, uint32_t length);
263         void *(*allocate_pkt)(TALLOC_CTX *mem_ctx, size_t );
264         void (*shutdown)(struct ctdb_context *); /* shutdown transport */
265         void (*restart)(struct ctdb_node *); /* stop and restart the connection */
266 };
267
268 /*
269   transport calls up to the ctdb layer
270 */
271 struct ctdb_upcalls {
272         /* recv_pkt is called when a packet comes in */
273         void (*recv_pkt)(struct ctdb_context *, uint8_t *data, uint32_t length);
274
275         /* node_dead is called when an attempt to send to a node fails */
276         void (*node_dead)(struct ctdb_node *);
277
278         /* node_connected is called when a connection to a node is established */
279         void (*node_connected)(struct ctdb_node *);
280 };
281
282 /* list of message handlers - needs to be changed to a more efficient data
283    structure so we can find a message handler given a srvid quickly */
284 struct ctdb_message_list_header {
285         struct ctdb_message_list_header *next, *prev;
286         struct ctdb_context *ctdb;
287         uint64_t srvid;
288         struct ctdb_message_list *m;
289 };
290 struct ctdb_message_list {
291         struct ctdb_message_list *next, *prev;
292         struct ctdb_message_list_header *h;
293         ctdb_msg_fn_t message_handler;
294         void *message_private;
295 };
296
297 /* additional data required for the daemon mode */
298 struct ctdb_daemon_data {
299         int sd;
300         char *name;
301         struct ctdb_queue *queue;
302 };
303
304
305 #define CTDB_UPDATE_STAT(ctdb, counter, value) \
306         {                                                                               \
307                 if (value > ctdb->statistics.counter) {                                 \
308                         ctdb->statistics.counter = c->hopcount;                         \
309                 }                                                                       \
310                 if (value > ctdb->statistics_current.counter) {                         \
311                         ctdb->statistics_current.counter = c->hopcount;                 \
312                 }                                                                       \
313         }
314
315 #define CTDB_INCREMENT_STAT(ctdb, counter) \
316         {                                                                               \
317                 ctdb->statistics.counter++;                                             \
318                 ctdb->statistics_current.counter++;                                     \
319         }
320
321 #define CTDB_DECREMENT_STAT(ctdb, counter) \
322         {                                                                               \
323                 if (ctdb->statistics.counter > 0)                                       \
324                         ctdb->statistics.counter--;                                     \
325                 if (ctdb->statistics_current.counter > 0)                               \
326                         ctdb->statistics_current.counter--;                             \
327         }
328
329 #define CTDB_INCREMENT_DB_STAT(ctdb_db, counter) \
330         {                                                                               \
331                 ctdb_db->statistics.counter++;                                          \
332         }
333
334 #define CTDB_DECREMENT_DB_STAT(ctdb_db, counter) \
335         {                                                                               \
336                 if (ctdb_db->statistics.counter > 0)                                    \
337                         ctdb_db->statistics.counter--;                                  \
338         }
339
340 #define CTDB_UPDATE_RECLOCK_LATENCY(ctdb, name, counter, value) \
341         {                                                                               \
342                 if (value > ctdb->statistics.counter.max)                               \
343                         ctdb->statistics.counter.max = value;                           \
344                 if (value > ctdb->statistics_current.counter.max)                       \
345                         ctdb->statistics_current.counter.max = value;                   \
346                                                                                         \
347                 if (ctdb->statistics.counter.num == 0 ||                                \
348                     value < ctdb->statistics.counter.min)                               \
349                         ctdb->statistics.counter.min = value;                           \
350                 if (ctdb->statistics_current.counter.num == 0 ||                        \
351                     value < ctdb->statistics_current.counter.min)                       \
352                         ctdb->statistics_current.counter.min = value;                   \
353                                                                                         \
354                 ctdb->statistics.counter.total += value;                                \
355                 ctdb->statistics_current.counter.total += value;                        \
356                                                                                         \
357                 ctdb->statistics.counter.num++;                                         \
358                 ctdb->statistics_current.counter.num++;                                 \
359                                                                                         \
360                 if (ctdb->tunable.reclock_latency_ms != 0) {                            \
361                         if (value*1000 > ctdb->tunable.reclock_latency_ms) {            \
362                                 DEBUG(DEBUG_ERR,                                        \
363                                       ("High RECLOCK latency %fs for operation %s\n",   \
364                                        value, name));                                   \
365                         }                                                               \
366                 }                                                                       \
367         }
368
369 #define CTDB_UPDATE_DB_LATENCY(ctdb_db, operation, counter, value)                      \
370         {                                                                               \
371                 if (value > ctdb_db->statistics.counter.max)                            \
372                         ctdb_db->statistics.counter.max = value;                        \
373                 if (ctdb_db->statistics.counter.num == 0 ||                             \
374                     value < ctdb_db->statistics.counter.min)                            \
375                         ctdb_db->statistics.counter.min = value;                        \
376                                                                                         \
377                 ctdb_db->statistics.counter.total += value;                             \
378                 ctdb_db->statistics.counter.num++;                                      \
379                                                                                         \
380                 if (ctdb_db->ctdb->tunable.log_latency_ms != 0) {                       \
381                         if (value*1000 > ctdb_db->ctdb->tunable.log_latency_ms) {       \
382                                 DEBUG(DEBUG_ERR,                                        \
383                                       ("High latency %.6fs for operation %s on database %s\n",\
384                                        value, operation, ctdb_db->db_name));            \
385                         }                                                               \
386                 }                                                                       \
387         }
388
389 #define CTDB_UPDATE_LATENCY(ctdb, db, operation, counter, t) \
390         {                                                                               \
391                 double l = timeval_elapsed(&t);                                         \
392                                                                                         \
393                 if (l > ctdb->statistics.counter.max)                                   \
394                         ctdb->statistics.counter.max = l;                               \
395                 if (l > ctdb->statistics_current.counter.max)                           \
396                         ctdb->statistics_current.counter.max = l;                       \
397                                                                                         \
398                 if (ctdb->statistics.counter.num == 0 ||                                \
399                     l < ctdb->statistics.counter.min)                                   \
400                         ctdb->statistics.counter.min = l;                               \
401                 if (ctdb->statistics_current.counter.num == 0 ||                        \
402                     l < ctdb->statistics_current.counter.min)                           \
403                         ctdb->statistics_current.counter.min = l;                       \
404                                                                                         \
405                 ctdb->statistics.counter.total += l;                                    \
406                 ctdb->statistics_current.counter.total += l;                            \
407                                                                                         \
408                 ctdb->statistics.counter.num++;                                         \
409                 ctdb->statistics_current.counter.num++;                                 \
410                                                                                         \
411                 if (ctdb->tunable.log_latency_ms != 0) {                                \
412                         if (l*1000 > ctdb->tunable.log_latency_ms) {                    \
413                                 DEBUG(DEBUG_WARNING,                                    \
414                                       ("High latency %.6fs for operation %s on database %s\n",\
415                                        l, operation, db->db_name));                     \
416                         }                                                               \
417                 }                                                                       \
418         }
419
420
421
422 /* a structure that contains the elements required for the write record
423    control
424 */
425 struct ctdb_write_record {
426         uint32_t dbid;
427         uint32_t keylen;
428         uint32_t datalen;
429         unsigned char blob[1];
430 };
431
432 enum ctdb_freeze_mode {CTDB_FREEZE_NONE, CTDB_FREEZE_PENDING, CTDB_FREEZE_FROZEN};
433
434 enum ctdb_runstate {
435         CTDB_RUNSTATE_UNKNOWN,
436         CTDB_RUNSTATE_INIT,
437         CTDB_RUNSTATE_SETUP,
438         CTDB_RUNSTATE_FIRST_RECOVERY,
439         CTDB_RUNSTATE_STARTUP,
440         CTDB_RUNSTATE_RUNNING,
441         CTDB_RUNSTATE_SHUTDOWN,
442 };
443
444 const char *runstate_to_string(enum ctdb_runstate runstate);
445 enum ctdb_runstate runstate_from_string(const char *label);
446 void ctdb_set_runstate(struct ctdb_context *ctdb, enum ctdb_runstate runstate);
447
448 void ctdb_shutdown_sequence(struct ctdb_context *ctdb, int exit_code);
449
450 #define CTDB_MONITORING_ACTIVE          0
451 #define CTDB_MONITORING_DISABLED        1
452
453 #define NUM_DB_PRIORITIES 3
454 /* main state of the ctdb daemon */
455 struct ctdb_context {
456         struct tevent_context *ev;
457         struct timeval ctdbd_start_time;
458         struct timeval last_recovery_started;
459         struct timeval last_recovery_finished;
460         uint32_t recovery_mode;
461         TALLOC_CTX *tickle_update_context;
462         TALLOC_CTX *keepalive_ctx;
463         TALLOC_CTX *check_public_ifaces_ctx;
464         struct ctdb_tunable tunable;
465         enum ctdb_freeze_mode freeze_mode[NUM_DB_PRIORITIES+1];
466         struct ctdb_freeze_handle *freeze_handles[NUM_DB_PRIORITIES+1];
467         bool freeze_transaction_started;
468         uint32_t freeze_transaction_id;
469         struct ctdb_address address;
470         const char *name;
471         const char *db_directory;
472         const char *db_directory_persistent;
473         const char *db_directory_state;
474         struct tdb_wrap *db_persistent_health;
475         uint32_t db_persistent_startup_generation;
476         uint64_t db_persistent_check_errors;
477         uint64_t max_persistent_check_errors;
478         const char *transport;
479         char *recovery_lock_file;
480         int recovery_lock_fd;
481         uint32_t pnn; /* our own pnn */
482         uint32_t num_nodes;
483         uint32_t num_connected;
484         unsigned flags;
485         uint32_t capabilities;
486         struct idr_context *idr;
487         int lastid;
488         struct ctdb_node **nodes; /* array of nodes in the cluster - indexed by vnn */
489         struct ctdb_vnn *vnn; /* list of public ip addresses and interfaces */
490         struct ctdb_vnn *single_ip_vnn; /* a structure for the single ip */
491         struct ctdb_iface *ifaces; /* list of local interfaces */
492         char *err_msg;
493         const struct ctdb_methods *methods; /* transport methods */
494         const struct ctdb_upcalls *upcalls; /* transport upcalls */
495         void *private_data; /* private to transport */
496         struct ctdb_db_context *db_list;
497         struct ctdb_message_list_header *message_list_header;
498         struct tdb_context *message_list_indexdb;
499         struct ctdb_daemon_data daemon;
500         struct ctdb_statistics statistics;
501         struct ctdb_statistics statistics_current;
502 #define MAX_STAT_HISTORY 100
503         struct ctdb_statistics statistics_history[MAX_STAT_HISTORY];
504         struct ctdb_vnn_map *vnn_map;
505         uint32_t num_clients;
506         uint32_t recovery_master;
507         struct ctdb_call_state *pending_calls;
508         struct ctdb_client_ip *client_ip_list;
509         bool do_checkpublicip;
510         struct trbt_tree *server_ids; 
511         bool do_setsched;
512         const char *event_script_dir;
513         const char *notification_script;
514         const char *default_public_interface;
515         pid_t ctdbd_pid;
516         pid_t recoverd_pid;
517         enum ctdb_runstate runstate;
518         struct ctdb_monitor_state *monitor;
519         int start_as_disabled;
520         int start_as_stopped;
521         bool valgrinding;
522         uint32_t event_script_timeouts; /* counting how many consecutive times an eventscript has timedout */
523         uint32_t *recd_ping_count;
524         TALLOC_CTX *recd_ctx; /* a context used to track recoverd monitoring events */
525         TALLOC_CTX *release_ips_ctx; /* a context used to automatically drop all IPs if we fail to recover the node */
526
527         TALLOC_CTX *event_script_ctx;
528         int active_events;
529
530         struct ctdb_event_script_state *current_monitor;
531         struct ctdb_scripts_wire *last_status[CTDB_EVENT_MAX];
532
533         TALLOC_CTX *banning_ctx;
534
535         struct ctdb_vacuum_child_context *vacuumers;
536
537         /* mapping from pid to ctdb_client * */
538         struct ctdb_client_pid_list *client_pids;
539
540         /* used in the recovery daemon to remember the ip allocation */
541         struct trbt_tree *ip_tree;
542
543         /* Used to defer db attach requests while in recovery mode */
544         struct ctdb_deferred_attach_context *deferred_attach;
545
546         /* if we are a child process, do we have a domain socket to send controls on */
547         bool can_send_controls;
548
549         /* list of event script callback functions that are active */
550         struct event_script_callback *script_callbacks;
551
552         struct ctdb_reloadips_handle *reload_ips;
553
554         const char *nodes_file;
555         const char *public_addresses_file;
556         struct trbt_tree *child_processes; 
557
558         /* Used for locking record/db/alldb */
559         struct lock_context *lock_current;
560         struct lock_context *lock_pending;
561 };
562
563 struct ctdb_db_context {
564         struct ctdb_db_context *next, *prev;
565         struct ctdb_context *ctdb;
566         uint32_t db_id;
567         uint32_t priority;
568         bool persistent;
569         bool readonly; /* Do we support read-only delegations ? */
570         bool sticky; /* Do we support sticky records ? */
571         const char *db_name;
572         const char *db_path;
573         struct tdb_wrap *ltdb;
574         struct tdb_context *rottdb; /* ReadOnly tracking TDB */
575         struct ctdb_registered_call *calls; /* list of registered calls */
576         uint32_t seqnum;
577         struct timed_event *seqnum_update;
578         struct ctdb_traverse_local_handle *traverse;
579         struct ctdb_vacuum_handle *vacuum_handle;
580         char *unhealthy_reason;
581         int pending_requests;
582         struct revokechild_handle *revokechild_active;
583         struct ctdb_persistent_state *persistent_state;
584         struct trbt_tree *delete_queue;
585         struct trbt_tree *sticky_records; 
586         int (*ctdb_ltdb_store_fn)(struct ctdb_db_context *ctdb_db,
587                                   TDB_DATA key,
588                                   struct ctdb_ltdb_header *header,
589                                   TDB_DATA data);
590
591         /* used to track which records we are currently fetching
592            so we can avoid sending duplicate fetch requests
593         */
594         struct trbt_tree *deferred_fetch;
595         struct trbt_tree *defer_dmaster;
596
597         struct ctdb_db_statistics statistics;
598
599         struct lock_context *lock_current;
600         struct lock_context *lock_pending;
601         int lock_num_current;
602 };
603
604
605 #define CTDB_NO_MEMORY(ctdb, p) do { if (!(p)) { \
606           DEBUG(0,("Out of memory for %s at %s\n", #p, __location__)); \
607           ctdb_set_error(ctdb, "Out of memory at %s:%d", __FILE__, __LINE__); \
608           return -1; }} while (0)
609
610 #define CTDB_NO_MEMORY_VOID(ctdb, p) do { if (!(p)) { \
611           DEBUG(0,("Out of memory for %s at %s\n", #p, __location__)); \
612           ctdb_set_error(ctdb, "Out of memory at %s:%d", __FILE__, __LINE__); \
613           return; }} while (0)
614
615 #define CTDB_NO_MEMORY_NULL(ctdb, p) do { if (!(p)) { \
616           DEBUG(0,("Out of memory for %s at %s\n", #p, __location__)); \
617           ctdb_set_error(ctdb, "Out of memory at %s:%d", __FILE__, __LINE__); \
618           return NULL; }} while (0)
619
620 #define CTDB_NO_MEMORY_FATAL(ctdb, p) do { if (!(p)) { \
621           DEBUG(0,("Out of memory for %s at %s\n", #p, __location__)); \
622           ctdb_fatal(ctdb, "Out of memory in " __location__ ); \
623           }} while (0)
624
625 /*
626   structure passed in set_call control
627  */
628 struct ctdb_control_set_call {
629         uint32_t db_id;
630         ctdb_fn_t fn;
631         uint32_t id;
632 };
633
634 /*
635   struct for kill_tcp control
636  */
637 struct ctdb_control_killtcp {
638         ctdb_sock_addr src_addr;
639         ctdb_sock_addr dst_addr;
640 };
641
642 /*
643   struct holding a ctdb_sock_addr and an interface name,
644   used to add/remove public addresses
645  */
646 struct ctdb_control_ip_iface {
647         ctdb_sock_addr addr;
648         uint32_t mask;
649         uint32_t len;
650         char iface[1];
651 };
652
653 /*
654   struct holding a ctdb_sock_addr and an interface name,
655   used for send_gratious_arp
656  */
657 struct ctdb_control_gratious_arp {
658         ctdb_sock_addr addr;
659         uint32_t mask;
660         uint32_t len;
661         char iface[1];
662 };
663
664 /*
665   persistent store control - update this record on all other nodes
666  */
667 struct ctdb_control_persistent_store {
668         uint32_t db_id;
669         uint32_t len;
670         uint8_t  data[1];
671 };
672
673 /*
674   structure used for CTDB_SRVID_NODE_FLAGS_CHANGED
675  */
676 struct ctdb_node_flag_change {
677         uint32_t pnn;
678         uint32_t new_flags;
679         uint32_t old_flags;
680 };
681
682 /*
683   struct for admin setting a ban
684  */
685 struct ctdb_ban_info {
686         uint32_t pnn;
687         uint32_t ban_time;
688 };
689
690 enum call_state {CTDB_CALL_WAIT, CTDB_CALL_DONE, CTDB_CALL_ERROR};
691
692 #define CTDB_LMASTER_ANY        0xffffffff
693
694 /*
695   state of a in-progress ctdb call
696 */
697 struct ctdb_call_state {
698         struct ctdb_call_state *next, *prev;
699         enum call_state state;
700         uint32_t reqid;
701         struct ctdb_req_call *c;
702         struct ctdb_db_context *ctdb_db;
703         const char *errmsg;
704         struct ctdb_call *call;
705         uint32_t generation;
706         struct {
707                 void (*fn)(struct ctdb_call_state *);
708                 void *private_data;
709         } async;
710 };
711
712
713 /* used for fetch_lock */
714 struct ctdb_fetch_handle {
715         struct ctdb_db_context *ctdb_db;
716         TDB_DATA key;
717         TDB_DATA *data;
718         struct ctdb_ltdb_header header;
719 };
720
721 /* internal prototypes */
722 void ctdb_set_error(struct ctdb_context *ctdb, const char *fmt, ...) PRINTF_ATTRIBUTE(2,3);
723 void ctdb_fatal(struct ctdb_context *ctdb, const char *msg);
724 void ctdb_die(struct ctdb_context *ctdb, const char *msg);
725 void ctdb_external_trace(void);
726 bool ctdb_same_address(struct ctdb_address *a1, struct ctdb_address *a2);
727 int ctdb_parse_address(struct ctdb_context *ctdb,
728                        TALLOC_CTX *mem_ctx, const char *str,
729                        struct ctdb_address *address);
730 bool ctdb_same_ip(const ctdb_sock_addr *ip1, const ctdb_sock_addr *ip2);
731 bool ctdb_same_sockaddr(const ctdb_sock_addr *ip1, const ctdb_sock_addr *ip2);
732 uint32_t ctdb_hash(const TDB_DATA *key);
733 uint32_t *ctdb_key_to_idkey(TALLOC_CTX *mem_ctx, TDB_DATA key);
734
735 void ctdb_request_call(struct ctdb_context *ctdb, struct ctdb_req_header *hdr);
736 void ctdb_request_dmaster(struct ctdb_context *ctdb, struct ctdb_req_header *hdr);
737 void ctdb_request_message(struct ctdb_context *ctdb, struct ctdb_req_header *hdr);
738 void ctdb_reply_dmaster(struct ctdb_context *ctdb, struct ctdb_req_header *hdr);
739 void ctdb_reply_call(struct ctdb_context *ctdb, struct ctdb_req_header *hdr);
740 void ctdb_reply_error(struct ctdb_context *ctdb, struct ctdb_req_header *hdr);
741
742 uint32_t ctdb_lmaster(struct ctdb_context *ctdb, const TDB_DATA *key);
743 int ctdb_ltdb_fetch(struct ctdb_db_context *ctdb_db, 
744                     TDB_DATA key, struct ctdb_ltdb_header *header, 
745                     TALLOC_CTX *mem_ctx, TDB_DATA *data);
746 int ctdb_ltdb_store(struct ctdb_db_context *ctdb_db, TDB_DATA key, 
747                     struct ctdb_ltdb_header *header, TDB_DATA data);
748 int ctdb_ltdb_delete(struct ctdb_db_context *ctdb_db, TDB_DATA key);
749 int ctdb_ltdb_fetch_with_header(struct ctdb_db_context *ctdb_db, 
750                     TDB_DATA key, struct ctdb_ltdb_header *header, 
751                     TALLOC_CTX *mem_ctx, TDB_DATA *data);
752 int32_t ctdb_control_start_persistent_update(struct ctdb_context *ctdb, 
753                         struct ctdb_req_control *c,
754                         TDB_DATA recdata);
755 int32_t ctdb_control_cancel_persistent_update(struct ctdb_context *ctdb, 
756                         struct ctdb_req_control *c,
757                         TDB_DATA recdata);
758 void ctdb_queue_packet(struct ctdb_context *ctdb, struct ctdb_req_header *hdr);
759 void ctdb_queue_packet_opcode(struct ctdb_context *ctdb, struct ctdb_req_header *hdr, unsigned opcode);
760 int ctdb_ltdb_lock_requeue(struct ctdb_db_context *ctdb_db, 
761                            TDB_DATA key, struct ctdb_req_header *hdr,
762                            void (*recv_pkt)(void *, struct ctdb_req_header *),
763                            void *recv_context, bool ignore_generation);
764 int ctdb_ltdb_lock_fetch_requeue(struct ctdb_db_context *ctdb_db, 
765                                  TDB_DATA key, struct ctdb_ltdb_header *header, 
766                                  struct ctdb_req_header *hdr, TDB_DATA *data,
767                                  void (*recv_pkt)(void *, struct ctdb_req_header *),
768                                  void *recv_context, bool ignore_generation);
769 void ctdb_input_pkt(struct ctdb_context *ctdb, struct ctdb_req_header *);
770
771 struct ctdb_call_state *ctdb_call_local_send(struct ctdb_db_context *ctdb_db, 
772                                              struct ctdb_call *call,
773                                              struct ctdb_ltdb_header *header,
774                                              TDB_DATA *data);
775
776
777 int ctdb_start_daemon(struct ctdb_context *ctdb, bool do_fork);
778
779 struct ctdb_call_state *ctdbd_call_send(struct ctdb_db_context *ctdb_db, struct ctdb_call *call);
780 int ctdbd_call_recv(struct ctdb_call_state *state, struct ctdb_call *call);
781
782 /*
783   queue a packet for sending
784 */
785 int ctdb_queue_send(struct ctdb_queue *queue, uint8_t *data, uint32_t length);
786
787 /*
788   setup the fd used by the queue
789  */
790 int ctdb_queue_set_fd(struct ctdb_queue *queue, int fd);
791
792 /*
793   setup a packet queue on a socket
794  */
795 struct ctdb_queue *ctdb_queue_setup(struct ctdb_context *ctdb,
796                                     TALLOC_CTX *mem_ctx, int fd, int alignment,
797                                     
798                                     ctdb_queue_cb_fn_t callback,
799                                     void *private_data, const char *fmt, ...)
800         PRINTF_ATTRIBUTE(7,8);
801
802 /*
803   allocate a packet for use in client<->daemon communication
804  */
805 struct ctdb_req_header *_ctdbd_allocate_pkt(struct ctdb_context *ctdb,
806                                             TALLOC_CTX *mem_ctx, 
807                                             enum ctdb_operation operation, 
808                                             size_t length, size_t slength,
809                                             const char *type);
810 #define ctdbd_allocate_pkt(ctdb, mem_ctx, operation, length, type) \
811         (type *)_ctdbd_allocate_pkt(ctdb, mem_ctx, operation, length, sizeof(type), #type)
812
813 struct ctdb_req_header *_ctdb_transport_allocate(struct ctdb_context *ctdb,
814                                                  TALLOC_CTX *mem_ctx, 
815                                                  enum ctdb_operation operation, 
816                                                  size_t length, size_t slength,
817                                                  const char *type);
818 #define ctdb_transport_allocate(ctdb, mem_ctx, operation, length, type) \
819         (type *)_ctdb_transport_allocate(ctdb, mem_ctx, operation, length, sizeof(type), #type)
820
821 int ctdb_queue_length(struct ctdb_queue *queue);
822
823 /*
824   lock a record in the ltdb, given a key
825  */
826 int ctdb_ltdb_lock(struct ctdb_db_context *ctdb_db, TDB_DATA key);
827
828 /*
829   unlock a record in the ltdb, given a key
830  */
831 int ctdb_ltdb_unlock(struct ctdb_db_context *ctdb_db, TDB_DATA key);
832
833
834 /*
835   make a ctdb call to the local daemon - async send. Called from client context.
836
837   This constructs a ctdb_call request and queues it for processing. 
838   This call never blocks.
839 */
840 struct ctdb_call_state *ctdb_client_call_send(struct ctdb_db_context *ctdb_db, 
841                                               struct ctdb_call *call);
842
843 /*
844   make a recv call to the local ctdb daemon - called from client context
845
846   This is called when the program wants to wait for a ctdb_call to complete and get the 
847   results. This call will block unless the call has already completed.
848 */
849 int ctdb_client_call_recv(struct ctdb_call_state *state, struct ctdb_call *call);
850
851 int ctdb_client_send_message(struct ctdb_context *ctdb, uint32_t vnn,
852                              uint64_t srvid, TDB_DATA data);
853
854 /*
855   send a ctdb message
856 */
857 int ctdb_daemon_send_message(struct ctdb_context *ctdb, uint32_t pnn,
858                              uint64_t srvid, TDB_DATA data);
859
860
861 struct ctdb_call_state *ctdb_daemon_call_send(struct ctdb_db_context *ctdb_db, 
862                                               struct ctdb_call *call);
863
864 int ctdb_daemon_call_recv(struct ctdb_call_state *state, struct ctdb_call *call);
865
866 struct ctdb_call_state *ctdb_daemon_call_send_remote(struct ctdb_db_context *ctdb_db, 
867                                                      struct ctdb_call *call, 
868                                                      struct ctdb_ltdb_header *header);
869
870 int ctdb_call_local(struct ctdb_db_context *ctdb_db, struct ctdb_call *call,
871                     struct ctdb_ltdb_header *header, TALLOC_CTX *mem_ctx,
872                     TDB_DATA *data, bool updatetdb);
873
874 #define ctdb_reqid_find(ctdb, reqid, type)      (type *)_ctdb_reqid_find(ctdb, reqid, #type, __location__)
875
876 void ctdb_recv_raw_pkt(void *p, uint8_t *data, uint32_t length);
877
878 int ctdb_socket_connect(struct ctdb_context *ctdb);
879 void ctdb_client_read_cb(uint8_t *data, size_t cnt, void *args);
880
881 #define CTDB_BAD_REQID ((uint32_t)-1)
882 uint32_t ctdb_reqid_new(struct ctdb_context *ctdb, void *state);
883 void *_ctdb_reqid_find(struct ctdb_context *ctdb, uint32_t reqid, const char *type, const char *location);
884 void ctdb_reqid_remove(struct ctdb_context *ctdb, uint32_t reqid);
885
886 void ctdb_request_control(struct ctdb_context *ctdb, struct ctdb_req_header *hdr);
887 void ctdb_reply_control(struct ctdb_context *ctdb, struct ctdb_req_header *hdr);
888
889 int ctdb_daemon_send_control(struct ctdb_context *ctdb, uint32_t destnode,
890                              uint64_t srvid, uint32_t opcode, uint32_t client_id, uint32_t flags,
891                              TDB_DATA data,
892                              ctdb_control_callback_fn_t callback,
893                              void *private_data);
894
895 int32_t ctdb_control_db_attach(struct ctdb_context *ctdb, TDB_DATA indata, 
896                                TDB_DATA *outdata, uint64_t tdb_flags,
897                                bool persistent, uint32_t client_id,
898                                struct ctdb_req_control *c,
899                                bool *async_reply);
900 int32_t ctdb_control_db_detach(struct ctdb_context *ctdb, TDB_DATA indata,
901                                uint32_t client_id);
902
903 int ctdb_daemon_set_call(struct ctdb_context *ctdb, uint32_t db_id,
904                          ctdb_fn_t fn, int id);
905
906 int ctdb_control(struct ctdb_context *ctdb, uint32_t destnode, uint64_t srvid, 
907                  uint32_t opcode, uint32_t flags, TDB_DATA data, 
908                  TALLOC_CTX *mem_ctx, TDB_DATA *outdata, int32_t *status,
909                  struct timeval *timeout, char **errormsg);
910 int ctdb_control_recv(struct ctdb_context *ctdb, 
911                 struct ctdb_client_control_state *state, 
912                 TALLOC_CTX *mem_ctx,
913                 TDB_DATA *outdata, int32_t *status, char **errormsg);
914
915 struct ctdb_client_control_state *
916 ctdb_control_send(struct ctdb_context *ctdb, 
917                 uint32_t destnode, uint64_t srvid, 
918                 uint32_t opcode, uint32_t flags, TDB_DATA data, 
919                 TALLOC_CTX *mem_ctx,
920                 struct timeval *timeout,
921                 char **errormsg);
922
923
924
925
926 #define CHECK_CONTROL_DATA_SIZE(size) do { \
927  if (indata.dsize != size) { \
928          DEBUG(0,(__location__ " Invalid data size in opcode %u. Got %u expected %u\n", \
929                   opcode, (unsigned)indata.dsize, (unsigned)size));     \
930          return -1; \
931  } \
932  } while (0)
933
934 #define CHECK_CONTROL_MIN_DATA_SIZE(size) do { \
935  if (indata.dsize < size) { \
936          DEBUG(0,(__location__ " Invalid data size in opcode %u. Got %u expected >= %u\n", \
937                   opcode, (unsigned)indata.dsize, (unsigned)size));     \
938          return -1; \
939  } \
940  } while (0)
941
942 int ctdb_control_getvnnmap(struct ctdb_context *ctdb, uint32_t opcode, TDB_DATA indata, TDB_DATA *outdata);
943 int ctdb_control_setvnnmap(struct ctdb_context *ctdb, uint32_t opcode, TDB_DATA indata, TDB_DATA *outdata);
944 int ctdb_control_getdbmap(struct ctdb_context *ctdb, uint32_t opcode, TDB_DATA indata, TDB_DATA *outdata);
945 int ctdb_control_getnodemapv4(struct ctdb_context *ctdb, uint32_t opcode, TDB_DATA indata, TDB_DATA *outdata);
946 int ctdb_control_getnodemap(struct ctdb_context *ctdb, uint32_t opcode, TDB_DATA indata, TDB_DATA *outdata);
947 int ctdb_control_writerecord(struct ctdb_context *ctdb, uint32_t opcode, TDB_DATA indata, TDB_DATA *outdata);
948
949
950 /* structure used for pulldb control */
951 struct ctdb_control_pulldb {
952         uint32_t db_id;
953         uint32_t lmaster;
954 };
955
956 /* structure used for sending lists of records */
957 struct ctdb_marshall_buffer {
958         uint32_t db_id;
959         uint32_t count;
960         uint8_t data[1];
961 };
962
963 /*
964   structure for setting a tunable
965  */
966 struct ctdb_control_set_tunable {
967         uint32_t value;
968         uint32_t length;
969         uint8_t  name[1];
970 };
971
972 /*
973   structure for getting a tunable
974  */
975 struct ctdb_control_get_tunable {
976         uint32_t length;
977         uint8_t  name[1];
978 };
979
980 /*
981   structure for listing tunables
982  */
983 struct ctdb_control_list_tunable {
984         uint32_t length;
985         /* returns a : separated list of tunable names */
986         uint8_t  data[1];
987 };
988
989
990 struct ctdb_node_and_flagsv4 {
991         uint32_t pnn;
992         uint32_t flags;
993         struct sockaddr_in sin;
994 };
995
996 struct ctdb_node_mapv4 {
997         uint32_t num;
998         struct ctdb_node_and_flagsv4 nodes[1];
999 };
1000
1001 struct ctdb_control_wipe_database {
1002         uint32_t db_id;
1003         uint32_t transaction_id;
1004 };
1005
1006 /*
1007   state of a in-progress ctdb call in client
1008 */
1009 struct ctdb_client_call_state {
1010         enum call_state state;
1011         uint32_t reqid;
1012         struct ctdb_db_context *ctdb_db;
1013         struct ctdb_call *call;
1014         struct {
1015                 void (*fn)(struct ctdb_client_call_state *);
1016                 void *private_data;
1017         } async;
1018 };
1019
1020
1021 int32_t ctdb_control_traverse_start_ext(struct ctdb_context *ctdb,
1022                                         TDB_DATA indata,
1023                                         TDB_DATA *outdata,
1024                                         uint32_t srcnode,
1025                                         uint32_t client_id);
1026 int32_t ctdb_control_traverse_start(struct ctdb_context *ctdb, TDB_DATA indata, 
1027                                     TDB_DATA *outdata, uint32_t srcnode, uint32_t client_id);
1028 int32_t ctdb_control_traverse_all(struct ctdb_context *ctdb, TDB_DATA data, TDB_DATA *outdata);
1029 int32_t ctdb_control_traverse_all_ext(struct ctdb_context *ctdb, TDB_DATA data, TDB_DATA *outdata);
1030 int32_t ctdb_control_traverse_data(struct ctdb_context *ctdb, TDB_DATA data, TDB_DATA *outdata);
1031 int32_t ctdb_control_traverse_kill(struct ctdb_context *ctdb, TDB_DATA indata, 
1032                                     TDB_DATA *outdata, uint32_t srcnode);
1033
1034 int ctdb_dispatch_message(struct ctdb_context *ctdb, uint64_t srvid, TDB_DATA data);
1035 bool ctdb_check_message_handler(struct ctdb_context *ctdb, uint64_t srvid);
1036
1037 int daemon_register_message_handler(struct ctdb_context *ctdb, uint32_t client_id, uint64_t srvid);
1038 int ctdb_deregister_message_handler(struct ctdb_context *ctdb, uint64_t srvid, void *private_data);
1039 int daemon_deregister_message_handler(struct ctdb_context *ctdb, uint32_t client_id, uint64_t srvid);
1040 int daemon_check_srvids(struct ctdb_context *ctdb, TDB_DATA indata,
1041                         TDB_DATA *outdata);
1042
1043 int32_t ctdb_ltdb_enable_seqnum(struct ctdb_context *ctdb, uint32_t db_id);
1044 int32_t ctdb_ltdb_update_seqnum(struct ctdb_context *ctdb, uint32_t db_id, uint32_t srcnode);
1045
1046 struct ctdb_rec_data *ctdb_marshall_record(TALLOC_CTX *mem_ctx, uint32_t reqid, 
1047                                            TDB_DATA key, struct ctdb_ltdb_header *, TDB_DATA data);
1048
1049 struct ctdb_rec_data *ctdb_marshall_loop_next(struct ctdb_marshall_buffer *m, struct ctdb_rec_data *r,
1050                                               uint32_t *reqid,
1051                                               struct ctdb_ltdb_header *header,
1052                                               TDB_DATA *key, TDB_DATA *data);
1053
1054 int32_t ctdb_control_pull_db(struct ctdb_context *ctdb, TDB_DATA indata, TDB_DATA *outdata);
1055 int32_t ctdb_control_push_db(struct ctdb_context *ctdb, TDB_DATA indata);
1056
1057 int32_t ctdb_control_set_recmode(struct ctdb_context *ctdb, 
1058                                  struct ctdb_req_control *c,
1059                                  TDB_DATA indata, bool *async_reply,
1060                                  const char **errormsg);
1061 void ctdb_request_control_reply(struct ctdb_context *ctdb, struct ctdb_req_control *c,
1062                                 TDB_DATA *outdata, int32_t status, const char *errormsg);
1063
1064 int32_t ctdb_control_freeze(struct ctdb_context *ctdb, struct ctdb_req_control *c, bool *async_reply);
1065 int32_t ctdb_control_thaw(struct ctdb_context *ctdb, uint32_t priority,
1066                           bool check_recmode);
1067
1068 int ctdb_start_recoverd(struct ctdb_context *ctdb);
1069 void ctdb_stop_recoverd(struct ctdb_context *ctdb);
1070
1071 uint32_t ctdb_get_num_active_nodes(struct ctdb_context *ctdb);
1072
1073 void ctdb_disable_monitoring(struct ctdb_context *ctdb);
1074 void ctdb_enable_monitoring(struct ctdb_context *ctdb);
1075 void ctdb_stop_monitoring(struct ctdb_context *ctdb);
1076 void ctdb_wait_for_first_recovery(struct ctdb_context *ctdb);
1077 int ctdb_tcp_init(struct ctdb_context *ctdb);
1078 int ctdb_ibw_init(struct ctdb_context *ctdb);
1079 void ctdb_start_tcp_tickle_update(struct ctdb_context *ctdb);
1080 void ctdb_send_keepalive(struct ctdb_context *ctdb, uint32_t destnode);
1081 void ctdb_start_keepalive(struct ctdb_context *ctdb);
1082 void ctdb_stop_keepalive(struct ctdb_context *ctdb);
1083 int32_t ctdb_run_eventscripts(struct ctdb_context *ctdb, struct ctdb_req_control *c, TDB_DATA data, bool *async_reply);
1084
1085
1086 void ctdb_daemon_cancel_controls(struct ctdb_context *ctdb, struct ctdb_node *node);
1087 void ctdb_call_resend_all(struct ctdb_context *ctdb);
1088 void ctdb_node_dead(struct ctdb_node *node);
1089 void ctdb_node_connected(struct ctdb_node *node);
1090 bool ctdb_blocking_freeze(struct ctdb_context *ctdb);
1091 bool set_scheduler(void);
1092 void reset_scheduler(void);
1093
1094 struct tevent_signal *ctdb_init_sigchld(struct ctdb_context *ctdb);
1095 void ctdb_track_child(struct ctdb_context *ctdb, pid_t pid);
1096 pid_t ctdb_fork(struct ctdb_context *ctdb);
1097 void ctdb_set_child_info(TALLOC_CTX *mem_ctx, const char *child_name_fmt, ...);
1098 bool ctdb_is_child_process(void);
1099 int ctdb_kill(struct ctdb_context *ctdb, pid_t pid, int signum);
1100
1101 int32_t ctdb_control_takeover_ip(struct ctdb_context *ctdb, 
1102                                  struct ctdb_req_control *c,
1103                                  TDB_DATA indata, 
1104                                  bool *async_reply);
1105 int32_t ctdb_control_takeover_ipv4(struct ctdb_context *ctdb, 
1106                                  struct ctdb_req_control *c,
1107                                  TDB_DATA indata, 
1108                                  bool *async_reply);
1109 int32_t ctdb_control_release_ip(struct ctdb_context *ctdb, 
1110                                  struct ctdb_req_control *c,
1111                                  TDB_DATA indata, 
1112                                  bool *async_reply);
1113 int32_t ctdb_control_release_ipv4(struct ctdb_context *ctdb, 
1114                                  struct ctdb_req_control *c,
1115                                  TDB_DATA indata, 
1116                                  bool *async_reply);
1117 int32_t ctdb_control_ipreallocated(struct ctdb_context *ctdb, 
1118                                  struct ctdb_req_control *c,
1119                                  bool *async_reply);
1120 int32_t ctdb_control_start_recovery(struct ctdb_context *ctdb, 
1121                                  struct ctdb_req_control *c,
1122                                  bool *async_reply);
1123 int32_t ctdb_control_end_recovery(struct ctdb_context *ctdb, 
1124                                  struct ctdb_req_control *c,
1125                                  bool *async_reply);
1126
1127 struct ctdb_public_ipv4 {
1128         uint32_t pnn;
1129         struct sockaddr_in sin;
1130 };
1131
1132 int ctdb_ctrl_takeover_ip(struct ctdb_context *ctdb, struct timeval timeout, 
1133                           uint32_t destnode, struct ctdb_public_ip *ip);
1134 int ctdb_ctrl_release_ip(struct ctdb_context *ctdb, struct timeval timeout, 
1135                          uint32_t destnode, struct ctdb_public_ip *ip);
1136
1137 struct ctdb_all_public_ipsv4 {
1138         uint32_t num;
1139         struct ctdb_public_ipv4 ips[1];
1140 };
1141
1142 int32_t ctdb_control_get_public_ipsv4(struct ctdb_context *ctdb, struct ctdb_req_control *c, TDB_DATA *outdata);
1143 int32_t ctdb_control_get_public_ips(struct ctdb_context *ctdb, struct ctdb_req_control *c, TDB_DATA *outdata);
1144 int ctdb_ctrl_get_public_ips(struct ctdb_context *ctdb, 
1145                              struct timeval timeout,
1146                              uint32_t destnode,
1147                              TALLOC_CTX *mem_ctx,
1148                              struct ctdb_all_public_ips **ips);
1149 #define CTDB_PUBLIC_IP_FLAGS_ONLY_AVAILABLE 0x00010000
1150 int ctdb_ctrl_get_public_ips_flags(struct ctdb_context *ctdb,
1151                                    struct timeval timeout, uint32_t destnode,
1152                                    TALLOC_CTX *mem_ctx,
1153                                    uint32_t flags,
1154                                    struct ctdb_all_public_ips **ips);
1155 int ctdb_ctrl_get_public_ipsv4(struct ctdb_context *ctdb, 
1156                         struct timeval timeout, uint32_t destnode, 
1157                         TALLOC_CTX *mem_ctx, struct ctdb_all_public_ips **ips);
1158
1159 struct ctdb_control_iface_info {
1160         char name[CTDB_IFACE_SIZE+2];
1161         uint16_t link_state;
1162         uint32_t references;
1163 };
1164
1165 struct ctdb_control_public_ip_info {
1166         struct ctdb_public_ip ip;
1167         uint32_t active_idx;
1168         uint32_t num;
1169         struct ctdb_control_iface_info ifaces[1];
1170 };
1171
1172 struct ctdb_control_get_ifaces {
1173         uint32_t num;
1174         struct ctdb_control_iface_info ifaces[1];
1175 };
1176
1177 int32_t ctdb_control_get_public_ip_info(struct ctdb_context *ctdb,
1178                                         struct ctdb_req_control *c,
1179                                         TDB_DATA indata,
1180                                         TDB_DATA *outdata);
1181 int32_t ctdb_control_get_ifaces(struct ctdb_context *ctdb,
1182                                 struct ctdb_req_control *c,
1183                                 TDB_DATA *outdata);
1184 int32_t ctdb_control_set_iface_link(struct ctdb_context *ctdb,
1185                                     struct ctdb_req_control *c,
1186                                     TDB_DATA indata);
1187 int ctdb_ctrl_get_public_ip_info(struct ctdb_context *ctdb,
1188                                  struct timeval timeout, uint32_t destnode,
1189                                  TALLOC_CTX *mem_ctx,
1190                                  const ctdb_sock_addr *addr,
1191                                  struct ctdb_control_public_ip_info **info);
1192 int ctdb_ctrl_get_ifaces(struct ctdb_context *ctdb,
1193                          struct timeval timeout, uint32_t destnode,
1194                          TALLOC_CTX *mem_ctx,
1195                          struct ctdb_control_get_ifaces **ifaces);
1196 int ctdb_ctrl_set_iface_link(struct ctdb_context *ctdb,
1197                              struct timeval timeout, uint32_t destnode,
1198                              TALLOC_CTX *mem_ctx,
1199                              const struct ctdb_control_iface_info *info);
1200
1201 /* from takeover/system.c */
1202 uint32_t uint16_checksum(uint16_t *data, size_t n);
1203 int ctdb_sys_send_arp(const ctdb_sock_addr *addr, const char *iface);
1204 bool ctdb_sys_have_ip(ctdb_sock_addr *addr);
1205 char *ctdb_sys_find_ifname(ctdb_sock_addr *addr);
1206 bool ctdb_sys_check_iface_exists(const char *iface);
1207 int ctdb_get_peer_pid(const int fd, pid_t *peer_pid);
1208 int ctdb_sys_send_tcp(const ctdb_sock_addr *dest, 
1209                       const ctdb_sock_addr *src,
1210                       uint32_t seq, uint32_t ack, int rst);
1211
1212 /* Details of a byte range lock */
1213 struct ctdb_lock_info {
1214         ino_t inode;
1215         off_t start, end;
1216         bool waiting;
1217         bool read_only;
1218 };
1219
1220 char *ctdb_get_process_name(pid_t pid);
1221 int ctdb_set_process_name(const char *name);
1222 bool ctdb_get_lock_info(pid_t req_pid, struct ctdb_lock_info *lock_info);
1223 bool ctdb_get_blocker_pid(struct ctdb_lock_info *reqlock, pid_t *blocker_pid);
1224
1225 typedef void (*client_async_callback)(struct ctdb_context *ctdb, uint32_t node_pnn, int32_t res, TDB_DATA outdata, void *callback_data);
1226
1227 int ctdb_set_public_addresses(struct ctdb_context *ctdb, bool check_addresses);
1228 int ctdb_set_single_public_ip(struct ctdb_context *ctdb,
1229                               const char *iface,
1230                               const char *ip);
1231 int ctdb_set_event_script(struct ctdb_context *ctdb, const char *script);
1232 int ctdb_set_notification_script(struct ctdb_context *ctdb, const char *script);
1233 int ctdb_takeover_run(struct ctdb_context *ctdb, struct ctdb_node_map *nodemap,
1234                       uint32_t *force_rebalance_nodes,
1235                       client_async_callback fail_callback, void *callback_data);
1236
1237 int32_t ctdb_control_tcp_client(struct ctdb_context *ctdb, uint32_t client_id, 
1238                                 TDB_DATA indata);
1239 int32_t ctdb_control_tcp_add(struct ctdb_context *ctdb, TDB_DATA indata, bool tcp_update_needed);
1240 int32_t ctdb_control_tcp_remove(struct ctdb_context *ctdb, TDB_DATA indata);
1241 int32_t ctdb_control_startup(struct ctdb_context *ctdb, uint32_t vnn);
1242 int32_t ctdb_control_kill_tcp(struct ctdb_context *ctdb, TDB_DATA indata);
1243 int32_t ctdb_control_send_gratious_arp(struct ctdb_context *ctdb, TDB_DATA indata);
1244 int32_t ctdb_control_get_tcp_tickle_list(struct ctdb_context *ctdb, TDB_DATA indata, TDB_DATA *outdata);
1245 int32_t ctdb_control_set_tcp_tickle_list(struct ctdb_context *ctdb, TDB_DATA indata);
1246
1247 void ctdb_takeover_client_destructor_hook(struct ctdb_client *client);
1248 int ctdb_event_script(struct ctdb_context *ctdb, enum ctdb_eventscript_call call);
1249 int ctdb_event_script_args(struct ctdb_context *ctdb, enum ctdb_eventscript_call call,
1250                            const char *fmt, ...) PRINTF_ATTRIBUTE(3,4);
1251 int ctdb_event_script_callback(struct ctdb_context *ctdb, 
1252                                TALLOC_CTX *mem_ctx,
1253                                void (*callback)(struct ctdb_context *, int, void *),
1254                                void *private_data,
1255                                enum ctdb_eventscript_call call,
1256                                const char *fmt, ...) PRINTF_ATTRIBUTE(6,7);
1257 void ctdb_release_all_ips(struct ctdb_context *ctdb);
1258
1259 void set_nonblocking(int fd);
1260 void set_close_on_exec(int fd);
1261
1262 bool ctdb_recovery_have_lock(struct ctdb_context *ctdb);
1263 bool ctdb_recovery_lock(struct ctdb_context *ctdb);
1264 void ctdb_recovery_unlock(struct ctdb_context *ctdb);
1265
1266 int ctdb_set_recovery_lock_file(struct ctdb_context *ctdb, const char *file);
1267
1268 int32_t ctdb_control_get_tunable(struct ctdb_context *ctdb, TDB_DATA indata, 
1269                                  TDB_DATA *outdata);
1270 int32_t ctdb_control_set_tunable(struct ctdb_context *ctdb, TDB_DATA indata);
1271 int32_t ctdb_control_list_tunables(struct ctdb_context *ctdb, TDB_DATA *outdata);
1272 int32_t ctdb_control_try_delete_records(struct ctdb_context *ctdb, TDB_DATA indata, TDB_DATA *outdata);
1273 int32_t ctdb_control_receive_records(struct ctdb_context *ctdb, TDB_DATA indata, TDB_DATA *outdata);
1274 int32_t ctdb_control_add_public_address(struct ctdb_context *ctdb, TDB_DATA indata);
1275 int32_t ctdb_control_del_public_address(struct ctdb_context *ctdb,
1276                                         struct ctdb_req_control *c,
1277                                         TDB_DATA recdata, bool *async_reply);
1278
1279 void ctdb_tunables_set_defaults(struct ctdb_context *ctdb);
1280
1281 int32_t ctdb_control_modflags(struct ctdb_context *ctdb, TDB_DATA indata);
1282
1283 int ctdb_ctrl_get_all_tunables(struct ctdb_context *ctdb, 
1284                                struct timeval timeout, 
1285                                uint32_t destnode,
1286                                struct ctdb_tunable *tunables);
1287
1288 void ctdb_start_freeze(struct ctdb_context *ctdb, uint32_t priority);
1289
1290 bool parse_ip_mask(const char *s, const char *iface, ctdb_sock_addr *addr, unsigned *mask);
1291 bool parse_ip_port(const char *s, ctdb_sock_addr *addr);
1292 bool parse_ip(const char *s, const char *iface, unsigned port, ctdb_sock_addr *addr);
1293 bool parse_ipv4(const char *s, unsigned port, struct sockaddr_in *sin);
1294  
1295
1296 int ctdb_sys_open_capture_socket(const char *iface, void **private_data);
1297 int ctdb_sys_close_capture_socket(void *private_data);
1298 int ctdb_sys_read_tcp_packet(int s, void *private_data, ctdb_sock_addr *src, ctdb_sock_addr *dst, uint32_t *ack_seq, uint32_t *seq);
1299
1300 int ctdb_ctrl_killtcp(struct ctdb_context *ctdb, 
1301                       struct timeval timeout, 
1302                       uint32_t destnode,
1303                       struct ctdb_control_killtcp *killtcp);
1304
1305 int ctdb_ctrl_add_public_ip(struct ctdb_context *ctdb, 
1306                       struct timeval timeout, 
1307                       uint32_t destnode,
1308                       struct ctdb_control_ip_iface *pub);
1309
1310 int ctdb_ctrl_del_public_ip(struct ctdb_context *ctdb, 
1311                       struct timeval timeout, 
1312                       uint32_t destnode,
1313                       struct ctdb_control_ip_iface *pub);
1314
1315 int ctdb_ctrl_gratious_arp(struct ctdb_context *ctdb, 
1316                       struct timeval timeout, 
1317                       uint32_t destnode,
1318                       ctdb_sock_addr *addr,
1319                       const char *ifname);
1320
1321 int ctdb_ctrl_get_tcp_tickles(struct ctdb_context *ctdb, 
1322                       struct timeval timeout, 
1323                       uint32_t destnode,
1324                       TALLOC_CTX *mem_ctx,
1325                       ctdb_sock_addr *addr,
1326                       struct ctdb_control_tcp_tickle_list **list);
1327
1328
1329 int32_t ctdb_control_register_server_id(struct ctdb_context *ctdb, 
1330                       uint32_t client_id,
1331                       TDB_DATA indata);
1332 int32_t ctdb_control_check_server_id(struct ctdb_context *ctdb, 
1333                       TDB_DATA indata);
1334 int32_t ctdb_control_unregister_server_id(struct ctdb_context *ctdb, 
1335                       TDB_DATA indata);
1336 int32_t ctdb_control_get_server_id_list(struct ctdb_context *ctdb, 
1337                       TDB_DATA *outdata);
1338 int32_t ctdb_control_uptime(struct ctdb_context *ctdb, 
1339                       TDB_DATA *outdata);
1340
1341 int ctdb_attach_databases(struct ctdb_context *ctdb);
1342
1343 int32_t ctdb_control_persistent_store(struct ctdb_context *ctdb, 
1344                                       struct ctdb_req_control *c, 
1345                                       TDB_DATA recdata, bool *async_reply);
1346 int32_t ctdb_control_update_record(struct ctdb_context *ctdb, 
1347                                    struct ctdb_req_control *c, TDB_DATA recdata, 
1348                                    bool *async_reply);
1349 int32_t ctdb_control_trans2_commit(struct ctdb_context *ctdb, 
1350                                    struct ctdb_req_control *c, 
1351                                    TDB_DATA recdata, bool *async_reply);
1352
1353 int32_t ctdb_control_trans3_commit(struct ctdb_context *ctdb,
1354                                    struct ctdb_req_control *c,
1355                                    TDB_DATA recdata, bool *async_reply);
1356
1357 void ctdb_persistent_finish_trans3_commits(struct ctdb_context *ctdb);
1358
1359 int32_t ctdb_control_transaction_start(struct ctdb_context *ctdb, uint32_t id);
1360 int32_t ctdb_control_transaction_commit(struct ctdb_context *ctdb, uint32_t id);
1361 int32_t ctdb_control_transaction_cancel(struct ctdb_context *ctdb);
1362 int32_t ctdb_control_wipe_database(struct ctdb_context *ctdb, TDB_DATA indata);
1363 int32_t ctdb_control_db_set_healthy(struct ctdb_context *ctdb, TDB_DATA indata);
1364 int32_t ctdb_control_db_get_health(struct ctdb_context *ctdb,
1365                                    TDB_DATA indata,
1366                                    TDB_DATA *outdata);
1367
1368
1369 int ctdb_vacuum(struct ctdb_context *ctdb, int argc, const char **argv);
1370 int ctdb_repack(struct ctdb_context *ctdb, int argc, const char **argv);
1371
1372 int32_t ctdb_monitoring_mode(struct ctdb_context *ctdb);
1373 bool ctdb_stopped_monitoring(struct ctdb_context *ctdb);
1374 int ctdb_set_child_logging(struct ctdb_context *ctdb);
1375 void lockdown_memory(bool valgrinding);
1376
1377 struct client_async_data {
1378         enum ctdb_controls opcode;
1379         bool dont_log_errors;
1380         uint32_t count;
1381         uint32_t fail_count;
1382         client_async_callback callback;
1383         client_async_callback fail_callback;
1384         void *callback_data;
1385 };
1386 void ctdb_client_async_add(struct client_async_data *data, struct ctdb_client_control_state *state);
1387 int ctdb_client_async_wait(struct ctdb_context *ctdb, struct client_async_data *data);
1388 int ctdb_client_async_control(struct ctdb_context *ctdb,
1389                                 enum ctdb_controls opcode,
1390                                 uint32_t *nodes,
1391                                 uint64_t srvid,
1392                                 struct timeval timeout,
1393                                 bool dont_log_errors,
1394                                 TDB_DATA data,
1395                                 client_async_callback client_callback,
1396                                 client_async_callback fail_callback,
1397                                 void *callback_data);
1398
1399 void ctdb_load_nodes_file(struct ctdb_context *ctdb);
1400
1401 int ctdb_control_reload_nodes_file(struct ctdb_context *ctdb, uint32_t opcode);
1402
1403 int32_t ctdb_dump_memory(struct ctdb_context *ctdb, TDB_DATA *outdata);
1404 int32_t ctdb_control_get_capabilities(struct ctdb_context *ctdb, TDB_DATA *outdata);
1405
1406 int32_t ctdb_control_trans2_finished(struct ctdb_context *ctdb, 
1407                                      struct ctdb_req_control *c);
1408 int32_t ctdb_control_trans2_error(struct ctdb_context *ctdb, 
1409                                   struct ctdb_req_control *c);
1410 int32_t ctdb_control_trans2_active(struct ctdb_context *ctdb,
1411                                    struct ctdb_req_control *c,
1412                                    uint32_t db_id);
1413
1414 char *ctdb_addr_to_str(ctdb_sock_addr *addr);
1415 unsigned ctdb_addr_to_port(ctdb_sock_addr *addr);
1416 void ctdb_canonicalize_ip(const ctdb_sock_addr *ip, ctdb_sock_addr *cip);
1417
1418 int32_t ctdb_control_recd_ping(struct ctdb_context *ctdb);
1419 int32_t ctdb_control_set_recmaster(struct ctdb_context *ctdb, uint32_t opcode, TDB_DATA indata);
1420
1421 extern int script_log_level;
1422 extern bool fast_start;
1423 extern const char *ctdbd_pidfile;
1424
1425 int32_t ctdb_control_get_event_script_status(struct ctdb_context *ctdb,
1426                                              uint32_t call_type,
1427                                              TDB_DATA *outdata);
1428
1429 int ctdb_log_event_script_output(struct ctdb_context *ctdb, char *str, uint16_t len);
1430 int ctdb_ctrl_report_recd_lock_latency(struct ctdb_context *ctdb, struct timeval timeout, double latency);
1431
1432 int32_t ctdb_control_stop_node(struct ctdb_context *ctdb);
1433 int32_t ctdb_control_continue_node(struct ctdb_context *ctdb);
1434
1435 void ctdb_stop_vacuuming(struct ctdb_context *ctdb);
1436 int ctdb_vacuum_init(struct ctdb_db_context *ctdb_db);
1437
1438 int32_t ctdb_control_enable_script(struct ctdb_context *ctdb, TDB_DATA indata);
1439 int32_t ctdb_control_disable_script(struct ctdb_context *ctdb, TDB_DATA indata);
1440
1441 void ctdb_local_node_got_banned(struct ctdb_context *ctdb);
1442 int32_t ctdb_control_set_ban_state(struct ctdb_context *ctdb, TDB_DATA indata);
1443 int32_t ctdb_control_get_ban_state(struct ctdb_context *ctdb, TDB_DATA *outdata);
1444 int32_t ctdb_control_set_db_priority(struct ctdb_context *ctdb, TDB_DATA indata,
1445                                      uint32_t client_id);
1446 void ctdb_ban_self(struct ctdb_context *ctdb);
1447
1448 int32_t ctdb_control_register_notify(struct ctdb_context *ctdb, uint32_t client_id, TDB_DATA indata);
1449
1450 int32_t ctdb_control_deregister_notify(struct ctdb_context *ctdb, uint32_t client_id, TDB_DATA indata);
1451
1452 struct ctdb_log_state *ctdb_vfork_with_logging(TALLOC_CTX *mem_ctx,
1453                                                struct ctdb_context *ctdb,
1454                                                const char *log_prefix,
1455                                                const char *helper,
1456                                                int helper_argc,
1457                                                const char **helper_argv,
1458                                                void (*logfn)(const char *, uint16_t, void *),
1459                                                void *logfn_private, pid_t *pid);
1460
1461
1462 int32_t ctdb_control_process_exists(struct ctdb_context *ctdb, pid_t pid);
1463 struct ctdb_client *ctdb_find_client_by_pid(struct ctdb_context *ctdb, pid_t pid);
1464
1465 int32_t ctdb_control_get_db_seqnum(struct ctdb_context *ctdb,
1466                                    TDB_DATA indata,
1467                                    TDB_DATA *outdata);
1468
1469 int ctdb_load_persistent_health(struct ctdb_context *ctdb,
1470                                 struct ctdb_db_context *ctdb_db);
1471 int ctdb_update_persistent_health(struct ctdb_context *ctdb,
1472                                   struct ctdb_db_context *ctdb_db,
1473                                   const char *reason,/* NULL means healthy */
1474                                   int num_healthy_nodes);
1475 int ctdb_recheck_persistent_health(struct ctdb_context *ctdb);
1476
1477 void ctdb_run_notification_script(struct ctdb_context *ctdb, const char *event);
1478
1479 int verify_remote_ip_allocation(struct ctdb_context *ctdb, 
1480                                 struct ctdb_all_public_ips *ips,
1481                                 uint32_t pnn);
1482 int update_ip_assignment_tree(struct ctdb_context *ctdb,
1483                                 struct ctdb_public_ip *ip);
1484
1485 int ctdb_init_tevent_logging(struct ctdb_context *ctdb);
1486
1487 int ctdb_statistics_init(struct ctdb_context *ctdb);
1488
1489 int32_t ctdb_control_get_stat_history(struct ctdb_context *ctdb,
1490                                       struct ctdb_req_control *c,
1491                                       TDB_DATA *outdata);
1492
1493 int ctdb_deferred_drop_all_ips(struct ctdb_context *ctdb);
1494
1495 int ctdb_process_deferred_attach(struct ctdb_context *ctdb);
1496
1497 /**
1498  * structure to pass to a schedule_for_deletion_control
1499  */
1500 struct ctdb_control_schedule_for_deletion {
1501         uint32_t db_id;
1502         struct ctdb_ltdb_header hdr;
1503         uint32_t keylen;
1504         uint8_t key[1]; /* key[] */
1505 };
1506
1507 int32_t ctdb_control_schedule_for_deletion(struct ctdb_context *ctdb,
1508                                            TDB_DATA indata);
1509
1510
1511 int32_t ctdb_local_schedule_for_deletion(struct ctdb_db_context *ctdb_db,
1512                                          const struct ctdb_ltdb_header *hdr,
1513                                          TDB_DATA key);
1514
1515 void ctdb_local_remove_from_delete_queue(struct ctdb_db_context *ctdb_db,
1516                                          const struct ctdb_ltdb_header *hdr,
1517                                          const TDB_DATA key);
1518
1519 struct ctdb_ltdb_header *ctdb_header_from_record_handle(struct ctdb_record_handle *h);
1520
1521 int ctdb_trackingdb_add_pnn(struct ctdb_context *ctdb, TDB_DATA *data, uint32_t pnn);
1522
1523 typedef void (*ctdb_trackingdb_cb)(struct ctdb_context *ctdb, uint32_t pnn, void *private_data);
1524
1525 void ctdb_trackingdb_traverse(struct ctdb_context *ctdb, TDB_DATA data, ctdb_trackingdb_cb cb, void *private_data);
1526
1527 int ctdb_start_revoke_ro_record(struct ctdb_context *ctdb, struct ctdb_db_context *ctdb_db, TDB_DATA key, struct ctdb_ltdb_header *header, TDB_DATA data);
1528
1529 typedef void (*deferred_requeue_fn)(void *call_context, struct ctdb_req_header *hdr);
1530
1531 int ctdb_add_revoke_deferred_call(struct ctdb_context *ctdb, struct ctdb_db_context *ctdb_db, TDB_DATA key, struct ctdb_req_header *hdr, deferred_requeue_fn fn, void *call_context);
1532
1533 int ctdb_set_db_readonly(struct ctdb_context *ctdb, struct ctdb_db_context *ctdb_db);
1534
1535 int ctdb_null_func(struct ctdb_call_info *call);
1536
1537 int ctdb_fetch_func(struct ctdb_call_info *call);
1538
1539 int ctdb_fetch_with_header_func(struct ctdb_call_info *call);
1540
1541 int32_t ctdb_control_get_db_statistics(struct ctdb_context *ctdb,
1542                                 uint32_t db_id,
1543                                 TDB_DATA *outdata);
1544
1545 int ctdb_set_db_sticky(struct ctdb_context *ctdb, struct ctdb_db_context *ctdb_db);
1546
1547 /*
1548   description for a message to reload all ips via recovery master/daemon
1549  */
1550 struct reloadips_all_reply {
1551         uint32_t pnn;
1552         uint64_t srvid;
1553 };
1554
1555 int32_t ctdb_control_reload_public_ips(struct ctdb_context *ctdb, struct ctdb_req_control *c, bool *async_reply);
1556
1557 int ctdb_start_monitoring_interfaces(struct ctdb_context *ctdb);
1558
1559 /* from server/ctdb_lock.c */
1560 struct lock_request;
1561
1562 int ctdb_lockall_mark_prio(struct ctdb_context *ctdb, uint32_t priority);
1563 int ctdb_lockall_unmark_prio(struct ctdb_context *ctdb, uint32_t priority);
1564
1565 struct lock_request *ctdb_lock_record(TALLOC_CTX *mem_ctx,
1566                                       struct ctdb_db_context *ctdb_db,
1567                                       TDB_DATA key,
1568                                       bool auto_mark,
1569                                       void (*callback)(void *, bool),
1570                                       void *private_data);
1571
1572 struct lock_request *ctdb_lock_db(TALLOC_CTX *mem_ctx,
1573                                   struct ctdb_db_context *ctdb_db,
1574                                   bool auto_mark,
1575                                   void (*callback)(void *, bool),
1576                                   void *private_data);
1577
1578 struct lock_request *ctdb_lock_alldb_prio(TALLOC_CTX *mem_ctx,
1579                                           struct ctdb_context *ctdb,
1580                                           uint32_t priority,
1581                                           bool auto_mark,
1582                                           void (*callback)(void *, bool),
1583                                           void *private_data);
1584
1585 struct lock_request *ctdb_lock_alldb(TALLOC_CTX *mem_ctx,
1586                                      struct ctdb_context *ctdb,
1587                                      bool auto_mark,
1588                                      void (*callback)(void *, bool),
1589                                      void *private_data);
1590
1591 int mkdir_p(const char *dir, int mode);
1592 void mkdir_p_or_die(const char *dir, int mode);
1593
1594 ssize_t sys_read(int fd, void *buf, size_t count);
1595 ssize_t sys_write(int fd, const void *buf, size_t count);
1596
1597 #endif