to make it easier/less disruptive to add nodes to a running cluster
[sahlberg/ctdb.git] / server / ctdbd.c
1 /* 
2    standalone ctdb daemon
3
4    Copyright (C) Andrew Tridgell  2006
5
6    This program is free software; you can redistribute it and/or modify
7    it under the terms of the GNU General Public License as published by
8    the Free Software Foundation; either version 3 of the License, or
9    (at your option) any later version.
10    
11    This program is distributed in the hope that it will be useful,
12    but WITHOUT ANY WARRANTY; without even the implied warranty of
13    MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
14    GNU General Public License for more details.
15    
16    You should have received a copy of the GNU General Public License
17    along with this program; if not, see <http://www.gnu.org/licenses/>.
18 */
19
20 #include "includes.h"
21 #include "lib/events/events.h"
22 #include "system/filesys.h"
23 #include "popt.h"
24 #include "system/time.h"
25 #include "system/wait.h"
26 #include "system/network.h"
27 #include "cmdline.h"
28 #include "../include/ctdb_private.h"
29
30 static struct {
31         const char *nlist;
32         const char *transport;
33         const char *myaddress;
34         const char *public_address_list;
35         const char *event_script_dir;
36         const char *logfile;
37         const char *recovery_lock_file;
38         const char *db_dir;
39         const char *db_dir_persistent;
40         const char *public_interface;
41         const char *single_public_ip;
42         const char *node_ip;
43         int         no_setsched;
44         int         use_syslog;
45 } options = {
46         .nlist = ETCDIR "/ctdb/nodes",
47         .transport = "tcp",
48         .event_script_dir = ETCDIR "/ctdb/events.d",
49         .logfile = VARDIR "/log/log.ctdb",
50         .db_dir = VARDIR "/ctdb",
51         .db_dir_persistent = VARDIR "/ctdb/persistent",
52 };
53
54
55 /*
56   called by the transport layer when a packet comes in
57 */
58 static void ctdb_recv_pkt(struct ctdb_context *ctdb, uint8_t *data, uint32_t length)
59 {
60         struct ctdb_req_header *hdr = (struct ctdb_req_header *)data;
61
62         ctdb->statistics.node_packets_recv++;
63
64         /* up the counter for this source node, so we know its alive */
65         if (ctdb_validate_pnn(ctdb, hdr->srcnode)) {
66                 /* as a special case, redirected calls don't increment the rx_cnt */
67                 if (hdr->operation != CTDB_REQ_CALL ||
68                     ((struct ctdb_req_call *)hdr)->hopcount == 0) {
69                         ctdb->nodes[hdr->srcnode]->rx_cnt++;
70                 }
71         }
72
73         ctdb_input_pkt(ctdb, hdr);
74 }
75
76 void ctdb_load_nodes_file(struct ctdb_context *ctdb)
77 {
78         int ret;
79
80         ret = ctdb_set_nlist(ctdb, options.nlist);
81         if (ret == -1) {
82                 DEBUG(DEBUG_ALERT,("ctdb_set_nlist failed - %s\n", ctdb_errstr(ctdb)));
83                 exit(1);
84         }
85 }
86
87 static const struct ctdb_upcalls ctdb_upcalls = {
88         .recv_pkt       = ctdb_recv_pkt,
89         .node_dead      = ctdb_node_dead,
90         .node_connected = ctdb_node_connected
91 };
92
93
94
95 /*
96   main program
97 */
98 int main(int argc, const char *argv[])
99 {
100         struct ctdb_context *ctdb;
101         int interactive = 0;
102
103         struct poptOption popt_options[] = {
104                 POPT_AUTOHELP
105                 POPT_CTDB_CMDLINE
106                 { "interactive", 'i', POPT_ARG_NONE, &interactive, 0, "don't fork", NULL },
107                 { "public-addresses", 0, POPT_ARG_STRING, &options.public_address_list, 0, "public address list file", "filename" },
108                 { "public-interface", 0, POPT_ARG_STRING, &options.public_interface, 0, "public interface", "interface"},
109                 { "single-public-ip", 0, POPT_ARG_STRING, &options.single_public_ip, 0, "single public ip", "ip-address"},
110                 { "event-script-dir", 0, POPT_ARG_STRING, &options.event_script_dir, 0, "event script directory", "dirname" },
111                 { "logfile", 0, POPT_ARG_STRING, &options.logfile, 0, "log file location", "filename" },
112                 { "nlist", 0, POPT_ARG_STRING, &options.nlist, 0, "node list file", "filename" },
113                 { "node-ip", 0, POPT_ARG_STRING, &options.node_ip, 0, "node ip", "ip-address"},
114                 { "listen", 0, POPT_ARG_STRING, &options.myaddress, 0, "address to listen on", "address" },
115                 { "transport", 0, POPT_ARG_STRING, &options.transport, 0, "protocol transport", NULL },
116                 { "dbdir", 0, POPT_ARG_STRING, &options.db_dir, 0, "directory for the tdb files", NULL },
117                 { "dbdir-persistent", 0, POPT_ARG_STRING, &options.db_dir_persistent, 0, "directory for persistent tdb files", NULL },
118                 { "reclock", 0, POPT_ARG_STRING, &options.recovery_lock_file, 0, "location of recovery lock file", "filename" },
119                 { "nosetsched", 0, POPT_ARG_NONE, &options.no_setsched, 0, "disable setscheduler SCHED_FIFO call", NULL },
120                 { "syslog", 0, POPT_ARG_NONE, &options.use_syslog, 0, "log messages to syslog", NULL },
121                 POPT_TABLEEND
122         };
123         int opt, ret;
124         const char **extra_argv;
125         int extra_argc = 0;
126         poptContext pc;
127         struct event_context *ev;
128
129         pc = poptGetContext(argv[0], argc, argv, popt_options, POPT_CONTEXT_KEEP_FIRST);
130
131         while ((opt = poptGetNextOpt(pc)) != -1) {
132                 switch (opt) {
133                 default:
134                         fprintf(stderr, "Invalid option %s: %s\n", 
135                                 poptBadOption(pc, 0), poptStrerror(opt));
136                         exit(1);
137                 }
138         }
139
140         /* setup the remaining options for the main program to use */
141         extra_argv = poptGetArgs(pc);
142         if (extra_argv) {
143                 extra_argv++;
144                 while (extra_argv[extra_argc]) extra_argc++;
145         }
146
147         if (!options.recovery_lock_file) {
148                 DEBUG(DEBUG_ALERT,("You must specifiy the location of a recovery lock file with --reclock\n"));
149                 exit(1);
150         }
151
152         talloc_enable_null_tracking();
153
154         ctdb_block_signal(SIGPIPE);
155
156         ev = event_context_init(NULL);
157
158         ctdb = ctdb_cmdline_init(ev);
159
160         ret = ctdb_set_logfile(ctdb, options.logfile, options.use_syslog);
161         if (ret == -1) {
162                 printf("ctdb_set_logfile to %s failed - %s\n", 
163                        options.use_syslog?"syslog":options.logfile, ctdb_errstr(ctdb));
164                 exit(1);
165         }
166
167         DEBUG(DEBUG_NOTICE,("Starting CTDB daemon\n"));
168         gettimeofday(&ctdb->ctdbd_start_time, NULL);
169         gettimeofday(&ctdb->last_recovery_time, NULL);
170         ctdb->recovery_mode    = CTDB_RECOVERY_NORMAL;
171         ctdb->recovery_master  = (uint32_t)-1;
172         ctdb->upcalls          = &ctdb_upcalls;
173         ctdb->idr              = idr_init(ctdb);
174         ctdb->recovery_lock_fd = -1;
175
176         ctdb_tunables_set_defaults(ctdb);
177
178         ret = ctdb_set_recovery_lock_file(ctdb, options.recovery_lock_file);
179         if (ret == -1) {
180                 DEBUG(DEBUG_ALERT,("ctdb_set_recovery_lock_file failed - %s\n", ctdb_errstr(ctdb)));
181                 exit(1);
182         }
183
184         ret = ctdb_set_transport(ctdb, options.transport);
185         if (ret == -1) {
186                 DEBUG(DEBUG_ALERT,("ctdb_set_transport failed - %s\n", ctdb_errstr(ctdb)));
187                 exit(1);
188         }
189
190         /* tell ctdb what address to listen on */
191         if (options.myaddress) {
192                 ret = ctdb_set_address(ctdb, options.myaddress);
193                 if (ret == -1) {
194                         DEBUG(DEBUG_ALERT,("ctdb_set_address failed - %s\n", ctdb_errstr(ctdb)));
195                         exit(1);
196                 }
197         }
198
199         /* tell ctdb what nodes are available */
200         ctdb_load_nodes_file(ctdb);
201
202         /* if a node-ip was specified, verify that it exists in the
203            nodes file
204         */
205         if (options.node_ip != NULL) {
206                 DEBUG(DEBUG_NOTICE,("IP for this node is %s\n", options.node_ip));
207                 ret = ctdb_ip_to_nodeid(ctdb, options.node_ip);
208                 if (ret == -1) {
209                         DEBUG(DEBUG_ALERT,("The specified node-ip:%s is not a valid node address. Exiting.\n", options.node_ip));
210                         exit(1);
211                 }
212                 ctdb->node_ip = options.node_ip;
213                 DEBUG(DEBUG_NOTICE,("This is node %d\n", ret));
214         }
215
216         if (options.db_dir) {
217                 ret = ctdb_set_tdb_dir(ctdb, options.db_dir);
218                 if (ret == -1) {
219                         DEBUG(DEBUG_ALERT,("ctdb_set_tdb_dir failed - %s\n", ctdb_errstr(ctdb)));
220                         exit(1);
221                 }
222         }
223         if (options.db_dir_persistent) {
224                 ret = ctdb_set_tdb_dir_persistent(ctdb, options.db_dir_persistent);
225                 if (ret == -1) {
226                         DEBUG(DEBUG_ALERT,("ctdb_set_tdb_dir_persistent failed - %s\n", ctdb_errstr(ctdb)));
227                         exit(1);
228                 }
229         }
230
231         if (options.public_interface) {
232                 ctdb->default_public_interface = talloc_strdup(ctdb, options.public_interface);
233                 CTDB_NO_MEMORY(ctdb, ctdb->default_public_interface);
234         }
235
236         if (options.single_public_ip) {
237                 struct ctdb_vnn *svnn;
238
239                 if (options.public_interface == NULL) {
240                         DEBUG(DEBUG_ALERT,("--single_public_ip used but --public_interface is not specified. You must specify the public interface when using single public ip. Exiting\n"));
241                         exit(10);
242                 }
243
244                 svnn = talloc_zero(ctdb, struct ctdb_vnn);
245                 CTDB_NO_MEMORY(ctdb, svnn);
246
247                 ctdb->single_ip_vnn = svnn;
248                 svnn->iface = talloc_strdup(svnn, options.public_interface);
249                 CTDB_NO_MEMORY(ctdb, svnn->iface);
250
251                 if (inet_aton(options.single_public_ip, 
252                                 &svnn->public_address.sin_addr) == 0) {
253                         DEBUG(DEBUG_ALERT,("Invalid --single-public-ip argument : %s . This is not a valid ip address. Exiting.\n", options.single_public_ip));
254                         exit(10);
255                 }
256                 svnn->public_address.sin_family = AF_INET;
257                 svnn->public_address.sin_port   = 0;
258         }
259
260         if (options.public_address_list) {
261                 ret = ctdb_set_public_addresses(ctdb, options.public_address_list);
262                 if (ret == -1) {
263                         DEBUG(DEBUG_ALERT,("Unable to setup public address list\n"));
264                         exit(1);
265                 }
266         }
267
268         ret = ctdb_set_event_script_dir(ctdb, options.event_script_dir);
269         if (ret == -1) {
270                 DEBUG(DEBUG_ALERT,("Unable to setup event script directory\n"));
271                 exit(1);
272         }
273
274         ctdb->do_setsched = !options.no_setsched;
275
276         /* setup a environment variable for the event scripts to use to find the
277            installation directory */
278         setenv("CTDB_BASE", ETCDIR "/ctdb", 1);
279
280         /* start the protocol running (as a child) */
281         return ctdb_start_daemon(ctdb, interactive?False:True);
282 }