create a function "remote_ip" which can be used from scripts to remove a single ip...
[metze/ctdb/wip.git] / config / functions
1 # utility functions for ctdb event scripts
2
3 #######################################
4 # pull in a system config file, if any
5 loadconfig() {
6     name="$1"
7     if [ -f /etc/sysconfig/$name ]; then
8         . /etc/sysconfig/$name
9     elif [ -f /etc/default/$name ]; then
10         . /etc/default/$name
11     elif [ -f $CTDB_BASE/sysconfig/$name ]; then
12         . $CTDB_BASE/sysconfig/$name
13     fi
14 }
15
16 ##############################################################
17 # determine on what type of system (init style) we are running
18 detect_init_style() {
19     # only do detection if not already set:
20     test "x$CTDB_INIT_STYLE" != "x" && return
21
22     if [ -x /sbin/startproc ]; then
23         CTDB_INIT_STYLE="suse"
24     elif [ -x /sbin/start-stop-daemon ]; then
25         CTDB_INIT_STYLE="ubuntu"
26     else
27         CTDB_INIT_STYLE="redhat"
28     fi
29 }
30
31 ######################################################
32 # simulate /sbin/service on platforms that don't have it
33 service() { 
34   service_name="$1"
35   op="$2"
36
37   # do nothing, when no service was specified
38   test "x$service_name" = "x" && return
39
40   if [ -x /sbin/service ]; then
41       /sbin/service "$service_name" "$op"
42   elif [ -x /etc/init.d/$service_name ]; then
43       /etc/init.d/$service_name "$op"
44   elif [ -x /etc/rc.d/init.d/$service_name ]; then
45       /etc/rc.d/init.d/$service_name "$op"
46   fi
47 }
48
49 ######################################################
50 # simulate /sbin/service (niced) on platforms that don't have it
51 nice_service() { 
52   service_name="$1"
53   op="$2"
54
55   # do nothing, when no service was specified
56   test "x$service_name" = "x" && return
57
58   if [ -x /sbin/service ]; then
59       nice /sbin/service "$service_name" "$op"
60   elif [ -x /etc/init.d/$service_name ]; then
61       nice /etc/init.d/$service_name "$op"
62   elif [ -x /etc/rc.d/init.d/$service_name ]; then
63       nice /etc/rc.d/init.d/$service_name "$op"
64   fi
65 }
66
67 ######################################################
68 # wait for a command to return a zero exit status
69 # usage: ctdb_wait_command SERVICE_NAME <command>
70 ######################################################
71 ctdb_wait_command() {
72   service_name="$1"
73   wait_cmd="$2"
74   [ -z "$wait_cmd" ] && return;
75   all_ok=0
76   echo "Waiting for service $service_name to start"
77   while [ $all_ok -eq 0 ]; do
78           $wait_cmd > /dev/null 2>&1 && all_ok=1
79           ctdb status > /dev/null 2>&1 || {
80                 echo "ctdb daemon has died. Exiting wait for $service_name"
81                 exit 1
82           }
83           [ $all_ok -eq 1 ] || sleep 1
84   done
85   echo "Local service $service_name is up"
86 }
87
88
89 ######################################################
90 # wait for a set of tcp ports
91 # usage: ctdb_wait_tcp_ports SERVICE_NAME <ports...>
92 ######################################################
93 ctdb_wait_tcp_ports() {
94   service_name="$1"
95   shift
96   wait_ports="$*"
97   [ -z "$wait_ports" ] && return;
98   all_ok=0
99   echo "Waiting for tcp service $service_name to start"
100   while [ $all_ok -eq 0 ]; do
101           all_ok=1
102           for p in $wait_ports; do
103               if [ -x /usr/bin/netcat ]; then
104                   /usr/bin/netcat -z 127.0.0.1 $p > /dev/null || all_ok=0
105               elif [ -x /usr/bin/nc ]; then
106                   /usr/bin/nc -z 127.0.0.1 $p > /dev/null || all_ok=0
107               elif [ -x /usr/bin/netstat ]; then
108                   (netstat -a -n | egrep "0.0.0.0:$p[[:space:]]*LISTEN" > /dev/null) || all_ok=0
109               elif [ -x /bin/netstat ]; then
110                   (netstat -a -n | egrep "0.0.0.0:$p[[:space:]]*LISTEN" > /dev/null) || all_ok=0
111               else 
112                   echo "No tool to check tcp ports availabe. can not check in ctdb_wait_tcp_ports"
113                   return
114               fi
115           done
116           [ $all_ok -eq 1 ] || sleep 1
117           ctdb status > /dev/null 2>&1 || {
118                 echo "ctdb daemon has died. Exiting tcp wait $service_name"
119                 exit 1
120           }
121   done
122   echo "Local tcp services for $service_name are up"
123 }
124
125
126
127 ######################################################
128 # wait for a set of directories
129 # usage: ctdb_wait_directories SERVICE_NAME <directories...>
130 ######################################################
131 ctdb_wait_directories() {
132   service_name="$1"
133   shift
134   wait_dirs="$*"
135   [ -z "$wait_dirs" ] && return;
136   all_ok=0
137   echo "Waiting for local directories for $service_name"
138   while [ $all_ok -eq 0 ]; do
139           all_ok=1
140           for d in $wait_dirs; do
141               [ -d $d ] || all_ok=0
142           done
143           [ $all_ok -eq 1 ] || sleep 1
144           ctdb status > /dev/null 2>&1 || {
145                 echo "ctdb daemon has died. Exiting directory wait for $service_name"
146                 exit 1
147           }
148   done
149   echo "Local directories for $service_name are available"
150 }
151
152
153 ######################################################
154 # check that a rpc server is registered with portmap
155 # and responding to requests
156 # usage: ctdb_check_rpc SERVICE_NAME PROGNUM VERSION
157 ######################################################
158 ctdb_check_rpc() {
159     service_name="$1"
160     prognum="$2"
161     version="$3"
162     rpcinfo -u localhost $prognum $version > /dev/null || {
163             echo "ERROR: $service_name not responding to rpc requests"
164             exit 1
165     }
166 }
167
168 ######################################################
169 # check a set of directories is available
170 # return 0 on a missing directory
171 # usage: ctdb_check_directories_probe SERVICE_NAME <directories...>
172 ######################################################
173 ctdb_check_directories_probe() {
174   service_name="$1"
175   shift
176   wait_dirs="$*"
177   [ -z "$wait_dirs" ] && return;
178   for d in $wait_dirs; do
179       ( echo $d | grep -q '%' ) && continue
180       [ -d $d ] || return 1
181   done
182   return 0
183 }
184
185 ######################################################
186 # check a set of directories is available
187 # usage: ctdb_check_directories SERVICE_NAME <directories...>
188 ######################################################
189 ctdb_check_directories() {
190   service_name="$1"
191   shift
192   wait_dirs="$*"
193   ctdb_check_directories_probe "$service_name" $wait_dirs || {
194       echo "ERROR: $service_name directory $d not available"
195       exit 1
196   }
197 }
198
199 ######################################################
200 # check a set of tcp ports
201 # usage: ctdb_check_tcp_ports SERVICE_NAME <ports...>
202 ######################################################
203 ctdb_check_tcp_ports() {
204   service_name="$1"
205   shift
206   wait_ports="$*"
207   [ -z "$wait_ports" ] && return;
208
209   # check availability of netcat or netstat first
210   NETCAT=""
211   NETSTAT=""
212   if [ -x /usr/bin/netstat ]; then
213       NETSTAT=/usr/bin/netstat
214   elif [ -x /bin/netstat ]; then
215       NETSTAT=/bin/netstat
216   elif [ -x /usr/bin/netcat ]; then
217       NETCAT=/usr/bin/netcat
218   elif [ -x /bin/netcat ]; then
219       NETCAT=/bin/netcat
220   elif [ -x /usr/bin/nc ]; then
221       NETCAT=/usr/bin/nc
222   elif [ -x /bin/nc ]; then
223       NETCAT=/bin/nc
224   fi
225
226   for p in $wait_ports; do
227       all_ok=1
228
229       if [ "x${NETCAT}" != "x" ]; then
230           ${NETCAT} -z 127.0.0.1 $p > /dev/null || all_ok=0
231       elif [ "x${NETSTAT}" != "x" ]; then
232           if ! ${NETSTAT} -a -n | egrep "0.0.0.0:$p .*LISTEN" > /dev/null ; then
233               if ! ${NETSTAT} -a -n | egrep ":::$p .*LISTEN" > /dev/null ; then
234                   all_ok=0
235               fi
236           fi
237       else
238           echo "ERROR: neither netcat (or nc) nor netstat found!"
239           echo "ERROR: can't monitor ${service_name} tcp port ${p}"
240           all_ok=0
241       fi
242
243       [ $all_ok -eq 1 ] || {
244           echo "ERROR: $service_name tcp port $p is not responding"
245           exit 1
246       }
247   done
248 }
249
250 ######################################################
251 # check a command returns zero status
252 # usage: ctdb_check_command SERVICE_NAME <command>
253 ######################################################
254 ctdb_check_command() {
255   service_name="$1"
256   wait_cmd="$2"
257   [ -z "$wait_cmd" ] && return;
258   $wait_cmd > /dev/null 2>&1 || {
259       echo "ERROR: $service_name - $wait_cmd returned error"
260       exit 1
261   }
262 }
263
264 ################################################
265 # kill off any TCP connections with the given IP
266 ################################################
267 kill_tcp_connections() {
268     _IP="$1"    
269     _failed=0
270
271     _killcount=0
272     connfile="$CTDB_BASE/state/connections.$_IP"
273     netstat -tn |egrep "^tcp.*[[:space:]]+$_IP:.*ESTABLISHED" | awk '{print $4" "$5}' > $connfile
274     netstat -tn |egrep "^tcp.*[[:space:]]+::ffff:$_IP:.*ESTABLISHED" | awk '{print $4" "$5}' >> $connfile
275
276     while read dest src; do
277         srcip=`echo $src | sed -e "s/:[^:]*$//"`
278         srcport=`echo $src | sed -e "s/^.*://"`
279         destip=`echo $dest | sed -e "s/:[^:]*$//"`
280         destport=`echo $dest | sed -e "s/^.*://"`
281         echo "Killing TCP connection $srcip:$srcport $destip:$destport"
282         ctdb killtcp $srcip:$srcport $destip:$destport >/dev/null 2>&1 || _failed=1
283         case $destport in
284           # we only do one-way killtcp for NFS and CIFS
285           139|445|2049) : ;;
286           # for all others we do 2-way
287           *) 
288                 ctdb killtcp $destip:$destport $srcip:$srcport >/dev/null 2>&1 || _failed=1
289                 ;;
290         esac
291         _killcount=`expr $_killcount + 1`
292      done < $connfile
293     /bin/rm -f $connfile
294
295     [ $_failed = 0 ] || {
296         echo "Failed to send killtcp control"
297         return;
298     }
299     [ $_killcount -gt 0 ] || {
300         return;
301     }
302     _count=0
303     while netstat -tn |egrep "^tcp.*[[:space:]]+$_IP:.*ESTABLISHED" > /dev/null; do
304         sleep 1
305         _count=`expr $_count + 1`
306         [ $_count -gt 3 ] && {
307             echo "Timed out killing tcp connections for IP $_IP"
308             return;
309         }
310     done
311     echo "killed $_killcount TCP connections to released IP $_IP"
312 }
313
314 ##################################################################
315 # kill off the local end for any TCP connections with the given IP
316 ##################################################################
317 kill_tcp_connections_local_only() {
318     _IP="$1"    
319     _failed=0
320
321     _killcount=0
322     connfile="$CTDB_BASE/state/connections.$_IP"
323     netstat -tn |egrep "^tcp.*[[:space:]]+$_IP:.*ESTABLISHED" | awk '{print $4" "$5}' > $connfile
324     netstat -tn |egrep "^tcp.*[[:space:]]+::ffff:$_IP:.*ESTABLISHED" | awk '{print $4" "$5}' >> $connfile
325
326     while read dest src; do
327         srcip=`echo $src | sed -e "s/:[^:]*$//"`
328         srcport=`echo $src | sed -e "s/^.*://"`
329         destip=`echo $dest | sed -e "s/:[^:]*$//"`
330         destport=`echo $dest | sed -e "s/^.*://"`
331         echo "Killing TCP connection $srcip:$srcport $destip:$destport"
332         ctdb killtcp $srcip:$srcport $destip:$destport >/dev/null 2>&1 || _failed=1
333         _killcount=`expr $_killcount + 1`
334      done < $connfile
335     /bin/rm -f $connfile
336
337     [ $_failed = 0 ] || {
338         echo "Failed to send killtcp control"
339         return;
340     }
341     [ $_killcount -gt 0 ] || {
342         return;
343     }
344     _count=0
345     while netstat -tn |egrep "^tcp.*[[:space:]]+$_IP:.*ESTABLISHED" > /dev/null; do
346         sleep 1
347         _count=`expr $_count + 1`
348         [ $_count -gt 3 ] && {
349             echo "Timed out killing tcp connections for IP $_IP"
350             return;
351         }
352     done
353     echo "killed $_killcount TCP connections to released IP $_IP"
354 }
355
356 ########################################################
357 # start/stop the nfs service on different platforms
358 ########################################################
359 startstop_nfs() {
360         PLATFORM="unknown"
361         [ -x /etc/init.d/nfsserver ] && {
362                 PLATFORM="sles"
363         }
364         [ -x /etc/init.d/nfslock ] && {
365                 PLATFORM="rhel"
366         }
367
368         case $PLATFORM in
369         sles)
370                 case $1 in
371                 start)
372                         service nfsserver start
373                         ;;
374                 stop)
375                         service nfsserver stop > /dev/null 2>&1
376                         ;;
377                 esac
378                 ;;
379         rhel)
380                 case $1 in
381                 start)
382                         service nfslock start
383                         service nfs start
384                         ;;
385                 stop)
386                         service nfs stop > /dev/null 2>&1
387                         service nfslock stop > /dev/null 2>&1
388                         ;;
389                 esac
390                 ;;
391         *)
392                 echo "Unknown platform. NFS is not supported with ctdb"
393                 exit 1
394                 ;;
395         esac
396 }
397
398 ########################################################
399 # start/stop the nfs lockmanager service on different platforms
400 ########################################################
401 startstop_nfslock() {
402         PLATFORM="unknown"
403         [ -x /etc/init.d/nfsserver ] && {
404                 PLATFORM="sles"
405         }
406         [ -x /etc/init.d/nfslock ] && {
407                 PLATFORM="rhel"
408         }
409
410         case $PLATFORM in
411         sles)
412                 # for sles there is no service for lockmanager
413                 # so we instead just shutdown/restart nfs
414                 case $1 in
415                 start)
416                         service nfsserver start
417                         ;;
418                 stop)
419                         service nfsserver stop > /dev/null 2>&1
420                         ;;
421                 esac
422                 ;;
423         rhel)
424                 case $1 in
425                 start)
426                         service nfslock start
427                         ;;
428                 stop)
429                         service nfslock stop > /dev/null 2>&1
430                         ;;
431                 esac
432                 ;;
433         *)
434                 echo "Unknown platform. NFS locking is not supported with ctdb"
435                 exit 1
436                 ;;
437         esac
438 }
439
440 ########################################################
441 # remove an ip address from an interface
442 ########################################################
443 remove_ip() {
444         # the ip tool will delete all secondary IPs if this is the primary.
445         # To work around this _very_ annoying behaviour we have to keep a
446         # record of the secondaries and re-add them afterwards. yuck
447         secondaries=""
448         if ip addr list dev $2 primary | grep -q "inet $1 " ; then
449             secondaries=`ip addr list dev $2 secondary | grep " inet " | awk '{print $2}'`
450         fi
451         ip addr del $1 dev $2 >/dev/null 2>/dev/null || failed=1
452         [ -z "$secondaries" ] || {
453             for i in $secondaries; do
454                 if ip addr list dev $2 | grep -q "inet $i" ; then
455                     echo "kept secondary $i on dev $2"
456                 else 
457                     echo "re-adding secondary address $i to dev $2"
458                     ip addr add $i dev $2 || failed=1           
459                 fi
460             done
461         }
462 }
463
464 ########################################################
465 # load a site local config file
466 ########################################################
467
468 [ -x $CTDB_BASE/rc.local ] && {
469         . $CTDB_BASE/rc.local
470 }
471
472