Eventscripts: 10.interface should list configured interfaces
[obnox/samba/samba-obnox.git] / ctdb / config / events.d / 10.interface
1 #!/bin/sh
2
3 #################################
4 # interface event script for ctdb
5 # this adds/removes IPs from your 
6 # public interface
7
8 . $CTDB_BASE/functions
9 loadconfig
10
11 [ -z "$CTDB_PUBLIC_ADDRESSES" ] && {
12         CTDB_PUBLIC_ADDRESSES=$CTDB_BASE/public_addresses
13 }
14
15 [ ! -f "$CTDB_PUBLIC_ADDRESSES" ] && {
16         if [ "$1" = "init" ]; then
17                 echo "No public addresses file found. Nothing to do for 10.interfaces"
18         fi
19         exit 0
20 }
21
22 mark_up ()
23 {
24     up_interfaces_found=true
25     ctdb setifacelink $1 up >/dev/null 2>&1
26 }
27
28 mark_down ()
29 {
30     fail=true
31     ctdb setifacelink $1 down >/dev/null 2>&1
32 }
33
34 # This sets $all_interfaces as a side-effect.
35 get_all_interfaces ()
36 {
37     # Get all the interfaces listed in the public_addresses file
38     all_interfaces=$(sed -e "s/^[^\t ]*[\t ]*//" -e "s/,/ /g" -e "s/[\t ]*$//" $CTDB_PUBLIC_ADDRESSES)
39
40     # Add some special interfaces if they're defined
41     [ "$CTDB_PUBLIC_INTERFACE" ] && all_interfaces="$CTDB_PUBLIC_INTERFACE $all_interfaces"
42     [ "$CTDB_NATGW_PUBLIC_IFACE" ] && all_interfaces="$CTDB_NATGW_PUBLIC_IFACE $all_interfaces"
43
44     # Get the configured interfaces for each IP.  That is, for all but
45     # the 1st line, get the last field with commas changed to spaces.
46     ctdb_ifaces=$(ctdb -Y ip -v | sed -e '1d' -e 's/:$//' -e 's/^.*://' -e 's/,/ /g')
47
48     # Add $ctdb_interfaces and uniquify
49     all_interfaces=$(echo $all_interfaces $ctdb_ifaces | tr ' ' '\n' | sort -u)
50 }
51
52 monitor_interfaces()
53 {
54         get_all_interfaces
55
56         fail=false
57         up_interfaces_found=false
58
59         # Note that this loop must not exit early.  It must process
60         # all interfaces so that the correct state for each interface
61         # is set in CTDB using mark_up/mark_down.  If there is a
62         # problem with an interface then set fail=true and continue.
63         for iface in $all_interfaces ; do
64
65             ip addr show $iface 2>/dev/null >/dev/null || {
66                 echo "WARNING: Interface $iface does not exist but it is used by public addresses."
67                 continue
68             }
69
70             # These interfaces are sometimes bond devices
71             # When we use VLANs for bond interfaces, there will only
72             # be an entry in /proc for the underlying real interface
73             realiface=`echo $iface |sed -e 's/\..*$//'`
74             bi=$(get_proc "net/bonding/$realiface" 2>/dev/null) && {
75                 echo "$bi" | grep -q 'Currently Active Slave: None' && {
76                         echo "ERROR: No active slaves for bond device $realiface"
77                         mark_down $iface
78                         continue
79                 }
80                 echo "$bi" | grep -q '^MII Status: up' || {
81                         echo "ERROR: public network interface $realiface is down"
82                         mark_down $iface
83                         continue
84                 }
85                 echo "$bi" | grep -q '^Bonding Mode: IEEE 802.3ad Dynamic link aggregation' && {
86                         # This works around a bug in the driver where the
87                         # overall bond status can be up but none of the actual
88                         # physical interfaces have a link.
89                         echo "$bi" | grep 'MII Status:' | tail -n +2 | grep -q '^MII Status: up' || {
90                                 echo "ERROR: No active slaves for 802.ad bond device $realiface"
91                                 mark_down $iface
92                                 continue
93                         }
94                 }
95                 mark_up $iface
96                 continue
97             }
98
99             case $iface in
100             lo*)
101                 # loopback is always working
102                 mark_up $iface
103                 ;;
104             ib*)
105                 # we dont know how to test ib links
106                 mark_up $iface
107                 ;;
108             *)
109                 [ -z "$iface" ] || {
110                     [ "$(basename $(readlink /sys/class/net/$iface/device/driver) 2>/dev/null)" = virtio_net ] ||
111                     ethtool $iface | grep -q 'Link detected: yes' || {
112                         # On some systems, this is not successful when a
113                         # cable is plugged but the interface has not been
114                         # brought up previously. Bring the interface up and
115                         # try again...
116                         ip link set $iface up
117                         ethtool $iface | grep -q 'Link detected: yes' || {
118                             echo "ERROR: No link on the public network interface $iface"
119                             mark_down $iface
120                             continue
121                         }
122                     }
123                     mark_up $iface
124                 }
125                 ;;
126             esac
127
128         done
129
130         $fail || return 0
131
132         $up_interfaces_found && \
133             [ "$CTDB_PARTIALLY_ONLINE_INTERFACES" = "yes" ] && \
134             return 0
135
136         return 1
137 }
138
139 ctdb_check_args "$@"
140
141 case "$1" in 
142      #############################
143      # called when ctdbd starts up
144      init)
145         # make sure that we only respond to ARP messages from the NIC where
146         # a particular ip address is associated.
147         get_proc sys/net/ipv4/conf/all/arp_filter >/dev/null 2>&1 && {
148             set_proc sys/net/ipv4/conf/all/arp_filter 1
149         }
150         ;;
151
152      #############################
153      # called after ctdbd has done its initial recovery
154      # and we start the services to become healthy
155      startup)
156         monitor_interfaces
157         ;;
158
159
160      ################################################
161      # called when ctdbd wants to claim an IP address
162      takeip)
163         iface=$2
164         ip=$3
165         maskbits=$4
166
167         add_ip_to_iface $iface $ip $maskbits || {
168                 exit 1;
169         }
170
171         # cope with the script being killed while we have the interface blocked
172         iptables -D INPUT -i $iface -d $ip -j DROP 2> /dev/null
173
174         # flush our route cache
175         set_proc sys/net/ipv4/route/flush 1
176         ;;
177
178
179      ##################################################
180      # called when ctdbd wants to release an IP address
181      releaseip)
182         # releasing an IP is a bit more complex than it seems. Once the IP
183         # is released, any open tcp connections to that IP on this host will end
184         # up being stuck. Some of them (such as NFS connections) will be unkillable
185         # so we need to use the killtcp ctdb function to kill them off. We also
186         # need to make sure that no new connections get established while we are 
187         # doing this! So what we do is this:
188         # 1) firewall this IP, so no new external packets arrive for it
189         # 2) use netstat -tn to find existing connections, and kill them 
190         # 3) remove the IP from the interface
191         # 4) remove the firewall rule
192         iface=$2
193         ip=$3
194         maskbits=$4
195
196         failed=0
197         # we do an extra delete to cope with the script being killed
198         iptables -D INPUT -i $iface -d $ip -j DROP 2> /dev/null
199         iptables -I INPUT -i $iface -d $ip -j DROP
200         kill_tcp_connections $ip
201
202         delete_ip_from_iface $iface $ip $maskbits || {
203                 iptables -D INPUT -i $iface -d $ip -j DROP 2> /dev/null
204                 exit 1;
205         }
206
207         iptables -D INPUT -i $iface -d $ip -j DROP 2> /dev/null
208
209         # flush our route cache
210         set_proc sys/net/ipv4/route/flush 1
211         ;;
212
213      ##################################################
214      # called when ctdbd wants to update an IP address
215      updateip)
216         # moving an IP is a bit more complex than it seems.
217         # First we drop all traffic on the old interface.
218         # Then we try to add the ip to the new interface and before
219         # we finally remove it from the old interface.
220         #
221         # 1) firewall this IP, so no new external packets arrive for it
222         # 2) add the IP to the new interface
223         # 3) remove the IP from the old interface
224         # 4) remove the firewall rule
225         # 5) use ctdb gratiousarp to propagate the new mac address
226         # 6) use netstat -tn to find existing connections, and tickle them
227         oiface=$2
228         niface=$3
229         ip=$4
230         maskbits=$5
231
232         failed=0
233         # we do an extra delete to cope with the script being killed
234         iptables -D INPUT -i $oiface -d $ip -j DROP 2> /dev/null
235         iptables -I INPUT -i $oiface -d $ip -j DROP
236
237         delete_ip_from_iface $oiface $ip $maskbits 2>/dev/null
238         delete_ip_from_iface $niface $ip $maskbits 2>/dev/null
239
240         add_ip_to_iface $niface $ip $maskbits || {
241                 iptables -D INPUT -i $oiface -d $ip -j DROP 2> /dev/null
242                 exit 1;
243         }
244
245         # cope with the script being killed while we have the interface blocked
246         iptables -D INPUT -i $oiface -d $ip -j DROP 2> /dev/null
247
248         # flush our route cache
249         set_proc sys/net/ipv4/route/flush 1
250
251         # propagate the new mac address
252         ctdb gratiousarp $ip $niface
253
254         # tickle all existing connections, so that dropped packets
255         # are retransmited and the tcp streams work
256
257         tickle_tcp_connections $ip
258
259         ;;
260
261
262      ###########################################
263      # called when ctdbd has finished a recovery
264      recovered)
265         ;;
266
267      ####################################
268      # called when ctdbd is shutting down
269      shutdown)
270         ;;
271
272      monitor)
273         monitor_interfaces || exit 1
274         ;;
275     *)
276         ctdb_standard_event_handler "$@"
277         ;;
278 esac
279
280 exit 0
281