Restart recovery dameon if it looks like it hung.

author Ronnie Sahlberg <ronniesahlberg@gmail.com>

Thu, 3 Mar 2011 19:55:24 +0000 (06:55 +1100)

committer Ronnie Sahlberg <ronniesahlberg@gmail.com>

Sun, 6 Mar 2011 19:39:10 +0000 (06:39 +1100)
author Ronnie Sahlberg <ronniesahlberg@gmail.com>
Thu, 3 Mar 2011 19:55:24 +0000 (06:55 +1100)
committer Ronnie Sahlberg <ronniesahlberg@gmail.com>
Sun, 6 Mar 2011 19:39:10 +0000 (06:39 +1100)
diff --git a/ctdb/server/ctdb_recover.c b/ctdb/server/ctdb_recover.c

index 0cbd7dc3e20591a1c91f0ce5e7a4549501eb7efe..eb3bf0a50c7dca2f9cbb31304d64b0e6ed9a4c95 100644 (file)
--- a/ctdb/server/ctdb_recover.c
+++ b/ctdb/server/ctdb_recover.c
@@ -1197,18 +1197,10 @@ static void ctdb_recd_ping_timeout(struct event_context *ev, struct timed_event
                 return;
         }
  
-       DEBUG(DEBUG_ERR, ("Final timeout for recovery daemon ping. Shutting down ctdb daemon. (This can be caused if the cluster filesystem has hung)\n"));
+       DEBUG(DEBUG_ERR, ("Final timeout for recovery daemon ping. Restarting recovery daemon. (This can be caused if the cluster filesystem has hung)\n"));
  
         ctdb_stop_recoverd(ctdb);
-       ctdb_stop_keepalive(ctdb);
-       ctdb_stop_monitoring(ctdb);
-       ctdb_release_all_ips(ctdb);
-       if (ctdb->methods != NULL) {
-               ctdb->methods->shutdown(ctdb);
-       }
-       ctdb_event_script(ctdb, CTDB_EVENT_SHUTDOWN);
-       DEBUG(DEBUG_ERR, ("Recovery daemon ping timeout. Daemon has been shut down.\n"));
-       exit(0);
+       ctdb_start_recoverd(ctdb);
  }
  
  /* The recovery daemon will ping us at regular intervals.
author	Ronnie Sahlberg <ronniesahlberg@gmail.com>
	Thu, 3 Mar 2011 19:55:24 +0000 (06:55 +1100)
committer	Ronnie Sahlberg <ronniesahlberg@gmail.com>
	Sun, 6 Mar 2011 19:39:10 +0000 (06:39 +1100)