recoverd: Fix the implementation of CTDB_SRVID_REBALANCE_NODE

author Martin Schwenke <martin@meltin.net>

Wed, 4 Sep 2013 04:30:04 +0000 (14:30 +1000)

committer Amitay Isaacs <amitay@gmail.com>

Thu, 19 Sep 2013 02:54:31 +0000 (12:54 +1000)
author Martin Schwenke <martin@meltin.net>
Wed, 4 Sep 2013 04:30:04 +0000 (14:30 +1000)
committer Amitay Isaacs <amitay@gmail.com>
Thu, 19 Sep 2013 02:54:31 +0000 (12:54 +1000)
diff --git a/ctdb/include/ctdb_private.h b/ctdb/include/ctdb_private.h

index d300d8965512d7d8a86dfd0023fbbfaf64798066..8eab45f7ba1defc27728639c23e4b87ad80b25d6 100644 (file)
--- a/ctdb/include/ctdb_private.h
+++ b/ctdb/include/ctdb_private.h
@@ -1227,8 +1227,9 @@ int ctdb_set_single_public_ip(struct ctdb_context *ctdb,
  int ctdb_set_event_script(struct ctdb_context *ctdb, const char *script);
  int ctdb_set_event_script_dir(struct ctdb_context *ctdb, const char *script_dir);
  int ctdb_set_notification_script(struct ctdb_context *ctdb, const char *script);
-void lcp2_forcerebalance(struct ctdb_context *ctdb, uint32_t pnn);
-int ctdb_takeover_run(struct ctdb_context *ctdb, struct ctdb_node_map *nodemap, client_async_callback fail_callback, void *callback_data);
+int ctdb_takeover_run(struct ctdb_context *ctdb, struct ctdb_node_map *nodemap,
+                     uint32_t *force_rebalance_nodes,
+                     client_async_callback fail_callback, void *callback_data);
  
  int32_t ctdb_control_tcp_client(struct ctdb_context *ctdb, uint32_t client_id, 
                                 TDB_DATA indata);
diff --git a/ctdb/server/ctdb_recoverd.c b/ctdb/server/ctdb_recoverd.c

index abf6b7c3b79144a72c889a6bb2206400fc00717a..527190d2383cdf00006b6065e2e86f5d2acb4124 100644 (file)
--- a/ctdb/server/ctdb_recoverd.c
+++ b/ctdb/server/ctdb_recoverd.c
@@ -143,7 +143,7 @@ struct ctdb_recoverd {
         bool takeover_run_in_progress;
         TALLOC_CTX *takeover_runs_disable_ctx;
         struct ctdb_control_get_ifaces *ifaces;
-       TALLOC_CTX *deferred_rebalance_ctx;
+       uint32_t *force_rebalance_nodes;
  };
  
  #define CONTROL_TIMEOUT() timeval_current_ofs(ctdb->tunable.recover_timeout, 0)
@@ -1708,7 +1708,9 @@ static bool do_takeover_run(struct ctdb_recoverd *rec,
                 }
         }
  
-       ret = ctdb_takeover_run(rec->ctdb, nodemap, takeover_fail_callback,
+       ret = ctdb_takeover_run(rec->ctdb, nodemap,
+                               rec->force_rebalance_nodes,
+                               takeover_fail_callback,
                                 banning_credits_on_fail ? rec : NULL);
  
         /* Reenable takeover runs and IP checks on other nodes */
@@ -1728,6 +1730,8 @@ static bool do_takeover_run(struct ctdb_recoverd *rec,
         }
  
         ok = true;
+       /* Takeover run was successful so clear force rebalance targets */
+       TALLOC_FREE(rec->force_rebalance_nodes);
  done:
         rec->need_takeover_run = !ok;
         talloc_free(nodes);
@@ -2349,27 +2353,37 @@ static void reload_nodes_handler(struct ctdb_context *ctdb, uint64_t srvid,
  }
  
  
-static void ctdb_rebalance_timeout(struct event_context *ev, struct timed_event *te, 
-                                 struct timeval t, void *p)
+static void ctdb_rebalance_timeout(struct event_context *ev,
+                                  struct timed_event *te,
+                                  struct timeval t, void *p)
  {
         struct ctdb_recoverd *rec = talloc_get_type(p, struct ctdb_recoverd);
  
-       DEBUG(DEBUG_NOTICE,
-             ("Rebalance all nodes that have had ip assignment changes.\n"));
+       if (rec->force_rebalance_nodes == NULL) {
+               DEBUG(DEBUG_ERR,
+                     ("Rebalance timeout occurred - no nodes to rebalance\n"));
+               return;
+       }
  
+       DEBUG(DEBUG_NOTICE,
+             ("Rebalance timeout occurred - do takeover run\n"));
         do_takeover_run(rec, rec->nodemap, false);
-
-       talloc_free(rec->deferred_rebalance_ctx);
-       rec->deferred_rebalance_ctx = NULL;
  }
  
         
-static void recd_node_rebalance_handler(struct ctdb_context *ctdb, uint64_t srvid, 
-                            TDB_DATA data, void *private_data)
+static void recd_node_rebalance_handler(struct ctdb_context *ctdb,
+                                       uint64_t srvid,
+                                       TDB_DATA data, void *private_data)
  {
         uint32_t pnn;
+       uint32_t *t;
+       int len;
         struct ctdb_recoverd *rec = talloc_get_type(private_data, struct ctdb_recoverd);
  
+       if (rec->recmaster != ctdb_get_pnn(ctdb)) {
+               return;
+       }
+
         if (data.dsize != sizeof(uint32_t)) {
                 DEBUG(DEBUG_ERR,(__location__ " Incorrect size of node rebalance message. Was %zd but expected %zd bytes\n", data.dsize, sizeof(uint32_t)));
                 return;
@@ -2381,14 +2395,33 @@ static void recd_node_rebalance_handler(struct ctdb_context *ctdb, uint64_t srvi
  
         pnn = *(uint32_t *)&data.dptr[0];
  
-       lcp2_forcerebalance(ctdb, pnn);
-       DEBUG(DEBUG_NOTICE,("Received message to perform node rebalancing for node %d\n", pnn));
+       DEBUG(DEBUG_NOTICE,("Setting up rebalance of IPs to node %u\n", pnn));
  
-       if (rec->deferred_rebalance_ctx != NULL) {
-               talloc_free(rec->deferred_rebalance_ctx);
+       /* Copy any existing list of nodes.  There's probably some
+        * sort of realloc variant that will do this but we need to
+        * make sure that freeing the old array also cancels the timer
+        * event for the timeout... not sure if realloc will do that.
+        */
+       len = (rec->force_rebalance_nodes != NULL) ?
+               talloc_array_length(rec->force_rebalance_nodes) :
+               0;
+
+       /* This allows duplicates to be added but they don't cause
+        * harm.  A call to add a duplicate PNN arguably means that
+        * the timeout should be reset, so this is the simplest
+        * solution.
+        */
+       t = talloc_zero_array(rec, uint32_t, len+1);
+       CTDB_NO_MEMORY_VOID(ctdb, t);
+       if (len > 0) {
+               memcpy(t, rec->force_rebalance_nodes, sizeof(uint32_t) * len);
         }
-       rec->deferred_rebalance_ctx = talloc_new(rec);
-       event_add_timed(ctdb->ev, rec->deferred_rebalance_ctx, 
+       t[len] = pnn;
+
+       talloc_free(rec->force_rebalance_nodes);
+
+       rec->force_rebalance_nodes = t;
+       event_add_timed(ctdb->ev, rec->force_rebalance_nodes,
                         timeval_current_ofs(ctdb->tunable.deferred_rebalance_on_node_add, 0),
                         ctdb_rebalance_timeout, rec);
  }
@@ -3610,9 +3643,18 @@ static void main_loop(struct ctdb_context *ctdb, struct ctdb_recoverd *rec,
                 return;
         }
  
-       /* if we are not the recmaster we can safely ignore any ip reallocate requests */
+       /* If we are not the recmaster then do some housekeeping */
         if (rec->recmaster != pnn) {
+               /* Ignore any IP reallocate requests - only recmaster
+                * processes them
+                */
                 TALLOC_FREE(rec->reallocate_requests);
+               /* Clear any nodes that should be force rebalanced in
+                * the next takeover run.  If the recovery master role
+                * has moved then we don't want to process these some
+                * time in the future.
+                */
+               TALLOC_FREE(rec->force_rebalance_nodes);
         }
  
         /* This is a special case.  When recovery daemon is started, recmaster
diff --git a/ctdb/server/ctdb_takeover.c b/ctdb/server/ctdb_takeover.c

index 4a7cfd6e6f6bb8afca58d51fca9e7c4296202afc..4c4fc121cc421b1004f5adbb41ecfd31e28180b5 100644 (file)
--- a/ctdb/server/ctdb_takeover.c
+++ b/ctdb/server/ctdb_takeover.c
@@ -1733,38 +1733,10 @@ try_again:
         }
  }
  
-struct ctdb_rebalancenodes {
-       struct ctdb_rebalancenodes *next;
-       uint32_t pnn;
-};
-static struct ctdb_rebalancenodes *force_rebalance_list = NULL;
-
-
-/* set this flag to force the node to be rebalanced even if it just didnt
-   become healthy again.
-*/
-void lcp2_forcerebalance(struct ctdb_context *ctdb, uint32_t pnn)
-{
-       struct ctdb_rebalancenodes *rebalance;
-
-       for (rebalance = force_rebalance_list; rebalance; rebalance = rebalance->next) {
-               if (rebalance->pnn == pnn) {
-                       return;
-               }
-       }
-
-       rebalance = talloc(ctdb, struct ctdb_rebalancenodes);
-       rebalance->pnn = pnn;
-       rebalance->next = force_rebalance_list;
-       force_rebalance_list = rebalance;
-}
-
-/* Do necessary LCP2 initialisation.  Bury it in a function here so
- * that we can unit test it.
- */
  static void lcp2_init(struct ctdb_context *tmp_ctx,
                       struct ctdb_ipflags *ipflags,
                       struct ctdb_public_ip_list *all_ips,
+                     uint32_t *force_rebalance_nodes,
                       uint32_t **lcp2_imbalances,
                       bool **rebalance_candidates)
  {
@@ -1799,16 +1771,20 @@ static void lcp2_init(struct ctdb_context *tmp_ctx,
  
         /* 3rd step: if a node is forced to re-balance then
            we allow failback onto the node */
-       while (force_rebalance_list != NULL) {
-               struct ctdb_rebalancenodes *next = force_rebalance_list->next;
-
-               if (force_rebalance_list->pnn <= numnodes) {
-                       (*rebalance_candidates)[force_rebalance_list->pnn] = true;
+       if (force_rebalance_nodes == NULL) {
+               return;
+       }
+       for (i = 0; i < talloc_array_length(force_rebalance_nodes); i++) {
+               uint32_t pnn = force_rebalance_nodes[i];
+               if (pnn >= numnodes) {
+                       DEBUG(DEBUG_ERR,
+                             (__location__ "unknown node %u\n", pnn));
+                       continue;
                 }
  
-               DEBUG(DEBUG_ERR,("During ipreallocation, forced rebalance of node %d\n", force_rebalance_list->pnn));
-               talloc_free(force_rebalance_list);
-               force_rebalance_list = next;
+               DEBUG(DEBUG_NOTICE,
+                     ("Forcing rebalancing of IPs to node %u\n", pnn));
+               (*rebalance_candidates)[pnn] = true;
         }
  }
  
@@ -2182,7 +2158,8 @@ static void ip_alloc_nondeterministic_ips(struct ctdb_context *ctdb,
  
  static void ip_alloc_lcp2(struct ctdb_context *ctdb,
                           struct ctdb_ipflags *ipflags,
-                         struct ctdb_public_ip_list *all_ips)
+                         struct ctdb_public_ip_list *all_ips,
+                         uint32_t *force_rebalance_nodes)
  {
         uint32_t *lcp2_imbalances;
         bool *rebalance_candidates;
@@ -2191,7 +2168,7 @@ static void ip_alloc_lcp2(struct ctdb_context *ctdb,
  
         unassign_unsuitable_ips(ctdb, ipflags, all_ips);
  
-       lcp2_init(tmp_ctx, ipflags, all_ips,
+       lcp2_init(tmp_ctx, ipflags, all_ips,force_rebalance_nodes,
                   &lcp2_imbalances, &rebalance_candidates);
  
         lcp2_allocate_unassigned(ctdb, ipflags, all_ips, lcp2_imbalances);
@@ -2229,7 +2206,8 @@ static bool all_nodes_are_disabled(struct ctdb_node_map *nodemap)
  /* The calculation part of the IP allocation algorithm. */
  static void ctdb_takeover_run_core(struct ctdb_context *ctdb,
                                    struct ctdb_ipflags *ipflags,
-                                  struct ctdb_public_ip_list **all_ips_p)
+                                  struct ctdb_public_ip_list **all_ips_p,
+                                  uint32_t *force_rebalance_nodes)
  {
         /* since nodes only know about those public addresses that
            can be served by that particular node, no single node has
@@ -2242,7 +2220,7 @@ static void ctdb_takeover_run_core(struct ctdb_context *ctdb,
         *all_ips_p = create_merged_ip_list(ctdb);
  
          if (1 == ctdb->tunable.lcp2_public_ip_assignment) {
-               ip_alloc_lcp2(ctdb, ipflags, *all_ips_p);
+               ip_alloc_lcp2(ctdb, ipflags, *all_ips_p, force_rebalance_nodes);
         } else if (1 == ctdb->tunable.deterministic_public_ips) {
                 ip_alloc_deterministic_ips(ctdb, ipflags, *all_ips_p);
         } else {
@@ -2666,6 +2644,7 @@ static void takeover_run_fail_callback(struct ctdb_context *ctdb,
    make any IP alias changes for public addresses that are necessary 
   */
  int ctdb_takeover_run(struct ctdb_context *ctdb, struct ctdb_node_map *nodemap,
+                     uint32_t *force_rebalance_nodes,
                       client_async_callback fail_callback, void *callback_data)
  {
         int i, j, ret;
@@ -2701,7 +2680,7 @@ int ctdb_takeover_run(struct ctdb_context *ctdb, struct ctdb_node_map *nodemap,
         ZERO_STRUCT(ip);
  
         /* Do the IP reassignment calculations */
-       ctdb_takeover_run_core(ctdb, ipflags, &all_ips);
+       ctdb_takeover_run_core(ctdb, ipflags, &all_ips, force_rebalance_nodes);
  
         /* Now tell all nodes to release any public IPs should not
          * host.  This will be a NOOP on nodes that don't currently
diff --git a/ctdb/tests/src/ctdb_takeover_tests.c b/ctdb/tests/src/ctdb_takeover_tests.c

index 1aa06205235c84dadc5e5f172ef43db763a77dd5..7fd989eaf6e5fcf3e06420099c5c836d769a7111 100644 (file)
--- a/ctdb/tests/src/ctdb_takeover_tests.c
+++ b/ctdb/tests/src/ctdb_takeover_tests.c
@@ -512,7 +512,8 @@ void ctdb_test_lcp2_allocate_unassigned(const char nodestates[])
  
         ctdb_test_init(nodestates, &ctdb, &all_ips, &ipflags, false);
  
-       lcp2_init(ctdb, ipflags, all_ips, &lcp2_imbalances, &newly_healthy);
+       lcp2_init(ctdb, ipflags, all_ips, NULL,
+                 &lcp2_imbalances, &newly_healthy);
  
         lcp2_allocate_unassigned(ctdb, ipflags,
                                  all_ips, lcp2_imbalances);
@@ -534,7 +535,8 @@ void ctdb_test_lcp2_failback(const char nodestates[])
  
         ctdb_test_init(nodestates, &ctdb, &all_ips, &ipflags, false);
  
-       lcp2_init(ctdb, ipflags, all_ips, &lcp2_imbalances, &newly_healthy);
+       lcp2_init(ctdb, ipflags, all_ips, NULL,
+                 &lcp2_imbalances, &newly_healthy);
  
         lcp2_failback(ctdb, ipflags,
                       all_ips, lcp2_imbalances, newly_healthy);
@@ -556,7 +558,8 @@ void ctdb_test_lcp2_failback_loop(const char nodestates[])
  
         ctdb_test_init(nodestates, &ctdb, &all_ips, &ipflags, false);
  
-       lcp2_init(ctdb, ipflags, all_ips, &lcp2_imbalances, &newly_healthy);
+       lcp2_init(ctdb, ipflags, all_ips, NULL,
+                 &lcp2_imbalances, &newly_healthy);
  
         lcp2_failback(ctdb, ipflags,
                       all_ips, lcp2_imbalances, newly_healthy);
@@ -579,7 +582,7 @@ void ctdb_test_ctdb_takeover_run_core(const char nodestates[],
         ctdb_test_init(nodestates, &ctdb, &all_ips, &ipflags,
                        read_ips_for_multiple_nodes);
  
-       ctdb_takeover_run_core(ctdb, ipflags, &all_ips);
+       ctdb_takeover_run_core(ctdb, ipflags, &all_ips, NULL);
  
         print_ctdb_public_ip_list(all_ips);
author	Martin Schwenke <martin@meltin.net>
	Wed, 4 Sep 2013 04:30:04 +0000 (14:30 +1000)
committer	Amitay Isaacs <amitay@gmail.com>
	Thu, 19 Sep 2013 02:54:31 +0000 (12:54 +1000)
ctdb/include/ctdb_private.h		patch \| blob \| history
ctdb/server/ctdb_recoverd.c		patch \| blob \| history
ctdb/server/ctdb_takeover.c		patch \| blob \| history
ctdb/tests/src/ctdb_takeover_tests.c		patch \| blob \| history