mm/memory_hotplug: make remove_memory() take the device_hotplug_lock
[sfrench/cifs-2.6.git] / mm / memory_hotplug.c
index 38d94b703e9d4932279b5657a2c889dfaaf1b749..8f38e689da25730c0c38d35b3c6dc123d5989d51 100644 (file)
@@ -33,7 +33,6 @@
 #include <linux/stop_machine.h>
 #include <linux/hugetlb.h>
 #include <linux/memblock.h>
-#include <linux/bootmem.h>
 #include <linux/compaction.h>
 
 #include <asm/tlbflush.h>
@@ -687,62 +686,19 @@ static void node_states_check_changes_online(unsigned long nr_pages,
        struct zone *zone, struct memory_notify *arg)
 {
        int nid = zone_to_nid(zone);
-       enum zone_type zone_last = ZONE_NORMAL;
 
-       /*
-        * If we have HIGHMEM or movable node, node_states[N_NORMAL_MEMORY]
-        * contains nodes which have zones of 0...ZONE_NORMAL,
-        * set zone_last to ZONE_NORMAL.
-        *
-        * If we don't have HIGHMEM nor movable node,
-        * node_states[N_NORMAL_MEMORY] contains nodes which have zones of
-        * 0...ZONE_MOVABLE, set zone_last to ZONE_MOVABLE.
-        */
-       if (N_MEMORY == N_NORMAL_MEMORY)
-               zone_last = ZONE_MOVABLE;
+       arg->status_change_nid = -1;
+       arg->status_change_nid_normal = -1;
+       arg->status_change_nid_high = -1;
 
-       /*
-        * if the memory to be online is in a zone of 0...zone_last, and
-        * the zones of 0...zone_last don't have memory before online, we will
-        * need to set the node to node_states[N_NORMAL_MEMORY] after
-        * the memory is online.
-        */
-       if (zone_idx(zone) <= zone_last && !node_state(nid, N_NORMAL_MEMORY))
+       if (!node_state(nid, N_MEMORY))
+               arg->status_change_nid = nid;
+       if (zone_idx(zone) <= ZONE_NORMAL && !node_state(nid, N_NORMAL_MEMORY))
                arg->status_change_nid_normal = nid;
-       else
-               arg->status_change_nid_normal = -1;
-
 #ifdef CONFIG_HIGHMEM
-       /*
-        * If we have movable node, node_states[N_HIGH_MEMORY]
-        * contains nodes which have zones of 0...ZONE_HIGHMEM,
-        * set zone_last to ZONE_HIGHMEM.
-        *
-        * If we don't have movable node, node_states[N_NORMAL_MEMORY]
-        * contains nodes which have zones of 0...ZONE_MOVABLE,
-        * set zone_last to ZONE_MOVABLE.
-        */
-       zone_last = ZONE_HIGHMEM;
-       if (N_MEMORY == N_HIGH_MEMORY)
-               zone_last = ZONE_MOVABLE;
-
-       if (zone_idx(zone) <= zone_last && !node_state(nid, N_HIGH_MEMORY))
+       if (zone_idx(zone) <= N_HIGH_MEMORY && !node_state(nid, N_HIGH_MEMORY))
                arg->status_change_nid_high = nid;
-       else
-               arg->status_change_nid_high = -1;
-#else
-       arg->status_change_nid_high = arg->status_change_nid_normal;
 #endif
-
-       /*
-        * if the node don't have memory befor online, we will need to
-        * set the node to node_states[N_MEMORY] after the memory
-        * is online.
-        */
-       if (!node_state(nid, N_MEMORY))
-               arg->status_change_nid = nid;
-       else
-               arg->status_change_nid = -1;
 }
 
 static void node_states_set_node(int node, struct memory_notify *arg)
@@ -753,7 +709,8 @@ static void node_states_set_node(int node, struct memory_notify *arg)
        if (arg->status_change_nid_high >= 0)
                node_set_state(node, N_HIGH_MEMORY);
 
-       node_set_state(node, N_MEMORY);
+       if (arg->status_change_nid >= 0)
+               node_set_state(node, N_MEMORY);
 }
 
 static void __meminit resize_zone_range(struct zone *zone, unsigned long start_pfn,
@@ -1505,75 +1462,53 @@ static void node_states_check_changes_offline(unsigned long nr_pages,
 {
        struct pglist_data *pgdat = zone->zone_pgdat;
        unsigned long present_pages = 0;
-       enum zone_type zt, zone_last = ZONE_NORMAL;
+       enum zone_type zt;
 
-       /*
-        * If we have HIGHMEM or movable node, node_states[N_NORMAL_MEMORY]
-        * contains nodes which have zones of 0...ZONE_NORMAL,
-        * set zone_last to ZONE_NORMAL.
-        *
-        * If we don't have HIGHMEM nor movable node,
-        * node_states[N_NORMAL_MEMORY] contains nodes which have zones of
-        * 0...ZONE_MOVABLE, set zone_last to ZONE_MOVABLE.
-        */
-       if (N_MEMORY == N_NORMAL_MEMORY)
-               zone_last = ZONE_MOVABLE;
+       arg->status_change_nid = -1;
+       arg->status_change_nid_normal = -1;
+       arg->status_change_nid_high = -1;
 
        /*
-        * check whether node_states[N_NORMAL_MEMORY] will be changed.
-        * If the memory to be offline is in a zone of 0...zone_last,
-        * and it is the last present memory, 0...zone_last will
-        * become empty after offline , thus we can determind we will
-        * need to clear the node from node_states[N_NORMAL_MEMORY].
+        * Check whether node_states[N_NORMAL_MEMORY] will be changed.
+        * If the memory to be offline is within the range
+        * [0..ZONE_NORMAL], and it is the last present memory there,
+        * the zones in that range will become empty after the offlining,
+        * thus we can determine that we need to clear the node from
+        * node_states[N_NORMAL_MEMORY].
         */
-       for (zt = 0; zt <= zone_last; zt++)
+       for (zt = 0; zt <= ZONE_NORMAL; zt++)
                present_pages += pgdat->node_zones[zt].present_pages;
-       if (zone_idx(zone) <= zone_last && nr_pages >= present_pages)
+       if (zone_idx(zone) <= ZONE_NORMAL && nr_pages >= present_pages)
                arg->status_change_nid_normal = zone_to_nid(zone);
-       else
-               arg->status_change_nid_normal = -1;
 
 #ifdef CONFIG_HIGHMEM
        /*
-        * If we have movable node, node_states[N_HIGH_MEMORY]
-        * contains nodes which have zones of 0...ZONE_HIGHMEM,
-        * set zone_last to ZONE_HIGHMEM.
-        *
-        * If we don't have movable node, node_states[N_NORMAL_MEMORY]
-        * contains nodes which have zones of 0...ZONE_MOVABLE,
-        * set zone_last to ZONE_MOVABLE.
+        * node_states[N_HIGH_MEMORY] contains nodes which
+        * have normal memory or high memory.
+        * Here we add the present_pages belonging to ZONE_HIGHMEM.
+        * If the zone is within the range of [0..ZONE_HIGHMEM), and
+        * we determine that the zones in that range become empty,
+        * we need to clear the node for N_HIGH_MEMORY.
         */
-       zone_last = ZONE_HIGHMEM;
-       if (N_MEMORY == N_HIGH_MEMORY)
-               zone_last = ZONE_MOVABLE;
-
-       for (; zt <= zone_last; zt++)
-               present_pages += pgdat->node_zones[zt].present_pages;
-       if (zone_idx(zone) <= zone_last && nr_pages >= present_pages)
+       present_pages += pgdat->node_zones[ZONE_HIGHMEM].present_pages;
+       if (zone_idx(zone) <= ZONE_HIGHMEM && nr_pages >= present_pages)
                arg->status_change_nid_high = zone_to_nid(zone);
-       else
-               arg->status_change_nid_high = -1;
-#else
-       arg->status_change_nid_high = arg->status_change_nid_normal;
 #endif
 
        /*
-        * node_states[N_HIGH_MEMORY] contains nodes which have 0...ZONE_MOVABLE
+        * We have accounted the pages from [0..ZONE_NORMAL), and
+        * in case of CONFIG_HIGHMEM the pages from ZONE_HIGHMEM
+        * as well.
+        * Here we count the possible pages from ZONE_MOVABLE.
+        * If after having accounted all the pages, we see that the nr_pages
+        * to be offlined is over or equal to the accounted pages,
+        * we know that the node will become empty, and so, we can clear
+        * it for N_MEMORY as well.
         */
-       zone_last = ZONE_MOVABLE;
+       present_pages += pgdat->node_zones[ZONE_MOVABLE].present_pages;
 
-       /*
-        * check whether node_states[N_HIGH_MEMORY] will be changed
-        * If we try to offline the last present @nr_pages from the node,
-        * we can determind we will need to clear the node from
-        * node_states[N_HIGH_MEMORY].
-        */
-       for (; zt <= zone_last; zt++)
-               present_pages += pgdat->node_zones[zt].present_pages;
        if (nr_pages >= present_pages)
                arg->status_change_nid = zone_to_nid(zone);
-       else
-               arg->status_change_nid = -1;
 }
 
 static void node_states_clear_node(int node, struct memory_notify *arg)
@@ -1581,12 +1516,10 @@ static void node_states_clear_node(int node, struct memory_notify *arg)
        if (arg->status_change_nid_normal >= 0)
                node_clear_state(node, N_NORMAL_MEMORY);
 
-       if ((N_MEMORY != N_NORMAL_MEMORY) &&
-           (arg->status_change_nid_high >= 0))
+       if (arg->status_change_nid_high >= 0)
                node_clear_state(node, N_HIGH_MEMORY);
 
-       if ((N_MEMORY != N_HIGH_MEMORY) &&
-           (arg->status_change_nid >= 0))
+       if (arg->status_change_nid >= 0)
                node_clear_state(node, N_MEMORY);
 }
 
@@ -1873,7 +1806,7 @@ EXPORT_SYMBOL(try_offline_node);
  * and online/offline operations before this call, as required by
  * try_offline_node().
  */
-void __ref remove_memory(int nid, u64 start, u64 size)
+void __ref __remove_memory(int nid, u64 start, u64 size)
 {
        int ret;
 
@@ -1902,5 +1835,12 @@ void __ref remove_memory(int nid, u64 start, u64 size)
 
        mem_hotplug_done();
 }
+
+void remove_memory(int nid, u64 start, u64 size)
+{
+       lock_device_hotplug();
+       __remove_memory(nid, start, size);
+       unlock_device_hotplug();
+}
 EXPORT_SYMBOL_GPL(remove_memory);
 #endif /* CONFIG_MEMORY_HOTREMOVE */