Merge tag 'for-5.16/block-2021-11-09' of git://git.kernel.dk/linux-block

author Linus Torvalds <torvalds@linux-foundation.org>

Tue, 9 Nov 2021 19:20:07 +0000 (11:20 -0800)

committer Linus Torvalds <torvalds@linux-foundation.org>

Tue, 9 Nov 2021 19:20:07 +0000 (11:20 -0800)
author Linus Torvalds <torvalds@linux-foundation.org>
Tue, 9 Nov 2021 19:20:07 +0000 (11:20 -0800)
committer Linus Torvalds <torvalds@linux-foundation.org>
Tue, 9 Nov 2021 19:20:07 +0000 (11:20 -0800)
diff --git a/block/blk-core.c b/block/blk-core.c

index ac1de7d73a45d9bad71d4d6f14867fd5e03b06d7..b043de2baaace25fff87630844dbb147305a29a2 100644 (file)
--- a/block/blk-core.c
+++ b/block/blk-core.c
@@ -386,30 +386,6 @@ void blk_cleanup_queue(struct request_queue *q)
  }
  EXPORT_SYMBOL(blk_cleanup_queue);
  
-static bool blk_try_enter_queue(struct request_queue *q, bool pm)
-{
-       rcu_read_lock();
-       if (!percpu_ref_tryget_live_rcu(&q->q_usage_counter))
-               goto fail;
-
-       /*
-        * The code that increments the pm_only counter must ensure that the
-        * counter is globally visible before the queue is unfrozen.
-        */
-       if (blk_queue_pm_only(q) &&
-           (!pm || queue_rpm_status(q) == RPM_SUSPENDED))
-               goto fail_put;
-
-       rcu_read_unlock();
-       return true;
-
-fail_put:
-       blk_queue_exit(q);
-fail:
-       rcu_read_unlock();
-       return false;
-}
-
  /**
   * blk_queue_enter() - try to increase q->q_usage_counter
   * @q: request queue pointer
@@ -442,10 +418,8 @@ int blk_queue_enter(struct request_queue *q, blk_mq_req_flags_t flags)
         return 0;
  }
  
-static inline int bio_queue_enter(struct bio *bio)
+int __bio_queue_enter(struct request_queue *q, struct bio *bio)
  {
-       struct request_queue *q = bdev_get_queue(bio->bi_bdev);
-
         while (!blk_try_enter_queue(q, false)) {
                 struct gendisk *disk = bio->bi_bdev->bd_disk;
  
@@ -742,7 +716,7 @@ static inline blk_status_t blk_check_zone_append(struct request_queue *q,
         return BLK_STS_OK;
  }
  
-static noinline_for_stack bool submit_bio_checks(struct bio *bio)
+noinline_for_stack bool submit_bio_checks(struct bio *bio)
  {
         struct block_device *bdev = bio->bi_bdev;
         struct request_queue *q = bdev_get_queue(bdev);
@@ -860,22 +834,23 @@ end_io:
         return false;
  }
  
-static void __submit_bio(struct bio *bio)
+static void __submit_bio_fops(struct gendisk *disk, struct bio *bio)
  {
-       struct gendisk *disk = bio->bi_bdev->bd_disk;
-
         if (unlikely(bio_queue_enter(bio) != 0))
                 return;
+       if (submit_bio_checks(bio) && blk_crypto_bio_prep(&bio))
+               disk->fops->submit_bio(bio);
+       blk_queue_exit(disk->queue);
+}
  
-       if (!submit_bio_checks(bio) || !blk_crypto_bio_prep(&bio))
-               goto queue_exit;
-       if (!disk->fops->submit_bio) {
+static void __submit_bio(struct bio *bio)
+{
+       struct gendisk *disk = bio->bi_bdev->bd_disk;
+
+       if (!disk->fops->submit_bio)
                 blk_mq_submit_bio(bio);
-               return;
-       }
-       disk->fops->submit_bio(bio);
-queue_exit:
-       blk_queue_exit(disk->queue);
+       else
+               __submit_bio_fops(disk, bio);
  }
  
  /*
@@ -1615,7 +1590,13 @@ void blk_flush_plug(struct blk_plug *plug, bool from_schedule)
                 flush_plug_callbacks(plug, from_schedule);
         if (!rq_list_empty(plug->mq_list))
                 blk_mq_flush_plug_list(plug, from_schedule);
-       if (unlikely(!from_schedule && plug->cached_rq))
+       /*
+        * Unconditionally flush out cached requests, even if the unplug
+        * event came from schedule. Since we know hold references to the
+        * queue for cached requests, we don't want a blocked task holding
+        * up a queue freeze/quiesce event.
+        */
+       if (unlikely(!rq_list_empty(plug->cached_rq)))
                 blk_mq_free_plug_rqs(plug);
  }
  
diff --git a/block/blk-merge.c b/block/blk-merge.c

index df69f4bb771724a86ed59315ac12ab4b42b449e5..893c1a60b701f19eb2f565b8133fa3a4bb96f017 100644 (file)
--- a/block/blk-merge.c
+++ b/block/blk-merge.c
@@ -1101,9 +1101,11 @@ bool blk_attempt_plug_merge(struct request_queue *q, struct bio *bio,
                  * the same queue, there should be only one such rq in a queue
                  */
                 *same_queue_rq = true;
+
+               if (blk_attempt_bio_merge(q, rq, bio, nr_segs, false) ==
+                               BIO_MERGE_OK)
+                       return true;
         }
-       if (blk_attempt_bio_merge(q, rq, bio, nr_segs, false) == BIO_MERGE_OK)
-               return true;
         return false;
  }
  
diff --git a/block/blk-mq-debugfs.c b/block/blk-mq-debugfs.c

index f5076c173477335261f5462a6bb0709d0090896f..4f2cf8399f3de31aae7a26e19c3ab35b98b9626b 100644 (file)
--- a/block/blk-mq-debugfs.c
+++ b/block/blk-mq-debugfs.c
@@ -308,6 +308,7 @@ static const char *const rqf_name[] = {
         RQF_NAME(SPECIAL_PAYLOAD),
         RQF_NAME(ZONE_WRITE_LOCKED),
         RQF_NAME(MQ_POLL_SLEPT),
+       RQF_NAME(ELV),
  };
  #undef RQF_NAME
  
diff --git a/block/blk-mq-sched.c b/block/blk-mq-sched.c

index c62b966dfaba5054b19cd6893aadbaf067344a37..4be652fa38e78b1aa879f415bbebbacd2318131d 100644 (file)
--- a/block/blk-mq-sched.c
+++ b/block/blk-mq-sched.c
@@ -370,15 +370,20 @@ bool blk_mq_sched_bio_merge(struct request_queue *q, struct bio *bio,
         bool ret = false;
         enum hctx_type type;
  
-       if (e && e->type->ops.bio_merge)
-               return e->type->ops.bio_merge(q, bio, nr_segs);
+       if (bio_queue_enter(bio))
+               return false;
+
+       if (e && e->type->ops.bio_merge) {
+               ret = e->type->ops.bio_merge(q, bio, nr_segs);
+               goto out_put;
+       }
  
         ctx = blk_mq_get_ctx(q);
         hctx = blk_mq_map_queue(q, bio->bi_opf, ctx);
         type = hctx->type;
         if (!(hctx->flags & BLK_MQ_F_SHOULD_MERGE) ||
             list_empty_careful(&ctx->rq_lists[type]))
-               return false;
+               goto out_put;
  
         /* default per sw-queue merge */
         spin_lock(&ctx->lock);
@@ -391,6 +396,8 @@ bool blk_mq_sched_bio_merge(struct request_queue *q, struct bio *bio,
                 ret = true;
  
         spin_unlock(&ctx->lock);
+out_put:
+       blk_queue_exit(q);
         return ret;
  }
  
@@ -497,7 +504,7 @@ void blk_mq_sched_insert_requests(struct blk_mq_hw_ctx *hctx,
                  * busy in case of 'none' scheduler, and this way may save
                  * us one extra enqueue & dequeue to sw queue.
                  */
-               if (!hctx->dispatch_busy && !e && !run_queue_async) {
+               if (!hctx->dispatch_busy && !run_queue_async) {
                         blk_mq_try_issue_list_directly(hctx, list);
                         if (list_empty(list))
                                 goto out;
diff --git a/block/blk-mq.c b/block/blk-mq.c

index 07eb1412760b00d3827668b92fd992e971d52405..629cf421417f0669062b64d0fb0bd47112814c2d 100644 (file)
--- a/block/blk-mq.c
+++ b/block/blk-mq.c
@@ -251,22 +251,18 @@ void blk_mq_quiesce_queue_nowait(struct request_queue *q)
  EXPORT_SYMBOL_GPL(blk_mq_quiesce_queue_nowait);
  
  /**
- * blk_mq_quiesce_queue() - wait until all ongoing dispatches have finished
+ * blk_mq_wait_quiesce_done() - wait until in-progress quiesce is done
   * @q: request queue.
   *
- * Note: this function does not prevent that the struct request end_io()
- * callback function is invoked. Once this function is returned, we make
- * sure no dispatch can happen until the queue is unquiesced via
- * blk_mq_unquiesce_queue().
+ * Note: it is driver's responsibility for making sure that quiesce has
+ * been started.
   */
-void blk_mq_quiesce_queue(struct request_queue *q)
+void blk_mq_wait_quiesce_done(struct request_queue *q)
  {
         struct blk_mq_hw_ctx *hctx;
         unsigned int i;
         bool rcu = false;
  
-       blk_mq_quiesce_queue_nowait(q);
-
         queue_for_each_hw_ctx(q, hctx, i) {
                 if (hctx->flags & BLK_MQ_F_BLOCKING)
                         synchronize_srcu(hctx->srcu);
@@ -276,6 +272,22 @@ void blk_mq_quiesce_queue(struct request_queue *q)
         if (rcu)
                 synchronize_rcu();
  }
+EXPORT_SYMBOL_GPL(blk_mq_wait_quiesce_done);
+
+/**
+ * blk_mq_quiesce_queue() - wait until all ongoing dispatches have finished
+ * @q: request queue.
+ *
+ * Note: this function does not prevent that the struct request end_io()
+ * callback function is invoked. Once this function is returned, we make
+ * sure no dispatch can happen until the queue is unquiesced via
+ * blk_mq_unquiesce_queue().
+ */
+void blk_mq_quiesce_queue(struct request_queue *q)
+{
+       blk_mq_quiesce_queue_nowait(q);
+       blk_mq_wait_quiesce_done(q);
+}
  EXPORT_SYMBOL_GPL(blk_mq_quiesce_queue);
  
  /*
@@ -405,12 +417,15 @@ __blk_mq_alloc_requests_batch(struct blk_mq_alloc_data *data,
         for (i = 0; tag_mask; i++) {
                 if (!(tag_mask & (1UL << i)))
                         continue;
-               prefetch(tags->static_rqs[tag]);
                 tag = tag_offset + i;
+               prefetch(tags->static_rqs[tag]);
                 tag_mask &= ~(1UL << i);
                 rq = blk_mq_rq_ctx_init(data, tags, tag, alloc_time_ns);
                 rq_list_add(data->cached_rq, rq);
+               nr++;
         }
+       /* caller already holds a reference, add for remainder */
+       percpu_ref_get_many(&data->q->q_usage_counter, nr - 1);
         data->nr_tags -= nr;
  
         return rq_list_pop(data->cached_rq);
@@ -419,7 +434,6 @@ __blk_mq_alloc_requests_batch(struct blk_mq_alloc_data *data,
  static struct request *__blk_mq_alloc_requests(struct blk_mq_alloc_data *data)
  {
         struct request_queue *q = data->q;
-       struct elevator_queue *e = q->elevator;
         u64 alloc_time_ns = 0;
         struct request *rq;
         unsigned int tag;
@@ -431,7 +445,11 @@ static struct request *__blk_mq_alloc_requests(struct blk_mq_alloc_data *data)
         if (data->cmd_flags & REQ_NOWAIT)
                 data->flags |= BLK_MQ_REQ_NOWAIT;
  
-       if (e) {
+       if (q->elevator) {
+               struct elevator_queue *e = q->elevator;
+
+               data->rq_flags |= RQF_ELV;
+
                 /*
                  * Flush/passthrough requests are special and go directly to the
                  * dispatch list. Don't include reserved tags in the
@@ -447,7 +465,7 @@ static struct request *__blk_mq_alloc_requests(struct blk_mq_alloc_data *data)
  retry:
         data->ctx = blk_mq_get_ctx(q);
         data->hctx = blk_mq_map_queue(q, data->cmd_flags, data->ctx);
-       if (!e)
+       if (!(data->rq_flags & RQF_ELV))
                 blk_mq_tag_busy(data->hctx);
  
         /*
@@ -490,7 +508,6 @@ struct request *blk_mq_alloc_request(struct request_queue *q, unsigned int op,
                 .q              = q,
                 .flags          = flags,
                 .cmd_flags      = op,
-               .rq_flags       = q->elevator ? RQF_ELV : 0,
                 .nr_tags        = 1,
         };
         struct request *rq;
@@ -520,7 +537,6 @@ struct request *blk_mq_alloc_request_hctx(struct request_queue *q,
                 .q              = q,
                 .flags          = flags,
                 .cmd_flags      = op,
-               .rq_flags       = q->elevator ? RQF_ELV : 0,
                 .nr_tags        = 1,
         };
         u64 alloc_time_ns = 0;
@@ -561,6 +577,8 @@ struct request *blk_mq_alloc_request_hctx(struct request_queue *q,
  
         if (!q->elevator)
                 blk_mq_tag_busy(data.hctx);
+       else
+               data.rq_flags |= RQF_ELV;
  
         ret = -EWOULDBLOCK;
         tag = blk_mq_get_tag(&data);
@@ -627,10 +645,8 @@ void blk_mq_free_plug_rqs(struct blk_plug *plug)
  {
         struct request *rq;
  
-       while ((rq = rq_list_pop(&plug->cached_rq)) != NULL) {
-               percpu_ref_get(&rq->q->q_usage_counter);
+       while ((rq = rq_list_pop(&plug->cached_rq)) != NULL)
                 blk_mq_free_request(rq);
-       }
  }
  
  static void req_bio_endio(struct request *rq, struct bio *bio,
@@ -815,6 +831,13 @@ static inline void blk_mq_flush_tag_batch(struct blk_mq_hw_ctx *hctx,
  {
         struct request_queue *q = hctx->queue;
  
+       /*
+        * All requests should have been marked as RQF_MQ_INFLIGHT, so
+        * update hctx->nr_active in batch
+        */
+       if (hctx->flags & BLK_MQ_F_TAG_QUEUE_SHARED)
+               __blk_mq_sub_active_requests(hctx, nr_tags);
+
         blk_mq_put_tags(hctx->tags, tag_array, nr_tags);
         percpu_ref_put_many(&q->q_usage_counter, nr_tags);
  }
@@ -2232,7 +2255,7 @@ void blk_mq_flush_plug_list(struct blk_plug *plug, bool from_schedule)
         plug->rq_count = 0;
  
         if (!plug->multiple_queues && !plug->has_elevator && !from_schedule) {
-               blk_mq_plug_issue_direct(plug, from_schedule);
+               blk_mq_plug_issue_direct(plug, false);
                 if (rq_list_empty(plug->mq_list))
                         return;
         }
@@ -2472,6 +2495,83 @@ static inline unsigned short blk_plug_max_rq_count(struct blk_plug *plug)
         return BLK_MAX_REQUEST_COUNT;
  }
  
+static bool blk_attempt_bio_merge(struct request_queue *q, struct bio *bio,
+                                 unsigned int nr_segs, bool *same_queue_rq)
+{
+       if (!blk_queue_nomerges(q) && bio_mergeable(bio)) {
+               if (blk_attempt_plug_merge(q, bio, nr_segs, same_queue_rq))
+                       return true;
+               if (blk_mq_sched_bio_merge(q, bio, nr_segs))
+                       return true;
+       }
+       return false;
+}
+
+static struct request *blk_mq_get_new_requests(struct request_queue *q,
+                                              struct blk_plug *plug,
+                                              struct bio *bio,
+                                              unsigned int nsegs,
+                                              bool *same_queue_rq)
+{
+       struct blk_mq_alloc_data data = {
+               .q              = q,
+               .nr_tags        = 1,
+               .cmd_flags      = bio->bi_opf,
+       };
+       struct request *rq;
+
+       if (unlikely(bio_queue_enter(bio)))
+               return NULL;
+       if (unlikely(!submit_bio_checks(bio)))
+               goto put_exit;
+       if (blk_attempt_bio_merge(q, bio, nsegs, same_queue_rq))
+               goto put_exit;
+
+       rq_qos_throttle(q, bio);
+
+       if (plug) {
+               data.nr_tags = plug->nr_ios;
+               plug->nr_ios = 1;
+               data.cached_rq = &plug->cached_rq;
+       }
+
+       rq = __blk_mq_alloc_requests(&data);
+       if (rq)
+               return rq;
+
+       rq_qos_cleanup(q, bio);
+       if (bio->bi_opf & REQ_NOWAIT)
+               bio_wouldblock_error(bio);
+put_exit:
+       blk_queue_exit(q);
+       return NULL;
+}
+
+static inline struct request *blk_mq_get_request(struct request_queue *q,
+                                                struct blk_plug *plug,
+                                                struct bio *bio,
+                                                unsigned int nsegs,
+                                                bool *same_queue_rq)
+{
+       if (plug) {
+               struct request *rq;
+
+               rq = rq_list_peek(&plug->cached_rq);
+               if (rq && rq->q == q) {
+                       if (unlikely(!submit_bio_checks(bio)))
+                               return NULL;
+                       if (blk_attempt_bio_merge(q, bio, nsegs, same_queue_rq))
+                               return NULL;
+                       plug->cached_rq = rq_list_next(rq);
+                       INIT_LIST_HEAD(&rq->queuelist);
+                       rq_qos_throttle(q, bio);
+                       return rq;
+               }
+       }
+
+       return blk_mq_get_new_requests(q, plug, bio, nsegs, same_queue_rq);
+}
+
  /**
   * blk_mq_submit_bio - Create and send a request to block device.
   * @bio: Bio pointer.
@@ -2495,47 +2595,20 @@ void blk_mq_submit_bio(struct bio *bio)
         unsigned int nr_segs = 1;
         blk_status_t ret;
  
+       if (unlikely(!blk_crypto_bio_prep(&bio)))
+               return;
+
         blk_queue_bounce(q, &bio);
         if (blk_may_split(q, bio))
                 __blk_queue_split(q, &bio, &nr_segs);
  
         if (!bio_integrity_prep(bio))
-               goto queue_exit;
-
-       if (!blk_queue_nomerges(q) && bio_mergeable(bio)) {
-               if (blk_attempt_plug_merge(q, bio, nr_segs, &same_queue_rq))
-                       goto queue_exit;
-               if (blk_mq_sched_bio_merge(q, bio, nr_segs))
-                       goto queue_exit;
-       }
-
-       rq_qos_throttle(q, bio);
+               return;
  
         plug = blk_mq_plug(q, bio);
-       if (plug && plug->cached_rq) {
-               rq = rq_list_pop(&plug->cached_rq);
-               INIT_LIST_HEAD(&rq->queuelist);
-       } else {
-               struct blk_mq_alloc_data data = {
-                       .q              = q,
-                       .nr_tags        = 1,
-                       .cmd_flags      = bio->bi_opf,
-                       .rq_flags       = q->elevator ? RQF_ELV : 0,
-               };
-
-               if (plug) {
-                       data.nr_tags = plug->nr_ios;
-                       plug->nr_ios = 1;
-                       data.cached_rq = &plug->cached_rq;
-               }
-               rq = __blk_mq_alloc_requests(&data);
-               if (unlikely(!rq)) {
-                       rq_qos_cleanup(q, bio);
-                       if (bio->bi_opf & REQ_NOWAIT)
-                               bio_wouldblock_error(bio);
-                       goto queue_exit;
-               }
-       }
+       rq = blk_mq_get_request(q, plug, bio, nr_segs, &same_queue_rq);
+       if (unlikely(!rq))
+               return;
  
         trace_block_getrq(bio);
  
@@ -2616,10 +2689,6 @@ void blk_mq_submit_bio(struct bio *bio)
                 /* Default case. */
                 blk_mq_sched_insert_request(rq, false, true, true);
         }
-
-       return;
-queue_exit:
-       blk_queue_exit(q);
  }
  
  static size_t order_to_size(unsigned int order)
@@ -3605,7 +3674,6 @@ static void blk_mq_realloc_hw_ctxs(struct blk_mq_tag_set *set,
                 struct blk_mq_hw_ctx *hctx = hctxs[j];
  
                 if (hctx) {
-                       __blk_mq_free_map_and_rqs(set, j);
                         blk_mq_exit_hctx(q, set, hctx, j);
                         hctxs[j] = NULL;
                 }
@@ -4113,8 +4181,13 @@ fallback:
         list_for_each_entry(q, &set->tag_list, tag_set_list) {
                 blk_mq_realloc_hw_ctxs(set, q);
                 if (q->nr_hw_queues != set->nr_hw_queues) {
+                       int i = prev_nr_hw_queues;
+
                         pr_warn("Increasing nr_hw_queues to %d fails, fallback to %d\n",
                                         nr_hw_queues, prev_nr_hw_queues);
+                       for (; i < set->nr_hw_queues; i++)
+                               __blk_mq_free_map_and_rqs(set, i);
+
                         set->nr_hw_queues = prev_nr_hw_queues;
                         blk_mq_map_queues(&set->map[HCTX_TYPE_DEFAULT]);
                         goto fallback;
diff --git a/block/blk-mq.h b/block/blk-mq.h

index 28859fc5faee549207a7adbcbf638f476ec444ca..cb0b5482ca5e10e12311330bb74e7bc206931af6 100644 (file)
--- a/block/blk-mq.h
+++ b/block/blk-mq.h
@@ -225,12 +225,18 @@ static inline void __blk_mq_inc_active_requests(struct blk_mq_hw_ctx *hctx)
                 atomic_inc(&hctx->nr_active);
  }
  
-static inline void __blk_mq_dec_active_requests(struct blk_mq_hw_ctx *hctx)
+static inline void __blk_mq_sub_active_requests(struct blk_mq_hw_ctx *hctx,
+               int val)
  {
         if (blk_mq_is_shared_tags(hctx->flags))
-               atomic_dec(&hctx->queue->nr_active_requests_shared_tags);
+               atomic_sub(val, &hctx->queue->nr_active_requests_shared_tags);
         else
-               atomic_dec(&hctx->nr_active);
+               atomic_sub(val, &hctx->nr_active);
+}
+
+static inline void __blk_mq_dec_active_requests(struct blk_mq_hw_ctx *hctx)
+{
+       __blk_mq_sub_active_requests(hctx, 1);
  }
  
  static inline int __blk_mq_active_requests(struct blk_mq_hw_ctx *hctx)
diff --git a/block/blk.h b/block/blk.h

index 7afffd548daf8b7e58c3497e326ab7d32d2eb1aa..b4fed2033e48f1a881b62305dc54944fa70e299f 100644 (file)
--- a/block/blk.h
+++ b/block/blk.h
@@ -55,6 +55,41 @@ void blk_free_flush_queue(struct blk_flush_queue *q);
  void blk_freeze_queue(struct request_queue *q);
  void __blk_mq_unfreeze_queue(struct request_queue *q, bool force_atomic);
  void blk_queue_start_drain(struct request_queue *q);
+int __bio_queue_enter(struct request_queue *q, struct bio *bio);
+bool submit_bio_checks(struct bio *bio);
+
+static inline bool blk_try_enter_queue(struct request_queue *q, bool pm)
+{
+       rcu_read_lock();
+       if (!percpu_ref_tryget_live_rcu(&q->q_usage_counter))
+               goto fail;
+
+       /*
+        * The code that increments the pm_only counter must ensure that the
+        * counter is globally visible before the queue is unfrozen.
+        */
+       if (blk_queue_pm_only(q) &&
+           (!pm || queue_rpm_status(q) == RPM_SUSPENDED))
+               goto fail_put;
+
+       rcu_read_unlock();
+       return true;
+
+fail_put:
+       blk_queue_exit(q);
+fail:
+       rcu_read_unlock();
+       return false;
+}
+
+static inline int bio_queue_enter(struct bio *bio)
+{
+       struct request_queue *q = bdev_get_queue(bio->bi_bdev);
+
+       if (blk_try_enter_queue(q, false))
+               return 0;
+       return __bio_queue_enter(q, bio);
+}
  
  #define BIO_INLINE_VECS 4
  struct bio_vec *bvec_alloc(mempool_t *pool, unsigned short *nr_vecs,
diff --git a/block/genhd.c b/block/genhd.c

index febaaa55125a94b5f54bb292e8a204551efcc364..a4e9e8ebd941b5fcbb333dbab3078c97ac58ff21 100644 (file)
--- a/block/genhd.c
+++ b/block/genhd.c
@@ -469,11 +469,15 @@ int device_add_disk(struct device *parent, struct gendisk *disk,
  
         disk->part0->bd_holder_dir =
                 kobject_create_and_add("holders", &ddev->kobj);
-       if (!disk->part0->bd_holder_dir)
+       if (!disk->part0->bd_holder_dir) {
+               ret = -ENOMEM;
                 goto out_del_integrity;
+       }
         disk->slave_dir = kobject_create_and_add("slaves", &ddev->kobj);
-       if (!disk->slave_dir)
+       if (!disk->slave_dir) {
+               ret = -ENOMEM;
                 goto out_put_holder_dir;
+       }
  
         ret = bd_register_pending_holders(disk);
         if (ret < 0)
diff --git a/drivers/md/dm.c b/drivers/md/dm.c

index 8d3157241262857c4a984b02281ef1adeeeadbf6..662742a310cbb434121233c682c9200bbd54ed4f 100644 (file)
--- a/drivers/md/dm.c
+++ b/drivers/md/dm.c
@@ -1927,16 +1927,6 @@ static struct dm_table *__bind(struct mapped_device *md, struct dm_table *t,
  
         dm_table_event_callback(t, event_callback, md);
  
-       /*
-        * The queue hasn't been stopped yet, if the old table type wasn't
-        * for request-based during suspension.  So stop it to prevent
-        * I/O mapping before resume.
-        * This must be done before setting the queue restrictions,
-        * because request-based dm may be run just after the setting.
-        */
-       if (request_based)
-               dm_stop_queue(q);
-
         if (request_based) {
                 /*
                  * Leverage the fact that request-based DM targets are
diff --git a/drivers/nvme/host/core.c b/drivers/nvme/host/core.c

index 838b5e2058be031f2d92d00510e95290d7657af8..4b5de8f5435a5fddf35884ac71fd8c7aec46aa63 100644 (file)
--- a/drivers/nvme/host/core.c
+++ b/drivers/nvme/host/core.c
@@ -4518,6 +4518,8 @@ static void nvme_stop_ns_queue(struct nvme_ns *ns)
  {
         if (!test_and_set_bit(NVME_NS_STOPPED, &ns->flags))
                 blk_mq_quiesce_queue(ns->queue);
+       else
+               blk_mq_wait_quiesce_done(ns->queue);
  }
  
  /*
@@ -4637,6 +4639,8 @@ void nvme_stop_admin_queue(struct nvme_ctrl *ctrl)
  {
         if (!test_and_set_bit(NVME_CTRL_ADMIN_Q_STOPPED, &ctrl->flags))
                 blk_mq_quiesce_queue(ctrl->admin_q);
+       else
+               blk_mq_wait_quiesce_done(ctrl->admin_q);
  }
  EXPORT_SYMBOL_GPL(nvme_stop_admin_queue);
  
diff --git a/drivers/scsi/scsi_lib.c b/drivers/scsi/scsi_lib.c

index 1344553afe70c71d1c48bb7b4169ab373fda89e2..b731c2983515a28bc28931ed7d61c6ce95f2b813 100644 (file)
--- a/drivers/scsi/scsi_lib.c
+++ b/drivers/scsi/scsi_lib.c
@@ -2665,6 +2665,40 @@ scsi_target_resume(struct scsi_target *starget)
  }
  EXPORT_SYMBOL(scsi_target_resume);
  
+static int __scsi_internal_device_block_nowait(struct scsi_device *sdev)
+{
+       if (scsi_device_set_state(sdev, SDEV_BLOCK))
+               return scsi_device_set_state(sdev, SDEV_CREATED_BLOCK);
+
+       return 0;
+}
+
+void scsi_start_queue(struct scsi_device *sdev)
+{
+       if (cmpxchg(&sdev->queue_stopped, 1, 0))
+               blk_mq_unquiesce_queue(sdev->request_queue);
+}
+
+static void scsi_stop_queue(struct scsi_device *sdev, bool nowait)
+{
+       /*
+        * The atomic variable of ->queue_stopped covers that
+        * blk_mq_quiesce_queue* is balanced with blk_mq_unquiesce_queue.
+        *
+        * However, we still need to wait until quiesce is done
+        * in case that queue has been stopped.
+        */
+       if (!cmpxchg(&sdev->queue_stopped, 0, 1)) {
+               if (nowait)
+                       blk_mq_quiesce_queue_nowait(sdev->request_queue);
+               else
+                       blk_mq_quiesce_queue(sdev->request_queue);
+       } else {
+               if (!nowait)
+                       blk_mq_wait_quiesce_done(sdev->request_queue);
+       }
+}
+
  /**
   * scsi_internal_device_block_nowait - try to transition to the SDEV_BLOCK state
   * @sdev: device to block
@@ -2681,24 +2715,16 @@ EXPORT_SYMBOL(scsi_target_resume);
   */
  int scsi_internal_device_block_nowait(struct scsi_device *sdev)
  {
-       struct request_queue *q = sdev->request_queue;
-       int err = 0;
-
-       err = scsi_device_set_state(sdev, SDEV_BLOCK);
-       if (err) {
-               err = scsi_device_set_state(sdev, SDEV_CREATED_BLOCK);
-
-               if (err)
-                       return err;
-       }
+       int ret = __scsi_internal_device_block_nowait(sdev);
  
         /*
          * The device has transitioned to SDEV_BLOCK.  Stop the
          * block layer from calling the midlayer with this device's
          * request queue.
          */
-       blk_mq_quiesce_queue_nowait(q);
-       return 0;
+       if (!ret)
+               scsi_stop_queue(sdev, true);
+       return ret;
  }
  EXPORT_SYMBOL_GPL(scsi_internal_device_block_nowait);
  
@@ -2719,25 +2745,17 @@ EXPORT_SYMBOL_GPL(scsi_internal_device_block_nowait);
   */
  static int scsi_internal_device_block(struct scsi_device *sdev)
  {
-       struct request_queue *q = sdev->request_queue;
         int err;
  
         mutex_lock(&sdev->state_mutex);
-       err = scsi_internal_device_block_nowait(sdev);
+       err = __scsi_internal_device_block_nowait(sdev);
         if (err == 0)
-               blk_mq_quiesce_queue(q);
+               scsi_stop_queue(sdev, false);
         mutex_unlock(&sdev->state_mutex);
  
         return err;
  }
  
-void scsi_start_queue(struct scsi_device *sdev)
-{
-       struct request_queue *q = sdev->request_queue;
-
-       blk_mq_unquiesce_queue(q);
-}
-
  /**
   * scsi_internal_device_unblock_nowait - resume a device after a block request
   * @sdev:      device to resume
diff --git a/include/linux/blk-mq.h b/include/linux/blk-mq.h

index 8682663e7368b02000162ec520cb59786bc43001..2949d9ac74849cf80386e450db9bed4295462b09 100644 (file)
--- a/include/linux/blk-mq.h
+++ b/include/linux/blk-mq.h
@@ -798,6 +798,7 @@ void blk_mq_start_hw_queues(struct request_queue *q);
  void blk_mq_start_stopped_hw_queue(struct blk_mq_hw_ctx *hctx, bool async);
  void blk_mq_start_stopped_hw_queues(struct request_queue *q, bool async);
  void blk_mq_quiesce_queue(struct request_queue *q);
+void blk_mq_wait_quiesce_done(struct request_queue *q);
  void blk_mq_unquiesce_queue(struct request_queue *q);
  void blk_mq_delay_run_hw_queue(struct blk_mq_hw_ctx *hctx, unsigned long msecs);
  void blk_mq_run_hw_queue(struct blk_mq_hw_ctx *hctx, bool async);
diff --git a/include/scsi/scsi_device.h b/include/scsi/scsi_device.h

index 79c3045611fa182b97577bd8caf9031b1fad156c..83a7890f1479f866ae7d16e585a375d23958d195 100644 (file)
--- a/include/scsi/scsi_device.h
+++ b/include/scsi/scsi_device.h
@@ -207,6 +207,7 @@ struct scsi_device {
                                          * creation time */
         unsigned ignore_media_change:1; /* Ignore MEDIA CHANGE on resume */
  
+       unsigned int queue_stopped;     /* request queue is quiesced */
         bool offline_already;           /* Device offline message logged */
  
         atomic_t disk_events_disable_depth; /* disable depth for disk events */
author	Linus Torvalds <torvalds@linux-foundation.org>
	Tue, 9 Nov 2021 19:20:07 +0000 (11:20 -0800)
committer	Linus Torvalds <torvalds@linux-foundation.org>
	Tue, 9 Nov 2021 19:20:07 +0000 (11:20 -0800)
block/blk-core.c		patch \| blob \| history
block/blk-merge.c		patch \| blob \| history
block/blk-mq-debugfs.c		patch \| blob \| history
block/blk-mq-sched.c		patch \| blob \| history
block/blk-mq.c		patch \| blob \| history
block/blk-mq.h		patch \| blob \| history
block/blk.h		patch \| blob \| history
block/genhd.c		patch \| blob \| history
drivers/md/dm.c		patch \| blob \| history
drivers/nvme/host/core.c		patch \| blob \| history
drivers/scsi/scsi_lib.c		patch \| blob \| history
include/linux/blk-mq.h		patch \| blob \| history
include/scsi/scsi_device.h		patch \| blob \| history