Merge tag 'mlx5e-updates-2018-10-01' of git://git.kernel.org/pub/scm/linux/kernel...
[sfrench/cifs-2.6.git] / drivers / net / ethernet / mellanox / mlx5 / core / ipoib / ipoib.c
1 /*
2  * Copyright (c) 2017, Mellanox Technologies. All rights reserved.
3  *
4  * This software is available to you under a choice of one of two
5  * licenses.  You may choose to be licensed under the terms of the GNU
6  * General Public License (GPL) Version 2, available from the file
7  * COPYING in the main directory of this source tree, or the
8  * OpenIB.org BSD license below:
9  *
10  *     Redistribution and use in source and binary forms, with or
11  *     without modification, are permitted provided that the following
12  *     conditions are met:
13  *
14  *      - Redistributions of source code must retain the above
15  *        copyright notice, this list of conditions and the following
16  *        disclaimer.
17  *
18  *      - Redistributions in binary form must reproduce the above
19  *        copyright notice, this list of conditions and the following
20  *        disclaimer in the documentation and/or other materials
21  *        provided with the distribution.
22  *
23  * THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND,
24  * EXPRESS OR IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF
25  * MERCHANTABILITY, FITNESS FOR A PARTICULAR PURPOSE AND
26  * NONINFRINGEMENT. IN NO EVENT SHALL THE AUTHORS OR COPYRIGHT HOLDERS
27  * BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER LIABILITY, WHETHER IN AN
28  * ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING FROM, OUT OF OR IN
29  * CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN THE
30  * SOFTWARE.
31  */
32
33 #include <rdma/ib_verbs.h>
34 #include <linux/mlx5/fs.h>
35 #include "en.h"
36 #include "ipoib.h"
37
38 #define IB_DEFAULT_Q_KEY   0xb1b
39 #define MLX5I_PARAMS_DEFAULT_LOG_RQ_SIZE 9
40
41 static int mlx5i_open(struct net_device *netdev);
42 static int mlx5i_close(struct net_device *netdev);
43 static int mlx5i_change_mtu(struct net_device *netdev, int new_mtu);
44
45 static const struct net_device_ops mlx5i_netdev_ops = {
46         .ndo_open                = mlx5i_open,
47         .ndo_stop                = mlx5i_close,
48         .ndo_get_stats64         = mlx5i_get_stats,
49         .ndo_init                = mlx5i_dev_init,
50         .ndo_uninit              = mlx5i_dev_cleanup,
51         .ndo_change_mtu          = mlx5i_change_mtu,
52         .ndo_do_ioctl            = mlx5i_ioctl,
53 };
54
55 /* IPoIB mlx5 netdev profile */
56 static void mlx5i_build_nic_params(struct mlx5_core_dev *mdev,
57                                    struct mlx5e_params *params)
58 {
59         /* Override RQ params as IPoIB supports only LINKED LIST RQ for now */
60         MLX5E_SET_PFLAG(params, MLX5E_PFLAG_RX_STRIDING_RQ, false);
61         mlx5e_set_rq_type(mdev, params);
62         mlx5e_init_rq_type_params(mdev, params);
63
64         /* RQ size in ipoib by default is 512 */
65         params->log_rq_mtu_frames = is_kdump_kernel() ?
66                 MLX5E_PARAMS_MINIMUM_LOG_RQ_SIZE :
67                 MLX5I_PARAMS_DEFAULT_LOG_RQ_SIZE;
68
69         params->lro_en = false;
70         params->hard_mtu = MLX5_IB_GRH_BYTES + MLX5_IPOIB_HARD_LEN;
71 }
72
73 /* Called directly after IPoIB netdevice was created to initialize SW structs */
74 void mlx5i_init(struct mlx5_core_dev *mdev,
75                 struct net_device *netdev,
76                 const struct mlx5e_profile *profile,
77                 void *ppriv)
78 {
79         struct mlx5e_priv *priv  = mlx5i_epriv(netdev);
80         u16 max_mtu;
81
82         /* priv init */
83         priv->mdev        = mdev;
84         priv->netdev      = netdev;
85         priv->profile     = profile;
86         priv->ppriv       = ppriv;
87         priv->max_opened_tc = 1;
88         mutex_init(&priv->state_lock);
89
90         mlx5_query_port_max_mtu(mdev, &max_mtu, 1);
91         netdev->mtu = max_mtu;
92
93         mlx5e_build_nic_params(mdev, &priv->channels.params,
94                                profile->max_nch(mdev), netdev->mtu);
95         mlx5i_build_nic_params(mdev, &priv->channels.params);
96
97         mlx5e_timestamp_init(priv);
98
99         /* netdev init */
100         netdev->hw_features    |= NETIF_F_SG;
101         netdev->hw_features    |= NETIF_F_IP_CSUM;
102         netdev->hw_features    |= NETIF_F_IPV6_CSUM;
103         netdev->hw_features    |= NETIF_F_GRO;
104         netdev->hw_features    |= NETIF_F_TSO;
105         netdev->hw_features    |= NETIF_F_TSO6;
106         netdev->hw_features    |= NETIF_F_RXCSUM;
107         netdev->hw_features    |= NETIF_F_RXHASH;
108
109         netdev->netdev_ops = &mlx5i_netdev_ops;
110         netdev->ethtool_ops = &mlx5i_ethtool_ops;
111 }
112
113 /* Called directly before IPoIB netdevice is destroyed to cleanup SW structs */
114 static void mlx5i_cleanup(struct mlx5e_priv *priv)
115 {
116         /* Do nothing .. */
117 }
118
119 static void mlx5i_grp_sw_update_stats(struct mlx5e_priv *priv)
120 {
121         struct mlx5e_sw_stats s = { 0 };
122         int i, j;
123
124         for (i = 0; i < priv->profile->max_nch(priv->mdev); i++) {
125                 struct mlx5e_channel_stats *channel_stats;
126                 struct mlx5e_rq_stats *rq_stats;
127
128                 channel_stats = &priv->channel_stats[i];
129                 rq_stats = &channel_stats->rq;
130
131                 s.rx_packets += rq_stats->packets;
132                 s.rx_bytes   += rq_stats->bytes;
133
134                 for (j = 0; j < priv->max_opened_tc; j++) {
135                         struct mlx5e_sq_stats *sq_stats = &channel_stats->sq[j];
136
137                         s.tx_packets           += sq_stats->packets;
138                         s.tx_bytes             += sq_stats->bytes;
139                         s.tx_queue_dropped     += sq_stats->dropped;
140                 }
141         }
142
143         memcpy(&priv->stats.sw, &s, sizeof(s));
144 }
145
146 void mlx5i_get_stats(struct net_device *dev, struct rtnl_link_stats64 *stats)
147 {
148         struct mlx5e_priv     *priv   = mlx5i_epriv(dev);
149         struct mlx5e_sw_stats *sstats = &priv->stats.sw;
150
151         mlx5i_grp_sw_update_stats(priv);
152
153         stats->rx_packets = sstats->rx_packets;
154         stats->rx_bytes   = sstats->rx_bytes;
155         stats->tx_packets = sstats->tx_packets;
156         stats->tx_bytes   = sstats->tx_bytes;
157         stats->tx_dropped = sstats->tx_queue_dropped;
158 }
159
160 int mlx5i_init_underlay_qp(struct mlx5e_priv *priv)
161 {
162         struct mlx5_core_dev *mdev = priv->mdev;
163         struct mlx5i_priv *ipriv = priv->ppriv;
164         struct mlx5_core_qp *qp = &ipriv->qp;
165         struct mlx5_qp_context *context;
166         int ret;
167
168         /* QP states */
169         context = kzalloc(sizeof(*context), GFP_KERNEL);
170         if (!context)
171                 return -ENOMEM;
172
173         context->flags = cpu_to_be32(MLX5_QP_PM_MIGRATED << 11);
174         context->pri_path.port = 1;
175         context->pri_path.pkey_index = cpu_to_be16(ipriv->pkey_index);
176         context->qkey = cpu_to_be32(IB_DEFAULT_Q_KEY);
177
178         ret = mlx5_core_qp_modify(mdev, MLX5_CMD_OP_RST2INIT_QP, 0, context, qp);
179         if (ret) {
180                 mlx5_core_err(mdev, "Failed to modify qp RST2INIT, err: %d\n", ret);
181                 goto err_qp_modify_to_err;
182         }
183         memset(context, 0, sizeof(*context));
184
185         ret = mlx5_core_qp_modify(mdev, MLX5_CMD_OP_INIT2RTR_QP, 0, context, qp);
186         if (ret) {
187                 mlx5_core_err(mdev, "Failed to modify qp INIT2RTR, err: %d\n", ret);
188                 goto err_qp_modify_to_err;
189         }
190
191         ret = mlx5_core_qp_modify(mdev, MLX5_CMD_OP_RTR2RTS_QP, 0, context, qp);
192         if (ret) {
193                 mlx5_core_err(mdev, "Failed to modify qp RTR2RTS, err: %d\n", ret);
194                 goto err_qp_modify_to_err;
195         }
196
197         kfree(context);
198         return 0;
199
200 err_qp_modify_to_err:
201         mlx5_core_qp_modify(mdev, MLX5_CMD_OP_2ERR_QP, 0, &context, qp);
202         kfree(context);
203         return ret;
204 }
205
206 void mlx5i_uninit_underlay_qp(struct mlx5e_priv *priv)
207 {
208         struct mlx5i_priv *ipriv = priv->ppriv;
209         struct mlx5_core_dev *mdev = priv->mdev;
210         struct mlx5_qp_context context;
211         int err;
212
213         err = mlx5_core_qp_modify(mdev, MLX5_CMD_OP_2RST_QP, 0, &context,
214                                   &ipriv->qp);
215         if (err)
216                 mlx5_core_err(mdev, "Failed to modify qp 2RST, err: %d\n", err);
217 }
218
219 #define MLX5_QP_ENHANCED_ULP_STATELESS_MODE 2
220
221 int mlx5i_create_underlay_qp(struct mlx5_core_dev *mdev, struct mlx5_core_qp *qp)
222 {
223         u32 *in = NULL;
224         void *addr_path;
225         int ret = 0;
226         int inlen;
227         void *qpc;
228
229         inlen = MLX5_ST_SZ_BYTES(create_qp_in);
230         in = kvzalloc(inlen, GFP_KERNEL);
231         if (!in)
232                 return -ENOMEM;
233
234         qpc = MLX5_ADDR_OF(create_qp_in, in, qpc);
235         MLX5_SET(qpc, qpc, st, MLX5_QP_ST_UD);
236         MLX5_SET(qpc, qpc, pm_state, MLX5_QP_PM_MIGRATED);
237         MLX5_SET(qpc, qpc, ulp_stateless_offload_mode,
238                  MLX5_QP_ENHANCED_ULP_STATELESS_MODE);
239
240         addr_path = MLX5_ADDR_OF(qpc, qpc, primary_address_path);
241         MLX5_SET(ads, addr_path, vhca_port_num, 1);
242         MLX5_SET(ads, addr_path, grh, 1);
243
244         ret = mlx5_core_create_qp(mdev, qp, in, inlen);
245         if (ret) {
246                 mlx5_core_err(mdev, "Failed creating IPoIB QP err : %d\n", ret);
247                 goto out;
248         }
249
250 out:
251         kvfree(in);
252         return ret;
253 }
254
255 void mlx5i_destroy_underlay_qp(struct mlx5_core_dev *mdev, struct mlx5_core_qp *qp)
256 {
257         mlx5_core_destroy_qp(mdev, qp);
258 }
259
260 static int mlx5i_init_tx(struct mlx5e_priv *priv)
261 {
262         struct mlx5i_priv *ipriv = priv->ppriv;
263         int err;
264
265         err = mlx5i_create_underlay_qp(priv->mdev, &ipriv->qp);
266         if (err) {
267                 mlx5_core_warn(priv->mdev, "create underlay QP failed, %d\n", err);
268                 return err;
269         }
270
271         err = mlx5e_create_tis(priv->mdev, 0 /* tc */, ipriv->qp.qpn, &priv->tisn[0]);
272         if (err) {
273                 mlx5_core_warn(priv->mdev, "create tis failed, %d\n", err);
274                 goto err_destroy_underlay_qp;
275         }
276
277         return 0;
278
279 err_destroy_underlay_qp:
280         mlx5i_destroy_underlay_qp(priv->mdev, &ipriv->qp);
281         return err;
282 }
283
284 static void mlx5i_cleanup_tx(struct mlx5e_priv *priv)
285 {
286         struct mlx5i_priv *ipriv = priv->ppriv;
287
288         mlx5e_destroy_tis(priv->mdev, priv->tisn[0]);
289         mlx5i_destroy_underlay_qp(priv->mdev, &ipriv->qp);
290 }
291
292 static int mlx5i_create_flow_steering(struct mlx5e_priv *priv)
293 {
294         struct ttc_params ttc_params = {};
295         int tt, err;
296
297         priv->fs.ns = mlx5_get_flow_namespace(priv->mdev,
298                                                MLX5_FLOW_NAMESPACE_KERNEL);
299
300         if (!priv->fs.ns)
301                 return -EINVAL;
302
303         err = mlx5e_arfs_create_tables(priv);
304         if (err) {
305                 netdev_err(priv->netdev, "Failed to create arfs tables, err=%d\n",
306                            err);
307                 priv->netdev->hw_features &= ~NETIF_F_NTUPLE;
308         }
309
310         mlx5e_set_ttc_basic_params(priv, &ttc_params);
311         mlx5e_set_inner_ttc_ft_params(&ttc_params);
312         for (tt = 0; tt < MLX5E_NUM_INDIR_TIRS; tt++)
313                 ttc_params.indir_tirn[tt] = priv->inner_indir_tir[tt].tirn;
314
315         err = mlx5e_create_inner_ttc_table(priv, &ttc_params, &priv->fs.inner_ttc);
316         if (err) {
317                 netdev_err(priv->netdev, "Failed to create inner ttc table, err=%d\n",
318                            err);
319                 goto err_destroy_arfs_tables;
320         }
321
322         mlx5e_set_ttc_ft_params(&ttc_params);
323         for (tt = 0; tt < MLX5E_NUM_INDIR_TIRS; tt++)
324                 ttc_params.indir_tirn[tt] = priv->indir_tir[tt].tirn;
325
326         err = mlx5e_create_ttc_table(priv, &ttc_params, &priv->fs.ttc);
327         if (err) {
328                 netdev_err(priv->netdev, "Failed to create ttc table, err=%d\n",
329                            err);
330                 goto err_destroy_inner_ttc_table;
331         }
332
333         return 0;
334
335 err_destroy_inner_ttc_table:
336         mlx5e_destroy_inner_ttc_table(priv, &priv->fs.inner_ttc);
337 err_destroy_arfs_tables:
338         mlx5e_arfs_destroy_tables(priv);
339
340         return err;
341 }
342
343 static void mlx5i_destroy_flow_steering(struct mlx5e_priv *priv)
344 {
345         mlx5e_destroy_ttc_table(priv, &priv->fs.ttc);
346         mlx5e_destroy_inner_ttc_table(priv, &priv->fs.inner_ttc);
347         mlx5e_arfs_destroy_tables(priv);
348 }
349
350 static int mlx5i_init_rx(struct mlx5e_priv *priv)
351 {
352         struct mlx5_core_dev *mdev = priv->mdev;
353         int err;
354
355         mlx5e_create_q_counters(priv);
356
357         err = mlx5e_open_drop_rq(priv, &priv->drop_rq);
358         if (err) {
359                 mlx5_core_err(mdev, "open drop rq failed, %d\n", err);
360                 goto err_destroy_q_counters;
361         }
362
363         err = mlx5e_create_indirect_rqt(priv);
364         if (err)
365                 goto err_close_drop_rq;
366
367         err = mlx5e_create_direct_rqts(priv);
368         if (err)
369                 goto err_destroy_indirect_rqts;
370
371         err = mlx5e_create_indirect_tirs(priv, true);
372         if (err)
373                 goto err_destroy_direct_rqts;
374
375         err = mlx5e_create_direct_tirs(priv);
376         if (err)
377                 goto err_destroy_indirect_tirs;
378
379         err = mlx5i_create_flow_steering(priv);
380         if (err)
381                 goto err_destroy_direct_tirs;
382
383         return 0;
384
385 err_destroy_direct_tirs:
386         mlx5e_destroy_direct_tirs(priv);
387 err_destroy_indirect_tirs:
388         mlx5e_destroy_indirect_tirs(priv, true);
389 err_destroy_direct_rqts:
390         mlx5e_destroy_direct_rqts(priv);
391 err_destroy_indirect_rqts:
392         mlx5e_destroy_rqt(priv, &priv->indir_rqt);
393 err_close_drop_rq:
394         mlx5e_close_drop_rq(&priv->drop_rq);
395 err_destroy_q_counters:
396         mlx5e_destroy_q_counters(priv);
397         return err;
398 }
399
400 static void mlx5i_cleanup_rx(struct mlx5e_priv *priv)
401 {
402         mlx5i_destroy_flow_steering(priv);
403         mlx5e_destroy_direct_tirs(priv);
404         mlx5e_destroy_indirect_tirs(priv, true);
405         mlx5e_destroy_direct_rqts(priv);
406         mlx5e_destroy_rqt(priv, &priv->indir_rqt);
407         mlx5e_close_drop_rq(&priv->drop_rq);
408         mlx5e_destroy_q_counters(priv);
409 }
410
411 static const struct mlx5e_profile mlx5i_nic_profile = {
412         .init              = mlx5i_init,
413         .cleanup           = mlx5i_cleanup,
414         .init_tx           = mlx5i_init_tx,
415         .cleanup_tx        = mlx5i_cleanup_tx,
416         .init_rx           = mlx5i_init_rx,
417         .cleanup_rx        = mlx5i_cleanup_rx,
418         .enable            = NULL, /* mlx5i_enable */
419         .disable           = NULL, /* mlx5i_disable */
420         .update_stats      = NULL, /* mlx5i_update_stats */
421         .max_nch           = mlx5e_get_max_num_channels,
422         .update_carrier    = NULL, /* no HW update in IB link */
423         .rx_handlers.handle_rx_cqe       = mlx5i_handle_rx_cqe,
424         .rx_handlers.handle_rx_cqe_mpwqe = NULL, /* Not supported */
425         .max_tc            = MLX5I_MAX_NUM_TC,
426 };
427
428 /* mlx5i netdev NDos */
429
430 static int mlx5i_change_mtu(struct net_device *netdev, int new_mtu)
431 {
432         struct mlx5e_priv *priv = mlx5i_epriv(netdev);
433         struct mlx5e_channels new_channels = {};
434         struct mlx5e_params *params;
435         int err = 0;
436
437         mutex_lock(&priv->state_lock);
438
439         params = &priv->channels.params;
440
441         if (!test_bit(MLX5E_STATE_OPENED, &priv->state)) {
442                 params->sw_mtu = new_mtu;
443                 netdev->mtu = params->sw_mtu;
444                 goto out;
445         }
446
447         new_channels.params = *params;
448         new_channels.params.sw_mtu = new_mtu;
449         err = mlx5e_open_channels(priv, &new_channels);
450         if (err)
451                 goto out;
452
453         mlx5e_switch_priv_channels(priv, &new_channels, NULL);
454         netdev->mtu = new_channels.params.sw_mtu;
455
456 out:
457         mutex_unlock(&priv->state_lock);
458         return err;
459 }
460
461 int mlx5i_dev_init(struct net_device *dev)
462 {
463         struct mlx5e_priv    *priv   = mlx5i_epriv(dev);
464         struct mlx5i_priv    *ipriv  = priv->ppriv;
465
466         /* Set dev address using underlay QP */
467         dev->dev_addr[1] = (ipriv->qp.qpn >> 16) & 0xff;
468         dev->dev_addr[2] = (ipriv->qp.qpn >>  8) & 0xff;
469         dev->dev_addr[3] = (ipriv->qp.qpn) & 0xff;
470
471         /* Add QPN to net-device mapping to HT */
472         mlx5i_pkey_add_qpn(dev ,ipriv->qp.qpn);
473
474         return 0;
475 }
476
477 int mlx5i_ioctl(struct net_device *dev, struct ifreq *ifr, int cmd)
478 {
479         struct mlx5e_priv *priv = mlx5i_epriv(dev);
480
481         switch (cmd) {
482         case SIOCSHWTSTAMP:
483                 return mlx5e_hwstamp_set(priv, ifr);
484         case SIOCGHWTSTAMP:
485                 return mlx5e_hwstamp_get(priv, ifr);
486         default:
487                 return -EOPNOTSUPP;
488         }
489 }
490
491 void mlx5i_dev_cleanup(struct net_device *dev)
492 {
493         struct mlx5e_priv    *priv   = mlx5i_epriv(dev);
494         struct mlx5i_priv    *ipriv = priv->ppriv;
495
496         mlx5i_uninit_underlay_qp(priv);
497
498         /* Delete QPN to net-device mapping from HT */
499         mlx5i_pkey_del_qpn(dev, ipriv->qp.qpn);
500 }
501
502 static int mlx5i_open(struct net_device *netdev)
503 {
504         struct mlx5e_priv *epriv = mlx5i_epriv(netdev);
505         struct mlx5i_priv *ipriv = epriv->ppriv;
506         struct mlx5_core_dev *mdev = epriv->mdev;
507         int err;
508
509         mutex_lock(&epriv->state_lock);
510
511         set_bit(MLX5E_STATE_OPENED, &epriv->state);
512
513         err = mlx5i_init_underlay_qp(epriv);
514         if (err) {
515                 mlx5_core_warn(mdev, "prepare underlay qp state failed, %d\n", err);
516                 goto err_clear_state_opened_flag;
517         }
518
519         err = mlx5_fs_add_rx_underlay_qpn(mdev, ipriv->qp.qpn);
520         if (err) {
521                 mlx5_core_warn(mdev, "attach underlay qp to ft failed, %d\n", err);
522                 goto err_reset_qp;
523         }
524
525         err = mlx5e_open_channels(epriv, &epriv->channels);
526         if (err)
527                 goto err_remove_fs_underlay_qp;
528
529         mlx5e_refresh_tirs(epriv, false);
530         mlx5e_activate_priv_channels(epriv);
531
532         mutex_unlock(&epriv->state_lock);
533         return 0;
534
535 err_remove_fs_underlay_qp:
536         mlx5_fs_remove_rx_underlay_qpn(mdev, ipriv->qp.qpn);
537 err_reset_qp:
538         mlx5i_uninit_underlay_qp(epriv);
539 err_clear_state_opened_flag:
540         clear_bit(MLX5E_STATE_OPENED, &epriv->state);
541         mutex_unlock(&epriv->state_lock);
542         return err;
543 }
544
545 static int mlx5i_close(struct net_device *netdev)
546 {
547         struct mlx5e_priv *epriv = mlx5i_epriv(netdev);
548         struct mlx5i_priv *ipriv = epriv->ppriv;
549         struct mlx5_core_dev *mdev = epriv->mdev;
550
551         /* May already be CLOSED in case a previous configuration operation
552          * (e.g RX/TX queue size change) that involves close&open failed.
553          */
554         mutex_lock(&epriv->state_lock);
555
556         if (!test_bit(MLX5E_STATE_OPENED, &epriv->state))
557                 goto unlock;
558
559         clear_bit(MLX5E_STATE_OPENED, &epriv->state);
560
561         netif_carrier_off(epriv->netdev);
562         mlx5_fs_remove_rx_underlay_qpn(mdev, ipriv->qp.qpn);
563         mlx5i_uninit_underlay_qp(epriv);
564         mlx5e_deactivate_priv_channels(epriv);
565         mlx5e_close_channels(&epriv->channels);
566 unlock:
567         mutex_unlock(&epriv->state_lock);
568         return 0;
569 }
570
571 /* IPoIB RDMA netdev callbacks */
572 static int mlx5i_attach_mcast(struct net_device *netdev, struct ib_device *hca,
573                               union ib_gid *gid, u16 lid, int set_qkey,
574                               u32 qkey)
575 {
576         struct mlx5e_priv    *epriv = mlx5i_epriv(netdev);
577         struct mlx5_core_dev *mdev  = epriv->mdev;
578         struct mlx5i_priv    *ipriv = epriv->ppriv;
579         int err;
580
581         mlx5_core_dbg(mdev, "attaching QPN 0x%x, MGID %pI6\n", ipriv->qp.qpn, gid->raw);
582         err = mlx5_core_attach_mcg(mdev, gid, ipriv->qp.qpn);
583         if (err)
584                 mlx5_core_warn(mdev, "failed attaching QPN 0x%x, MGID %pI6\n",
585                                ipriv->qp.qpn, gid->raw);
586
587         if (set_qkey) {
588                 mlx5_core_dbg(mdev, "%s setting qkey 0x%x\n",
589                               netdev->name, qkey);
590                 ipriv->qkey = qkey;
591         }
592
593         return err;
594 }
595
596 static int mlx5i_detach_mcast(struct net_device *netdev, struct ib_device *hca,
597                               union ib_gid *gid, u16 lid)
598 {
599         struct mlx5e_priv    *epriv = mlx5i_epriv(netdev);
600         struct mlx5_core_dev *mdev  = epriv->mdev;
601         struct mlx5i_priv    *ipriv = epriv->ppriv;
602         int err;
603
604         mlx5_core_dbg(mdev, "detaching QPN 0x%x, MGID %pI6\n", ipriv->qp.qpn, gid->raw);
605
606         err = mlx5_core_detach_mcg(mdev, gid, ipriv->qp.qpn);
607         if (err)
608                 mlx5_core_dbg(mdev, "failed detaching QPN 0x%x, MGID %pI6\n",
609                               ipriv->qp.qpn, gid->raw);
610
611         return err;
612 }
613
614 static int mlx5i_xmit(struct net_device *dev, struct sk_buff *skb,
615                       struct ib_ah *address, u32 dqpn)
616 {
617         struct mlx5e_priv *epriv = mlx5i_epriv(dev);
618         struct mlx5e_txqsq *sq   = epriv->txq2sq[skb_get_queue_mapping(skb)];
619         struct mlx5_ib_ah *mah   = to_mah(address);
620         struct mlx5i_priv *ipriv = epriv->ppriv;
621
622         return mlx5i_sq_xmit(sq, skb, &mah->av, dqpn, ipriv->qkey);
623 }
624
625 static void mlx5i_set_pkey_index(struct net_device *netdev, int id)
626 {
627         struct mlx5i_priv *ipriv = netdev_priv(netdev);
628
629         ipriv->pkey_index = (u16)id;
630 }
631
632 static int mlx5i_check_required_hca_cap(struct mlx5_core_dev *mdev)
633 {
634         if (MLX5_CAP_GEN(mdev, port_type) != MLX5_CAP_PORT_TYPE_IB)
635                 return -EOPNOTSUPP;
636
637         if (!MLX5_CAP_GEN(mdev, ipoib_enhanced_offloads)) {
638                 mlx5_core_warn(mdev, "IPoIB enhanced offloads are not supported\n");
639                 return -EOPNOTSUPP;
640         }
641
642         return 0;
643 }
644
645 static void mlx5_rdma_netdev_free(struct net_device *netdev)
646 {
647         struct mlx5e_priv *priv = mlx5i_epriv(netdev);
648         struct mlx5i_priv *ipriv = priv->ppriv;
649         const struct mlx5e_profile *profile = priv->profile;
650
651         mlx5e_detach_netdev(priv);
652         profile->cleanup(priv);
653         destroy_workqueue(priv->wq);
654
655         if (!ipriv->sub_interface) {
656                 mlx5i_pkey_qpn_ht_cleanup(netdev);
657                 mlx5e_destroy_mdev_resources(priv->mdev);
658         }
659 }
660
661 struct net_device *mlx5_rdma_netdev_alloc(struct mlx5_core_dev *mdev,
662                                           struct ib_device *ibdev,
663                                           const char *name,
664                                           void (*setup)(struct net_device *))
665 {
666         const struct mlx5e_profile *profile;
667         struct net_device *netdev;
668         struct mlx5i_priv *ipriv;
669         struct mlx5e_priv *epriv;
670         struct rdma_netdev *rn;
671         bool sub_interface;
672         int nch;
673         int err;
674
675         if (mlx5i_check_required_hca_cap(mdev)) {
676                 mlx5_core_warn(mdev, "Accelerated mode is not supported\n");
677                 return ERR_PTR(-EOPNOTSUPP);
678         }
679
680         /* TODO: Need to find a better way to check if child device*/
681         sub_interface = (mdev->mlx5e_res.pdn != 0);
682
683         if (sub_interface)
684                 profile = mlx5i_pkey_get_profile();
685         else
686                 profile = &mlx5i_nic_profile;
687
688         nch = profile->max_nch(mdev);
689
690         netdev = alloc_netdev_mqs(sizeof(struct mlx5i_priv) + sizeof(struct mlx5e_priv),
691                                   name, NET_NAME_UNKNOWN,
692                                   setup,
693                                   nch * MLX5E_MAX_NUM_TC,
694                                   nch);
695         if (!netdev) {
696                 mlx5_core_warn(mdev, "alloc_netdev_mqs failed\n");
697                 return NULL;
698         }
699
700         ipriv = netdev_priv(netdev);
701         epriv = mlx5i_epriv(netdev);
702
703         epriv->wq = create_singlethread_workqueue("mlx5i");
704         if (!epriv->wq)
705                 goto err_free_netdev;
706
707         ipriv->sub_interface = sub_interface;
708         if (!ipriv->sub_interface) {
709                 err = mlx5i_pkey_qpn_ht_init(netdev);
710                 if (err) {
711                         mlx5_core_warn(mdev, "allocate qpn_to_netdev ht failed\n");
712                         goto destroy_wq;
713                 }
714
715                 /* This should only be called once per mdev */
716                 err = mlx5e_create_mdev_resources(mdev);
717                 if (err)
718                         goto destroy_ht;
719         }
720
721         profile->init(mdev, netdev, profile, ipriv);
722
723         mlx5e_attach_netdev(epriv);
724         netif_carrier_off(netdev);
725
726         /* set rdma_netdev func pointers */
727         rn = &ipriv->rn;
728         rn->hca  = ibdev;
729         rn->send = mlx5i_xmit;
730         rn->attach_mcast = mlx5i_attach_mcast;
731         rn->detach_mcast = mlx5i_detach_mcast;
732         rn->set_id = mlx5i_set_pkey_index;
733
734         netdev->priv_destructor = mlx5_rdma_netdev_free;
735         netdev->needs_free_netdev = 1;
736
737         return netdev;
738
739 destroy_ht:
740         mlx5i_pkey_qpn_ht_cleanup(netdev);
741 destroy_wq:
742         destroy_workqueue(epriv->wq);
743 err_free_netdev:
744         free_netdev(netdev);
745
746         return NULL;
747 }
748 EXPORT_SYMBOL(mlx5_rdma_netdev_alloc);