batman-adv: fix TT sync flag inconsistencies
[sfrench/cifs-2.6.git] / drivers / net / ethernet / mellanox / mlx5 / core / ipoib / ipoib.c
1 /*
2  * Copyright (c) 2017, Mellanox Technologies. All rights reserved.
3  *
4  * This software is available to you under a choice of one of two
5  * licenses.  You may choose to be licensed under the terms of the GNU
6  * General Public License (GPL) Version 2, available from the file
7  * COPYING in the main directory of this source tree, or the
8  * OpenIB.org BSD license below:
9  *
10  *     Redistribution and use in source and binary forms, with or
11  *     without modification, are permitted provided that the following
12  *     conditions are met:
13  *
14  *      - Redistributions of source code must retain the above
15  *        copyright notice, this list of conditions and the following
16  *        disclaimer.
17  *
18  *      - Redistributions in binary form must reproduce the above
19  *        copyright notice, this list of conditions and the following
20  *        disclaimer in the documentation and/or other materials
21  *        provided with the distribution.
22  *
23  * THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND,
24  * EXPRESS OR IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF
25  * MERCHANTABILITY, FITNESS FOR A PARTICULAR PURPOSE AND
26  * NONINFRINGEMENT. IN NO EVENT SHALL THE AUTHORS OR COPYRIGHT HOLDERS
27  * BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER LIABILITY, WHETHER IN AN
28  * ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING FROM, OUT OF OR IN
29  * CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN THE
30  * SOFTWARE.
31  */
32
33 #include <rdma/ib_verbs.h>
34 #include <linux/mlx5/fs.h>
35 #include "en.h"
36 #include "ipoib.h"
37
38 #define IB_DEFAULT_Q_KEY   0xb1b
39 #define MLX5I_PARAMS_DEFAULT_LOG_RQ_SIZE 9
40
41 static int mlx5i_open(struct net_device *netdev);
42 static int mlx5i_close(struct net_device *netdev);
43 static int  mlx5i_dev_init(struct net_device *dev);
44 static void mlx5i_dev_cleanup(struct net_device *dev);
45 static int mlx5i_change_mtu(struct net_device *netdev, int new_mtu);
46 static int mlx5i_ioctl(struct net_device *dev, struct ifreq *ifr, int cmd);
47
48 static const struct net_device_ops mlx5i_netdev_ops = {
49         .ndo_open                = mlx5i_open,
50         .ndo_stop                = mlx5i_close,
51         .ndo_init                = mlx5i_dev_init,
52         .ndo_uninit              = mlx5i_dev_cleanup,
53         .ndo_change_mtu          = mlx5i_change_mtu,
54         .ndo_do_ioctl            = mlx5i_ioctl,
55 };
56
57 /* IPoIB mlx5 netdev profile */
58 static void mlx5i_build_nic_params(struct mlx5_core_dev *mdev,
59                                    struct mlx5e_params *params)
60 {
61         /* Override RQ params as IPoIB supports only LINKED LIST RQ for now */
62         mlx5e_set_rq_type_params(mdev, params, MLX5_WQ_TYPE_LINKED_LIST);
63
64         /* RQ size in ipoib by default is 512 */
65         params->log_rq_size = is_kdump_kernel() ?
66                 MLX5E_PARAMS_MINIMUM_LOG_RQ_SIZE :
67                 MLX5I_PARAMS_DEFAULT_LOG_RQ_SIZE;
68
69         params->lro_en = false;
70 }
71
72 /* Called directly after IPoIB netdevice was created to initialize SW structs */
73 static void mlx5i_init(struct mlx5_core_dev *mdev,
74                        struct net_device *netdev,
75                        const struct mlx5e_profile *profile,
76                        void *ppriv)
77 {
78         struct mlx5e_priv *priv  = mlx5i_epriv(netdev);
79
80         /* priv init */
81         priv->mdev        = mdev;
82         priv->netdev      = netdev;
83         priv->profile     = profile;
84         priv->ppriv       = ppriv;
85         priv->hard_mtu = MLX5_IB_GRH_BYTES + MLX5_IPOIB_HARD_LEN;
86         mutex_init(&priv->state_lock);
87
88         mlx5e_build_nic_params(mdev, &priv->channels.params, profile->max_nch(mdev));
89         mlx5i_build_nic_params(mdev, &priv->channels.params);
90
91         /* netdev init */
92         netdev->hw_features    |= NETIF_F_SG;
93         netdev->hw_features    |= NETIF_F_IP_CSUM;
94         netdev->hw_features    |= NETIF_F_IPV6_CSUM;
95         netdev->hw_features    |= NETIF_F_GRO;
96         netdev->hw_features    |= NETIF_F_TSO;
97         netdev->hw_features    |= NETIF_F_TSO6;
98         netdev->hw_features    |= NETIF_F_RXCSUM;
99         netdev->hw_features    |= NETIF_F_RXHASH;
100
101         netdev->netdev_ops = &mlx5i_netdev_ops;
102         netdev->ethtool_ops = &mlx5i_ethtool_ops;
103 }
104
105 /* Called directly before IPoIB netdevice is destroyed to cleanup SW structs */
106 static void mlx5i_cleanup(struct mlx5e_priv *priv)
107 {
108         /* Do nothing .. */
109 }
110
111 #define MLX5_QP_ENHANCED_ULP_STATELESS_MODE 2
112
113 static int mlx5i_create_underlay_qp(struct mlx5_core_dev *mdev, struct mlx5_core_qp *qp)
114 {
115         struct mlx5_qp_context *context = NULL;
116         u32 *in = NULL;
117         void *addr_path;
118         int ret = 0;
119         int inlen;
120         void *qpc;
121
122         inlen = MLX5_ST_SZ_BYTES(create_qp_in);
123         in = kvzalloc(inlen, GFP_KERNEL);
124         if (!in)
125                 return -ENOMEM;
126
127         qpc = MLX5_ADDR_OF(create_qp_in, in, qpc);
128         MLX5_SET(qpc, qpc, st, MLX5_QP_ST_UD);
129         MLX5_SET(qpc, qpc, pm_state, MLX5_QP_PM_MIGRATED);
130         MLX5_SET(qpc, qpc, ulp_stateless_offload_mode,
131                  MLX5_QP_ENHANCED_ULP_STATELESS_MODE);
132
133         addr_path = MLX5_ADDR_OF(qpc, qpc, primary_address_path);
134         MLX5_SET(ads, addr_path, port, 1);
135         MLX5_SET(ads, addr_path, grh, 1);
136
137         ret = mlx5_core_create_qp(mdev, qp, in, inlen);
138         if (ret) {
139                 mlx5_core_err(mdev, "Failed creating IPoIB QP err : %d\n", ret);
140                 goto out;
141         }
142
143         /* QP states */
144         context = kzalloc(sizeof(*context), GFP_KERNEL);
145         if (!context) {
146                 ret = -ENOMEM;
147                 goto out;
148         }
149
150         context->flags = cpu_to_be32(MLX5_QP_PM_MIGRATED << 11);
151         context->pri_path.port = 1;
152         context->qkey = cpu_to_be32(IB_DEFAULT_Q_KEY);
153
154         ret = mlx5_core_qp_modify(mdev, MLX5_CMD_OP_RST2INIT_QP, 0, context, qp);
155         if (ret) {
156                 mlx5_core_err(mdev, "Failed to modify qp RST2INIT, err: %d\n", ret);
157                 goto out;
158         }
159         memset(context, 0, sizeof(*context));
160
161         ret = mlx5_core_qp_modify(mdev, MLX5_CMD_OP_INIT2RTR_QP, 0, context, qp);
162         if (ret) {
163                 mlx5_core_err(mdev, "Failed to modify qp INIT2RTR, err: %d\n", ret);
164                 goto out;
165         }
166
167         ret = mlx5_core_qp_modify(mdev, MLX5_CMD_OP_RTR2RTS_QP, 0, context, qp);
168         if (ret) {
169                 mlx5_core_err(mdev, "Failed to modify qp RTR2RTS, err: %d\n", ret);
170                 goto out;
171         }
172
173 out:
174         kfree(context);
175         kvfree(in);
176         return ret;
177 }
178
179 static void mlx5i_destroy_underlay_qp(struct mlx5_core_dev *mdev, struct mlx5_core_qp *qp)
180 {
181         mlx5_fs_remove_rx_underlay_qpn(mdev, qp->qpn);
182
183         mlx5_core_destroy_qp(mdev, qp);
184 }
185
186 static int mlx5i_init_tx(struct mlx5e_priv *priv)
187 {
188         struct mlx5i_priv *ipriv = priv->ppriv;
189         int err;
190
191         err = mlx5i_create_underlay_qp(priv->mdev, &ipriv->qp);
192         if (err) {
193                 mlx5_core_warn(priv->mdev, "create underlay QP failed, %d\n", err);
194                 return err;
195         }
196
197         mlx5_fs_add_rx_underlay_qpn(priv->mdev, ipriv->qp.qpn);
198
199         err = mlx5e_create_tis(priv->mdev, 0 /* tc */, ipriv->qp.qpn, &priv->tisn[0]);
200         if (err) {
201                 mlx5_core_warn(priv->mdev, "create tis failed, %d\n", err);
202                 return err;
203         }
204
205         return 0;
206 }
207
208 static void mlx5i_cleanup_tx(struct mlx5e_priv *priv)
209 {
210         struct mlx5i_priv *ipriv = priv->ppriv;
211
212         mlx5e_destroy_tis(priv->mdev, priv->tisn[0]);
213         mlx5i_destroy_underlay_qp(priv->mdev, &ipriv->qp);
214 }
215
216 static int mlx5i_create_flow_steering(struct mlx5e_priv *priv)
217 {
218         int err;
219
220         priv->fs.ns = mlx5_get_flow_namespace(priv->mdev,
221                                                MLX5_FLOW_NAMESPACE_KERNEL);
222
223         if (!priv->fs.ns)
224                 return -EINVAL;
225
226         err = mlx5e_arfs_create_tables(priv);
227         if (err) {
228                 netdev_err(priv->netdev, "Failed to create arfs tables, err=%d\n",
229                            err);
230                 priv->netdev->hw_features &= ~NETIF_F_NTUPLE;
231         }
232
233         err = mlx5e_create_ttc_table(priv);
234         if (err) {
235                 netdev_err(priv->netdev, "Failed to create ttc table, err=%d\n",
236                            err);
237                 goto err_destroy_arfs_tables;
238         }
239
240         return 0;
241
242 err_destroy_arfs_tables:
243         mlx5e_arfs_destroy_tables(priv);
244
245         return err;
246 }
247
248 static void mlx5i_destroy_flow_steering(struct mlx5e_priv *priv)
249 {
250         mlx5e_destroy_ttc_table(priv);
251         mlx5e_arfs_destroy_tables(priv);
252 }
253
254 static int mlx5i_init_rx(struct mlx5e_priv *priv)
255 {
256         int err;
257
258         err = mlx5e_create_indirect_rqt(priv);
259         if (err)
260                 return err;
261
262         err = mlx5e_create_direct_rqts(priv);
263         if (err)
264                 goto err_destroy_indirect_rqts;
265
266         err = mlx5e_create_indirect_tirs(priv);
267         if (err)
268                 goto err_destroy_direct_rqts;
269
270         err = mlx5e_create_direct_tirs(priv);
271         if (err)
272                 goto err_destroy_indirect_tirs;
273
274         err = mlx5i_create_flow_steering(priv);
275         if (err)
276                 goto err_destroy_direct_tirs;
277
278         return 0;
279
280 err_destroy_direct_tirs:
281         mlx5e_destroy_direct_tirs(priv);
282 err_destroy_indirect_tirs:
283         mlx5e_destroy_indirect_tirs(priv);
284 err_destroy_direct_rqts:
285         mlx5e_destroy_direct_rqts(priv);
286 err_destroy_indirect_rqts:
287         mlx5e_destroy_rqt(priv, &priv->indir_rqt);
288         return err;
289 }
290
291 static void mlx5i_cleanup_rx(struct mlx5e_priv *priv)
292 {
293         mlx5i_destroy_flow_steering(priv);
294         mlx5e_destroy_direct_tirs(priv);
295         mlx5e_destroy_indirect_tirs(priv);
296         mlx5e_destroy_direct_rqts(priv);
297         mlx5e_destroy_rqt(priv, &priv->indir_rqt);
298 }
299
300 static const struct mlx5e_profile mlx5i_nic_profile = {
301         .init              = mlx5i_init,
302         .cleanup           = mlx5i_cleanup,
303         .init_tx           = mlx5i_init_tx,
304         .cleanup_tx        = mlx5i_cleanup_tx,
305         .init_rx           = mlx5i_init_rx,
306         .cleanup_rx        = mlx5i_cleanup_rx,
307         .enable            = NULL, /* mlx5i_enable */
308         .disable           = NULL, /* mlx5i_disable */
309         .update_stats      = NULL, /* mlx5i_update_stats */
310         .max_nch           = mlx5e_get_max_num_channels,
311         .update_carrier    = NULL, /* no HW update in IB link */
312         .rx_handlers.handle_rx_cqe       = mlx5i_handle_rx_cqe,
313         .rx_handlers.handle_rx_cqe_mpwqe = NULL, /* Not supported */
314         .max_tc            = MLX5I_MAX_NUM_TC,
315 };
316
317 /* mlx5i netdev NDos */
318
319 static int mlx5i_change_mtu(struct net_device *netdev, int new_mtu)
320 {
321         struct mlx5e_priv *priv = mlx5i_epriv(netdev);
322         struct mlx5e_channels new_channels = {};
323         int curr_mtu;
324         int err = 0;
325
326         mutex_lock(&priv->state_lock);
327
328         curr_mtu    = netdev->mtu;
329         netdev->mtu = new_mtu;
330
331         if (!test_bit(MLX5E_STATE_OPENED, &priv->state))
332                 goto out;
333
334         new_channels.params = priv->channels.params;
335         err = mlx5e_open_channels(priv, &new_channels);
336         if (err) {
337                 netdev->mtu = curr_mtu;
338                 goto out;
339         }
340
341         mlx5e_switch_priv_channels(priv, &new_channels, NULL);
342
343 out:
344         mutex_unlock(&priv->state_lock);
345         return err;
346 }
347
348 static int mlx5i_dev_init(struct net_device *dev)
349 {
350         struct mlx5e_priv    *priv   = mlx5i_epriv(dev);
351         struct mlx5i_priv    *ipriv  = priv->ppriv;
352
353         /* Set dev address using underlay QP */
354         dev->dev_addr[1] = (ipriv->qp.qpn >> 16) & 0xff;
355         dev->dev_addr[2] = (ipriv->qp.qpn >>  8) & 0xff;
356         dev->dev_addr[3] = (ipriv->qp.qpn) & 0xff;
357
358         return 0;
359 }
360
361 static int mlx5i_ioctl(struct net_device *dev, struct ifreq *ifr, int cmd)
362 {
363         struct mlx5e_priv *priv = mlx5i_epriv(dev);
364
365         switch (cmd) {
366         case SIOCSHWTSTAMP:
367                 return mlx5e_hwstamp_set(priv, ifr);
368         case SIOCGHWTSTAMP:
369                 return mlx5e_hwstamp_get(priv, ifr);
370         default:
371                 return -EOPNOTSUPP;
372         }
373 }
374
375 static void mlx5i_dev_cleanup(struct net_device *dev)
376 {
377         struct mlx5e_priv    *priv   = mlx5i_epriv(dev);
378         struct mlx5_core_dev *mdev   = priv->mdev;
379         struct mlx5i_priv    *ipriv  = priv->ppriv;
380         struct mlx5_qp_context context;
381
382         /* detach qp from flow-steering by reset it */
383         mlx5_core_qp_modify(mdev, MLX5_CMD_OP_2RST_QP, 0, &context, &ipriv->qp);
384 }
385
386 static int mlx5i_open(struct net_device *netdev)
387 {
388         struct mlx5e_priv *priv = mlx5i_epriv(netdev);
389         int err;
390
391         mutex_lock(&priv->state_lock);
392
393         set_bit(MLX5E_STATE_OPENED, &priv->state);
394
395         err = mlx5e_open_channels(priv, &priv->channels);
396         if (err)
397                 goto err_clear_state_opened_flag;
398
399         mlx5e_refresh_tirs(priv, false);
400         mlx5e_activate_priv_channels(priv);
401         mlx5e_timestamp_init(priv);
402
403         mutex_unlock(&priv->state_lock);
404         return 0;
405
406 err_clear_state_opened_flag:
407         clear_bit(MLX5E_STATE_OPENED, &priv->state);
408         mutex_unlock(&priv->state_lock);
409         return err;
410 }
411
412 static int mlx5i_close(struct net_device *netdev)
413 {
414         struct mlx5e_priv *priv = mlx5i_epriv(netdev);
415
416         /* May already be CLOSED in case a previous configuration operation
417          * (e.g RX/TX queue size change) that involves close&open failed.
418          */
419         mutex_lock(&priv->state_lock);
420
421         if (!test_bit(MLX5E_STATE_OPENED, &priv->state))
422                 goto unlock;
423
424         clear_bit(MLX5E_STATE_OPENED, &priv->state);
425
426         mlx5e_timestamp_cleanup(priv);
427         netif_carrier_off(priv->netdev);
428         mlx5e_deactivate_priv_channels(priv);
429         mlx5e_close_channels(&priv->channels);
430 unlock:
431         mutex_unlock(&priv->state_lock);
432         return 0;
433 }
434
435 /* IPoIB RDMA netdev callbacks */
436 static int mlx5i_attach_mcast(struct net_device *netdev, struct ib_device *hca,
437                               union ib_gid *gid, u16 lid, int set_qkey,
438                               u32 qkey)
439 {
440         struct mlx5e_priv    *epriv = mlx5i_epriv(netdev);
441         struct mlx5_core_dev *mdev  = epriv->mdev;
442         struct mlx5i_priv    *ipriv = epriv->ppriv;
443         int err;
444
445         mlx5_core_dbg(mdev, "attaching QPN 0x%x, MGID %pI6\n", ipriv->qp.qpn, gid->raw);
446         err = mlx5_core_attach_mcg(mdev, gid, ipriv->qp.qpn);
447         if (err)
448                 mlx5_core_warn(mdev, "failed attaching QPN 0x%x, MGID %pI6\n",
449                                ipriv->qp.qpn, gid->raw);
450
451         if (set_qkey) {
452                 mlx5_core_dbg(mdev, "%s setting qkey 0x%x\n",
453                               netdev->name, qkey);
454                 ipriv->qkey = qkey;
455         }
456
457         return err;
458 }
459
460 static int mlx5i_detach_mcast(struct net_device *netdev, struct ib_device *hca,
461                               union ib_gid *gid, u16 lid)
462 {
463         struct mlx5e_priv    *epriv = mlx5i_epriv(netdev);
464         struct mlx5_core_dev *mdev  = epriv->mdev;
465         struct mlx5i_priv    *ipriv = epriv->ppriv;
466         int err;
467
468         mlx5_core_dbg(mdev, "detaching QPN 0x%x, MGID %pI6\n", ipriv->qp.qpn, gid->raw);
469
470         err = mlx5_core_detach_mcg(mdev, gid, ipriv->qp.qpn);
471         if (err)
472                 mlx5_core_dbg(mdev, "failed dettaching QPN 0x%x, MGID %pI6\n",
473                               ipriv->qp.qpn, gid->raw);
474
475         return err;
476 }
477
478 static int mlx5i_xmit(struct net_device *dev, struct sk_buff *skb,
479                       struct ib_ah *address, u32 dqpn)
480 {
481         struct mlx5e_priv *epriv = mlx5i_epriv(dev);
482         struct mlx5e_txqsq *sq   = epriv->txq2sq[skb_get_queue_mapping(skb)];
483         struct mlx5_ib_ah *mah   = to_mah(address);
484         struct mlx5i_priv *ipriv = epriv->ppriv;
485
486         return mlx5i_sq_xmit(sq, skb, &mah->av, dqpn, ipriv->qkey);
487 }
488
489 static int mlx5i_check_required_hca_cap(struct mlx5_core_dev *mdev)
490 {
491         if (MLX5_CAP_GEN(mdev, port_type) != MLX5_CAP_PORT_TYPE_IB)
492                 return -EOPNOTSUPP;
493
494         if (!MLX5_CAP_GEN(mdev, ipoib_enhanced_offloads)) {
495                 mlx5_core_warn(mdev, "IPoIB enhanced offloads are not supported\n");
496                 return -EOPNOTSUPP;
497         }
498
499         return 0;
500 }
501
502 struct net_device *mlx5_rdma_netdev_alloc(struct mlx5_core_dev *mdev,
503                                           struct ib_device *ibdev,
504                                           const char *name,
505                                           void (*setup)(struct net_device *))
506 {
507         const struct mlx5e_profile *profile = &mlx5i_nic_profile;
508         int nch = profile->max_nch(mdev);
509         struct net_device *netdev;
510         struct mlx5i_priv *ipriv;
511         struct mlx5e_priv *epriv;
512         struct rdma_netdev *rn;
513         int err;
514
515         if (mlx5i_check_required_hca_cap(mdev)) {
516                 mlx5_core_warn(mdev, "Accelerated mode is not supported\n");
517                 return ERR_PTR(-EOPNOTSUPP);
518         }
519
520         /* This function should only be called once per mdev */
521         err = mlx5e_create_mdev_resources(mdev);
522         if (err)
523                 return NULL;
524
525         netdev = alloc_netdev_mqs(sizeof(struct mlx5i_priv) + sizeof(struct mlx5e_priv),
526                                   name, NET_NAME_UNKNOWN,
527                                   setup,
528                                   nch * MLX5E_MAX_NUM_TC,
529                                   nch);
530         if (!netdev) {
531                 mlx5_core_warn(mdev, "alloc_netdev_mqs failed\n");
532                 goto free_mdev_resources;
533         }
534
535         ipriv = netdev_priv(netdev);
536         epriv = mlx5i_epriv(netdev);
537
538         epriv->wq = create_singlethread_workqueue("mlx5i");
539         if (!epriv->wq)
540                 goto err_free_netdev;
541
542         profile->init(mdev, netdev, profile, ipriv);
543
544         mlx5e_attach_netdev(epriv);
545         netif_carrier_off(netdev);
546
547         /* set rdma_netdev func pointers */
548         rn = &ipriv->rn;
549         rn->hca  = ibdev;
550         rn->send = mlx5i_xmit;
551         rn->attach_mcast = mlx5i_attach_mcast;
552         rn->detach_mcast = mlx5i_detach_mcast;
553
554         return netdev;
555
556 err_free_netdev:
557         free_netdev(netdev);
558 free_mdev_resources:
559         mlx5e_destroy_mdev_resources(mdev);
560
561         return NULL;
562 }
563 EXPORT_SYMBOL(mlx5_rdma_netdev_alloc);
564
565 void mlx5_rdma_netdev_free(struct net_device *netdev)
566 {
567         struct mlx5e_priv          *priv    = mlx5i_epriv(netdev);
568         const struct mlx5e_profile *profile = priv->profile;
569
570         mlx5e_detach_netdev(priv);
571         profile->cleanup(priv);
572         destroy_workqueue(priv->wq);
573         free_netdev(netdev);
574
575         mlx5e_destroy_mdev_resources(priv->mdev);
576 }
577 EXPORT_SYMBOL(mlx5_rdma_netdev_free);