xfrm: Support GRO for IPv6 ESP in UDP encapsulation
authorSteffen Klassert <steffen.klassert@secunet.com>
Wed, 4 Oct 2023 13:05:44 +0000 (15:05 +0200)
committerSteffen Klassert <steffen.klassert@secunet.com>
Fri, 6 Oct 2023 05:31:14 +0000 (07:31 +0200)
This patch enables the GRO codepath for IPv6 ESP in UDP encapsulated
packets. Decapsulation happens at L2 and saves a full round through
the stack for each packet. This is also needed to support HW offload
for ESP in UDP encapsulation.

Signed-off-by: Steffen Klassert <steffen.klassert@secunet.com>
Co-developed-by: Antony Antony <antony.antony@secunet.com>
Signed-off-by: Antony Antony <antony.antony@secunet.com>
Reviewed-by: Eyal Birger <eyal.birger@gmail.com>
include/net/ipv6_stubs.h
include/net/xfrm.h
net/ipv4/udp.c
net/ipv6/af_inet6.c
net/ipv6/esp6_offload.c
net/ipv6/xfrm6_input.c

index c48186bf47372761493e9502da90dadcc0c26b01..887d35f716c79b51cc01eb6f7cc2c3ea9a40a53f 100644 (file)
@@ -60,6 +60,9 @@ struct ipv6_stub {
 #if IS_ENABLED(CONFIG_XFRM)
        void (*xfrm6_local_rxpmtu)(struct sk_buff *skb, u32 mtu);
        int (*xfrm6_udp_encap_rcv)(struct sock *sk, struct sk_buff *skb);
+       struct sk_buff *(*xfrm6_gro_udp_encap_rcv)(struct sock *sk,
+                                                  struct list_head *head,
+                                                  struct sk_buff *skb);
        int (*xfrm6_rcv_encap)(struct sk_buff *skb, int nexthdr, __be32 spi,
                               int encap_type);
 #endif
index 2437a2e308de65bb5100bc83d1055b28d979584f..4681ecfb85ac2697c233050b43878ea49d044175 100644 (file)
@@ -1712,6 +1712,8 @@ int xfrm4_udp_encap_rcv(struct sock *sk, struct sk_buff *skb);
 int xfrm6_udp_encap_rcv(struct sock *sk, struct sk_buff *skb);
 struct sk_buff *xfrm4_gro_udp_encap_rcv(struct sock *sk, struct list_head *head,
                                        struct sk_buff *skb);
+struct sk_buff *xfrm6_gro_udp_encap_rcv(struct sock *sk, struct list_head *head,
+                                       struct sk_buff *skb);
 int xfrm_user_policy(struct sock *sk, int optname, sockptr_t optval,
                     int optlen);
 #else
index b8d7c5e86d0d6cdad7ec427a6b354d6c258954bb..7fdc250e06790ea91959b8a127acbe2453870763 100644 (file)
@@ -2632,6 +2632,8 @@ static void set_xfrm_gro_udp_encap_rcv(__u16 encap_type, unsigned short family,
        if (udp_test_bit(GRO_ENABLED, sk) && encap_type == UDP_ENCAP_ESPINUDP) {
                if (family == AF_INET)
                        WRITE_ONCE(udp_sk(sk)->gro_receive, xfrm4_gro_udp_encap_rcv);
+               else if (IS_ENABLED(CONFIG_IPV6) && family == AF_INET6)
+                       WRITE_ONCE(udp_sk(sk)->gro_receive, ipv6_stub->xfrm6_gro_udp_encap_rcv);
        }
 #endif
 }
index c6ad0d6e99b5e2259648e260e2cad54f34c90cfd..7dd8aeb555cfe0b267482e7b0e18078b4a9cd037 100644 (file)
@@ -1049,6 +1049,7 @@ static const struct ipv6_stub ipv6_stub_impl = {
 #if IS_ENABLED(CONFIG_XFRM)
        .xfrm6_local_rxpmtu = xfrm6_local_rxpmtu,
        .xfrm6_udp_encap_rcv = xfrm6_udp_encap_rcv,
+       .xfrm6_gro_udp_encap_rcv = xfrm6_gro_udp_encap_rcv,
        .xfrm6_rcv_encap = xfrm6_rcv_encap,
 #endif
        .nd_tbl = &nd_tbl,
index 19ff2bceb4e19b16e559ab73fdb1e6a7cb0d6bd8..527b7caddbc68d9d10f98cb879e2baa8fa8535c8 100644 (file)
@@ -34,7 +34,9 @@ static __u16 esp6_nexthdr_esp_offset(struct ipv6hdr *ipv6_hdr, int nhlen)
        int off = sizeof(struct ipv6hdr);
        struct ipv6_opt_hdr *exthdr;
 
-       if (likely(ipv6_hdr->nexthdr == NEXTHDR_ESP))
+       /* ESP or ESPINUDP */
+       if (likely(ipv6_hdr->nexthdr == NEXTHDR_ESP ||
+                  ipv6_hdr->nexthdr == NEXTHDR_UDP))
                return offsetof(struct ipv6hdr, nexthdr);
 
        while (off < nhlen) {
@@ -54,10 +56,14 @@ static struct sk_buff *esp6_gro_receive(struct list_head *head,
        int offset = skb_gro_offset(skb);
        struct xfrm_offload *xo;
        struct xfrm_state *x;
+       int encap_type = 0;
        __be32 seq;
        __be32 spi;
        int nhoff;
 
+       if (NAPI_GRO_CB(skb)->proto == IPPROTO_UDP)
+               encap_type = UDP_ENCAP_ESPINUDP;
+
        if (!pskb_pull(skb, offset))
                return NULL;
 
@@ -104,7 +110,7 @@ static struct sk_buff *esp6_gro_receive(struct list_head *head,
 
        /* We don't need to handle errors from xfrm_input, it does all
         * the error handling and frees the resources on error. */
-       xfrm_input(skb, IPPROTO_ESP, spi, 0);
+       xfrm_input(skb, IPPROTO_ESP, spi, encap_type);
 
        return ERR_PTR(-EINPROGRESS);
 out_reset:
index 4156387248e40e15b0dd10ccfa89cee5dd7e7534..ccf79b84c0618f64a7d205388515466f204a149f 100644 (file)
@@ -16,6 +16,8 @@
 #include <linux/netfilter_ipv6.h>
 #include <net/ipv6.h>
 #include <net/xfrm.h>
+#include <net/protocol.h>
+#include <net/gro.h>
 
 int xfrm6_rcv_spi(struct sk_buff *skb, int nexthdr, __be32 spi,
                  struct ip6_tnl *t)
@@ -67,14 +69,7 @@ int xfrm6_transport_finish(struct sk_buff *skb, int async)
        return 0;
 }
 
-/* If it's a keepalive packet, then just eat it.
- * If it's an encapsulated packet, then pass it to the
- * IPsec xfrm input.
- * Returns 0 if skb passed to xfrm or was dropped.
- * Returns >0 if skb should be passed to UDP.
- * Returns <0 if skb should be resubmitted (-ret is protocol)
- */
-int xfrm6_udp_encap_rcv(struct sock *sk, struct sk_buff *skb)
+static int __xfrm6_udp_encap_rcv(struct sock *sk, struct sk_buff *skb, bool pull)
 {
        struct udp_sock *up = udp_sk(sk);
        struct udphdr *uh;
@@ -109,7 +104,7 @@ int xfrm6_udp_encap_rcv(struct sock *sk, struct sk_buff *skb)
        case UDP_ENCAP_ESPINUDP:
                /* Check if this is a keepalive packet.  If so, eat it. */
                if (len == 1 && udpdata[0] == 0xff) {
-                       goto drop;
+                       return -EINVAL;
                } else if (len > sizeof(struct ip_esp_hdr) && udpdata32[0] != 0) {
                        /* ESP Packet without Non-ESP header */
                        len = sizeof(struct udphdr);
@@ -120,7 +115,7 @@ int xfrm6_udp_encap_rcv(struct sock *sk, struct sk_buff *skb)
        case UDP_ENCAP_ESPINUDP_NON_IKE:
                /* Check if this is a keepalive packet.  If so, eat it. */
                if (len == 1 && udpdata[0] == 0xff) {
-                       goto drop;
+                       return -EINVAL;
                } else if (len > 2 * sizeof(u32) + sizeof(struct ip_esp_hdr) &&
                           udpdata32[0] == 0 && udpdata32[1] == 0) {
 
@@ -138,31 +133,94 @@ int xfrm6_udp_encap_rcv(struct sock *sk, struct sk_buff *skb)
         * protocol to ESP, and then call into the transform receiver.
         */
        if (skb_unclone(skb, GFP_ATOMIC))
-               goto drop;
+               return -EINVAL;
 
        /* Now we can update and verify the packet length... */
        ip6h = ipv6_hdr(skb);
        ip6h->payload_len = htons(ntohs(ip6h->payload_len) - len);
        if (skb->len < ip6hlen + len) {
                /* packet is too small!?! */
-               goto drop;
+               return -EINVAL;
        }
 
        /* pull the data buffer up to the ESP header and set the
         * transport header to point to ESP.  Keep UDP on the stack
         * for later.
         */
-       __skb_pull(skb, len);
-       skb_reset_transport_header(skb);
+       if (pull) {
+               __skb_pull(skb, len);
+               skb_reset_transport_header(skb);
+       } else {
+               skb_set_transport_header(skb, len);
+       }
 
        /* process ESP */
-       return xfrm6_rcv_encap(skb, IPPROTO_ESP, 0, encap_type);
-
-drop:
-       kfree_skb(skb);
        return 0;
 }
 
+/* If it's a keepalive packet, then just eat it.
+ * If it's an encapsulated packet, then pass it to the
+ * IPsec xfrm input.
+ * Returns 0 if skb passed to xfrm or was dropped.
+ * Returns >0 if skb should be passed to UDP.
+ * Returns <0 if skb should be resubmitted (-ret is protocol)
+ */
+int xfrm6_udp_encap_rcv(struct sock *sk, struct sk_buff *skb)
+{
+       int ret;
+
+       ret = __xfrm6_udp_encap_rcv(sk, skb, true);
+       if (!ret)
+               return xfrm6_rcv_encap(skb, IPPROTO_ESP, 0,
+                                      udp_sk(sk)->encap_type);
+
+       if (ret < 0) {
+               kfree_skb(skb);
+               return 0;
+       }
+
+       return ret;
+}
+
+struct sk_buff *xfrm6_gro_udp_encap_rcv(struct sock *sk, struct list_head *head,
+                                       struct sk_buff *skb)
+{
+       int offset = skb_gro_offset(skb);
+       const struct net_offload *ops;
+       struct sk_buff *pp = NULL;
+       int ret;
+
+       offset = offset - sizeof(struct udphdr);
+
+       if (!pskb_pull(skb, offset))
+               return NULL;
+
+       rcu_read_lock();
+       ops = rcu_dereference(inet6_offloads[IPPROTO_ESP]);
+       if (!ops || !ops->callbacks.gro_receive)
+               goto out;
+
+       ret = __xfrm6_udp_encap_rcv(sk, skb, false);
+       if (ret)
+               goto out;
+
+       skb_push(skb, offset);
+       NAPI_GRO_CB(skb)->proto = IPPROTO_UDP;
+
+       pp = call_gro_receive(ops->callbacks.gro_receive, head, skb);
+       rcu_read_unlock();
+
+       return pp;
+
+out:
+       rcu_read_unlock();
+       skb_push(skb, offset);
+       NAPI_GRO_CB(skb)->same_flow = 0;
+       NAPI_GRO_CB(skb)->flush = 1;
+
+       return NULL;
+}
+
 int xfrm6_rcv_tnl(struct sk_buff *skb, struct ip6_tnl *t)
 {
        return xfrm6_rcv_spi(skb, skb_network_header(skb)[IP6CB(skb)->nhoff],