Merge tag 'trace-v5.2-rc1-2' of git://git.kernel.org/pub/scm/linux/kernel/git/rostedt...
[sfrench/cifs-2.6.git] / net / sctp / socket.c
1 // SPDX-License-Identifier: GPL-2.0-or-later
2 /* SCTP kernel implementation
3  * (C) Copyright IBM Corp. 2001, 2004
4  * Copyright (c) 1999-2000 Cisco, Inc.
5  * Copyright (c) 1999-2001 Motorola, Inc.
6  * Copyright (c) 2001-2003 Intel Corp.
7  * Copyright (c) 2001-2002 Nokia, Inc.
8  * Copyright (c) 2001 La Monte H.P. Yarroll
9  *
10  * This file is part of the SCTP kernel implementation
11  *
12  * These functions interface with the sockets layer to implement the
13  * SCTP Extensions for the Sockets API.
14  *
15  * Note that the descriptions from the specification are USER level
16  * functions--this file is the functions which populate the struct proto
17  * for SCTP which is the BOTTOM of the sockets interface.
18  *
19  * Please send any bug reports or fixes you make to the
20  * email address(es):
21  *    lksctp developers <linux-sctp@vger.kernel.org>
22  *
23  * Written or modified by:
24  *    La Monte H.P. Yarroll <piggy@acm.org>
25  *    Narasimha Budihal     <narsi@refcode.org>
26  *    Karl Knutson          <karl@athena.chicago.il.us>
27  *    Jon Grimm             <jgrimm@us.ibm.com>
28  *    Xingang Guo           <xingang.guo@intel.com>
29  *    Daisy Chang           <daisyc@us.ibm.com>
30  *    Sridhar Samudrala     <samudrala@us.ibm.com>
31  *    Inaky Perez-Gonzalez  <inaky.gonzalez@intel.com>
32  *    Ardelle Fan           <ardelle.fan@intel.com>
33  *    Ryan Layer            <rmlayer@us.ibm.com>
34  *    Anup Pemmaiah         <pemmaiah@cc.usu.edu>
35  *    Kevin Gao             <kevin.gao@intel.com>
36  */
37
38 #define pr_fmt(fmt) KBUILD_MODNAME ": " fmt
39
40 #include <crypto/hash.h>
41 #include <linux/types.h>
42 #include <linux/kernel.h>
43 #include <linux/wait.h>
44 #include <linux/time.h>
45 #include <linux/sched/signal.h>
46 #include <linux/ip.h>
47 #include <linux/capability.h>
48 #include <linux/fcntl.h>
49 #include <linux/poll.h>
50 #include <linux/init.h>
51 #include <linux/slab.h>
52 #include <linux/file.h>
53 #include <linux/compat.h>
54 #include <linux/rhashtable.h>
55
56 #include <net/ip.h>
57 #include <net/icmp.h>
58 #include <net/route.h>
59 #include <net/ipv6.h>
60 #include <net/inet_common.h>
61 #include <net/busy_poll.h>
62
63 #include <linux/socket.h> /* for sa_family_t */
64 #include <linux/export.h>
65 #include <net/sock.h>
66 #include <net/sctp/sctp.h>
67 #include <net/sctp/sm.h>
68 #include <net/sctp/stream_sched.h>
69
70 /* Forward declarations for internal helper functions. */
71 static bool sctp_writeable(struct sock *sk);
72 static void sctp_wfree(struct sk_buff *skb);
73 static int sctp_wait_for_sndbuf(struct sctp_association *asoc, long *timeo_p,
74                                 size_t msg_len);
75 static int sctp_wait_for_packet(struct sock *sk, int *err, long *timeo_p);
76 static int sctp_wait_for_connect(struct sctp_association *, long *timeo_p);
77 static int sctp_wait_for_accept(struct sock *sk, long timeo);
78 static void sctp_wait_for_close(struct sock *sk, long timeo);
79 static void sctp_destruct_sock(struct sock *sk);
80 static struct sctp_af *sctp_sockaddr_af(struct sctp_sock *opt,
81                                         union sctp_addr *addr, int len);
82 static int sctp_bindx_add(struct sock *, struct sockaddr *, int);
83 static int sctp_bindx_rem(struct sock *, struct sockaddr *, int);
84 static int sctp_send_asconf_add_ip(struct sock *, struct sockaddr *, int);
85 static int sctp_send_asconf_del_ip(struct sock *, struct sockaddr *, int);
86 static int sctp_send_asconf(struct sctp_association *asoc,
87                             struct sctp_chunk *chunk);
88 static int sctp_do_bind(struct sock *, union sctp_addr *, int);
89 static int sctp_autobind(struct sock *sk);
90 static int sctp_sock_migrate(struct sock *oldsk, struct sock *newsk,
91                              struct sctp_association *assoc,
92                              enum sctp_socket_type type);
93
94 static unsigned long sctp_memory_pressure;
95 static atomic_long_t sctp_memory_allocated;
96 struct percpu_counter sctp_sockets_allocated;
97
98 static void sctp_enter_memory_pressure(struct sock *sk)
99 {
100         sctp_memory_pressure = 1;
101 }
102
103
104 /* Get the sndbuf space available at the time on the association.  */
105 static inline int sctp_wspace(struct sctp_association *asoc)
106 {
107         struct sock *sk = asoc->base.sk;
108
109         return asoc->ep->sndbuf_policy ? sk->sk_sndbuf - asoc->sndbuf_used
110                                        : sk_stream_wspace(sk);
111 }
112
113 /* Increment the used sndbuf space count of the corresponding association by
114  * the size of the outgoing data chunk.
115  * Also, set the skb destructor for sndbuf accounting later.
116  *
117  * Since it is always 1-1 between chunk and skb, and also a new skb is always
118  * allocated for chunk bundling in sctp_packet_transmit(), we can use the
119  * destructor in the data chunk skb for the purpose of the sndbuf space
120  * tracking.
121  */
122 static inline void sctp_set_owner_w(struct sctp_chunk *chunk)
123 {
124         struct sctp_association *asoc = chunk->asoc;
125         struct sock *sk = asoc->base.sk;
126
127         /* The sndbuf space is tracked per association.  */
128         sctp_association_hold(asoc);
129
130         if (chunk->shkey)
131                 sctp_auth_shkey_hold(chunk->shkey);
132
133         skb_set_owner_w(chunk->skb, sk);
134
135         chunk->skb->destructor = sctp_wfree;
136         /* Save the chunk pointer in skb for sctp_wfree to use later.  */
137         skb_shinfo(chunk->skb)->destructor_arg = chunk;
138
139         refcount_add(sizeof(struct sctp_chunk), &sk->sk_wmem_alloc);
140         asoc->sndbuf_used += chunk->skb->truesize + sizeof(struct sctp_chunk);
141         sk->sk_wmem_queued += chunk->skb->truesize + sizeof(struct sctp_chunk);
142         sk_mem_charge(sk, chunk->skb->truesize);
143 }
144
145 static void sctp_clear_owner_w(struct sctp_chunk *chunk)
146 {
147         skb_orphan(chunk->skb);
148 }
149
150 static void sctp_for_each_tx_datachunk(struct sctp_association *asoc,
151                                        void (*cb)(struct sctp_chunk *))
152
153 {
154         struct sctp_outq *q = &asoc->outqueue;
155         struct sctp_transport *t;
156         struct sctp_chunk *chunk;
157
158         list_for_each_entry(t, &asoc->peer.transport_addr_list, transports)
159                 list_for_each_entry(chunk, &t->transmitted, transmitted_list)
160                         cb(chunk);
161
162         list_for_each_entry(chunk, &q->retransmit, transmitted_list)
163                 cb(chunk);
164
165         list_for_each_entry(chunk, &q->sacked, transmitted_list)
166                 cb(chunk);
167
168         list_for_each_entry(chunk, &q->abandoned, transmitted_list)
169                 cb(chunk);
170
171         list_for_each_entry(chunk, &q->out_chunk_list, list)
172                 cb(chunk);
173 }
174
175 static void sctp_for_each_rx_skb(struct sctp_association *asoc, struct sock *sk,
176                                  void (*cb)(struct sk_buff *, struct sock *))
177
178 {
179         struct sk_buff *skb, *tmp;
180
181         sctp_skb_for_each(skb, &asoc->ulpq.lobby, tmp)
182                 cb(skb, sk);
183
184         sctp_skb_for_each(skb, &asoc->ulpq.reasm, tmp)
185                 cb(skb, sk);
186
187         sctp_skb_for_each(skb, &asoc->ulpq.reasm_uo, tmp)
188                 cb(skb, sk);
189 }
190
191 /* Verify that this is a valid address. */
192 static inline int sctp_verify_addr(struct sock *sk, union sctp_addr *addr,
193                                    int len)
194 {
195         struct sctp_af *af;
196
197         /* Verify basic sockaddr. */
198         af = sctp_sockaddr_af(sctp_sk(sk), addr, len);
199         if (!af)
200                 return -EINVAL;
201
202         /* Is this a valid SCTP address?  */
203         if (!af->addr_valid(addr, sctp_sk(sk), NULL))
204                 return -EINVAL;
205
206         if (!sctp_sk(sk)->pf->send_verify(sctp_sk(sk), (addr)))
207                 return -EINVAL;
208
209         return 0;
210 }
211
212 /* Look up the association by its id.  If this is not a UDP-style
213  * socket, the ID field is always ignored.
214  */
215 struct sctp_association *sctp_id2assoc(struct sock *sk, sctp_assoc_t id)
216 {
217         struct sctp_association *asoc = NULL;
218
219         /* If this is not a UDP-style socket, assoc id should be ignored. */
220         if (!sctp_style(sk, UDP)) {
221                 /* Return NULL if the socket state is not ESTABLISHED. It
222                  * could be a TCP-style listening socket or a socket which
223                  * hasn't yet called connect() to establish an association.
224                  */
225                 if (!sctp_sstate(sk, ESTABLISHED) && !sctp_sstate(sk, CLOSING))
226                         return NULL;
227
228                 /* Get the first and the only association from the list. */
229                 if (!list_empty(&sctp_sk(sk)->ep->asocs))
230                         asoc = list_entry(sctp_sk(sk)->ep->asocs.next,
231                                           struct sctp_association, asocs);
232                 return asoc;
233         }
234
235         /* Otherwise this is a UDP-style socket. */
236         if (id <= SCTP_ALL_ASSOC)
237                 return NULL;
238
239         spin_lock_bh(&sctp_assocs_id_lock);
240         asoc = (struct sctp_association *)idr_find(&sctp_assocs_id, (int)id);
241         if (asoc && (asoc->base.sk != sk || asoc->base.dead))
242                 asoc = NULL;
243         spin_unlock_bh(&sctp_assocs_id_lock);
244
245         return asoc;
246 }
247
248 /* Look up the transport from an address and an assoc id. If both address and
249  * id are specified, the associations matching the address and the id should be
250  * the same.
251  */
252 static struct sctp_transport *sctp_addr_id2transport(struct sock *sk,
253                                               struct sockaddr_storage *addr,
254                                               sctp_assoc_t id)
255 {
256         struct sctp_association *addr_asoc = NULL, *id_asoc = NULL;
257         struct sctp_af *af = sctp_get_af_specific(addr->ss_family);
258         union sctp_addr *laddr = (union sctp_addr *)addr;
259         struct sctp_transport *transport;
260
261         if (!af || sctp_verify_addr(sk, laddr, af->sockaddr_len))
262                 return NULL;
263
264         addr_asoc = sctp_endpoint_lookup_assoc(sctp_sk(sk)->ep,
265                                                laddr,
266                                                &transport);
267
268         if (!addr_asoc)
269                 return NULL;
270
271         id_asoc = sctp_id2assoc(sk, id);
272         if (id_asoc && (id_asoc != addr_asoc))
273                 return NULL;
274
275         sctp_get_pf_specific(sk->sk_family)->addr_to_user(sctp_sk(sk),
276                                                 (union sctp_addr *)addr);
277
278         return transport;
279 }
280
281 /* API 3.1.2 bind() - UDP Style Syntax
282  * The syntax of bind() is,
283  *
284  *   ret = bind(int sd, struct sockaddr *addr, int addrlen);
285  *
286  *   sd      - the socket descriptor returned by socket().
287  *   addr    - the address structure (struct sockaddr_in or struct
288  *             sockaddr_in6 [RFC 2553]),
289  *   addr_len - the size of the address structure.
290  */
291 static int sctp_bind(struct sock *sk, struct sockaddr *addr, int addr_len)
292 {
293         int retval = 0;
294
295         lock_sock(sk);
296
297         pr_debug("%s: sk:%p, addr:%p, addr_len:%d\n", __func__, sk,
298                  addr, addr_len);
299
300         /* Disallow binding twice. */
301         if (!sctp_sk(sk)->ep->base.bind_addr.port)
302                 retval = sctp_do_bind(sk, (union sctp_addr *)addr,
303                                       addr_len);
304         else
305                 retval = -EINVAL;
306
307         release_sock(sk);
308
309         return retval;
310 }
311
312 static long sctp_get_port_local(struct sock *, union sctp_addr *);
313
314 /* Verify this is a valid sockaddr. */
315 static struct sctp_af *sctp_sockaddr_af(struct sctp_sock *opt,
316                                         union sctp_addr *addr, int len)
317 {
318         struct sctp_af *af;
319
320         /* Check minimum size.  */
321         if (len < sizeof (struct sockaddr))
322                 return NULL;
323
324         if (!opt->pf->af_supported(addr->sa.sa_family, opt))
325                 return NULL;
326
327         if (addr->sa.sa_family == AF_INET6) {
328                 if (len < SIN6_LEN_RFC2133)
329                         return NULL;
330                 /* V4 mapped address are really of AF_INET family */
331                 if (ipv6_addr_v4mapped(&addr->v6.sin6_addr) &&
332                     !opt->pf->af_supported(AF_INET, opt))
333                         return NULL;
334         }
335
336         /* If we get this far, af is valid. */
337         af = sctp_get_af_specific(addr->sa.sa_family);
338
339         if (len < af->sockaddr_len)
340                 return NULL;
341
342         return af;
343 }
344
345 /* Bind a local address either to an endpoint or to an association.  */
346 static int sctp_do_bind(struct sock *sk, union sctp_addr *addr, int len)
347 {
348         struct net *net = sock_net(sk);
349         struct sctp_sock *sp = sctp_sk(sk);
350         struct sctp_endpoint *ep = sp->ep;
351         struct sctp_bind_addr *bp = &ep->base.bind_addr;
352         struct sctp_af *af;
353         unsigned short snum;
354         int ret = 0;
355
356         /* Common sockaddr verification. */
357         af = sctp_sockaddr_af(sp, addr, len);
358         if (!af) {
359                 pr_debug("%s: sk:%p, newaddr:%p, len:%d EINVAL\n",
360                          __func__, sk, addr, len);
361                 return -EINVAL;
362         }
363
364         snum = ntohs(addr->v4.sin_port);
365
366         pr_debug("%s: sk:%p, new addr:%pISc, port:%d, new port:%d, len:%d\n",
367                  __func__, sk, &addr->sa, bp->port, snum, len);
368
369         /* PF specific bind() address verification. */
370         if (!sp->pf->bind_verify(sp, addr))
371                 return -EADDRNOTAVAIL;
372
373         /* We must either be unbound, or bind to the same port.
374          * It's OK to allow 0 ports if we are already bound.
375          * We'll just inhert an already bound port in this case
376          */
377         if (bp->port) {
378                 if (!snum)
379                         snum = bp->port;
380                 else if (snum != bp->port) {
381                         pr_debug("%s: new port %d doesn't match existing port "
382                                  "%d\n", __func__, snum, bp->port);
383                         return -EINVAL;
384                 }
385         }
386
387         if (snum && snum < inet_prot_sock(net) &&
388             !ns_capable(net->user_ns, CAP_NET_BIND_SERVICE))
389                 return -EACCES;
390
391         /* See if the address matches any of the addresses we may have
392          * already bound before checking against other endpoints.
393          */
394         if (sctp_bind_addr_match(bp, addr, sp))
395                 return -EINVAL;
396
397         /* Make sure we are allowed to bind here.
398          * The function sctp_get_port_local() does duplicate address
399          * detection.
400          */
401         addr->v4.sin_port = htons(snum);
402         if ((ret = sctp_get_port_local(sk, addr))) {
403                 return -EADDRINUSE;
404         }
405
406         /* Refresh ephemeral port.  */
407         if (!bp->port)
408                 bp->port = inet_sk(sk)->inet_num;
409
410         /* Add the address to the bind address list.
411          * Use GFP_ATOMIC since BHs will be disabled.
412          */
413         ret = sctp_add_bind_addr(bp, addr, af->sockaddr_len,
414                                  SCTP_ADDR_SRC, GFP_ATOMIC);
415
416         /* Copy back into socket for getsockname() use. */
417         if (!ret) {
418                 inet_sk(sk)->inet_sport = htons(inet_sk(sk)->inet_num);
419                 sp->pf->to_sk_saddr(addr, sk);
420         }
421
422         return ret;
423 }
424
425  /* ADDIP Section 4.1.1 Congestion Control of ASCONF Chunks
426  *
427  * R1) One and only one ASCONF Chunk MAY be in transit and unacknowledged
428  * at any one time.  If a sender, after sending an ASCONF chunk, decides
429  * it needs to transfer another ASCONF Chunk, it MUST wait until the
430  * ASCONF-ACK Chunk returns from the previous ASCONF Chunk before sending a
431  * subsequent ASCONF. Note this restriction binds each side, so at any
432  * time two ASCONF may be in-transit on any given association (one sent
433  * from each endpoint).
434  */
435 static int sctp_send_asconf(struct sctp_association *asoc,
436                             struct sctp_chunk *chunk)
437 {
438         struct net      *net = sock_net(asoc->base.sk);
439         int             retval = 0;
440
441         /* If there is an outstanding ASCONF chunk, queue it for later
442          * transmission.
443          */
444         if (asoc->addip_last_asconf) {
445                 list_add_tail(&chunk->list, &asoc->addip_chunk_list);
446                 goto out;
447         }
448
449         /* Hold the chunk until an ASCONF_ACK is received. */
450         sctp_chunk_hold(chunk);
451         retval = sctp_primitive_ASCONF(net, asoc, chunk);
452         if (retval)
453                 sctp_chunk_free(chunk);
454         else
455                 asoc->addip_last_asconf = chunk;
456
457 out:
458         return retval;
459 }
460
461 /* Add a list of addresses as bind addresses to local endpoint or
462  * association.
463  *
464  * Basically run through each address specified in the addrs/addrcnt
465  * array/length pair, determine if it is IPv6 or IPv4 and call
466  * sctp_do_bind() on it.
467  *
468  * If any of them fails, then the operation will be reversed and the
469  * ones that were added will be removed.
470  *
471  * Only sctp_setsockopt_bindx() is supposed to call this function.
472  */
473 static int sctp_bindx_add(struct sock *sk, struct sockaddr *addrs, int addrcnt)
474 {
475         int cnt;
476         int retval = 0;
477         void *addr_buf;
478         struct sockaddr *sa_addr;
479         struct sctp_af *af;
480
481         pr_debug("%s: sk:%p, addrs:%p, addrcnt:%d\n", __func__, sk,
482                  addrs, addrcnt);
483
484         addr_buf = addrs;
485         for (cnt = 0; cnt < addrcnt; cnt++) {
486                 /* The list may contain either IPv4 or IPv6 address;
487                  * determine the address length for walking thru the list.
488                  */
489                 sa_addr = addr_buf;
490                 af = sctp_get_af_specific(sa_addr->sa_family);
491                 if (!af) {
492                         retval = -EINVAL;
493                         goto err_bindx_add;
494                 }
495
496                 retval = sctp_do_bind(sk, (union sctp_addr *)sa_addr,
497                                       af->sockaddr_len);
498
499                 addr_buf += af->sockaddr_len;
500
501 err_bindx_add:
502                 if (retval < 0) {
503                         /* Failed. Cleanup the ones that have been added */
504                         if (cnt > 0)
505                                 sctp_bindx_rem(sk, addrs, cnt);
506                         return retval;
507                 }
508         }
509
510         return retval;
511 }
512
513 /* Send an ASCONF chunk with Add IP address parameters to all the peers of the
514  * associations that are part of the endpoint indicating that a list of local
515  * addresses are added to the endpoint.
516  *
517  * If any of the addresses is already in the bind address list of the
518  * association, we do not send the chunk for that association.  But it will not
519  * affect other associations.
520  *
521  * Only sctp_setsockopt_bindx() is supposed to call this function.
522  */
523 static int sctp_send_asconf_add_ip(struct sock          *sk,
524                                    struct sockaddr      *addrs,
525                                    int                  addrcnt)
526 {
527         struct net *net = sock_net(sk);
528         struct sctp_sock                *sp;
529         struct sctp_endpoint            *ep;
530         struct sctp_association         *asoc;
531         struct sctp_bind_addr           *bp;
532         struct sctp_chunk               *chunk;
533         struct sctp_sockaddr_entry      *laddr;
534         union sctp_addr                 *addr;
535         union sctp_addr                 saveaddr;
536         void                            *addr_buf;
537         struct sctp_af                  *af;
538         struct list_head                *p;
539         int                             i;
540         int                             retval = 0;
541
542         if (!net->sctp.addip_enable)
543                 return retval;
544
545         sp = sctp_sk(sk);
546         ep = sp->ep;
547
548         pr_debug("%s: sk:%p, addrs:%p, addrcnt:%d\n",
549                  __func__, sk, addrs, addrcnt);
550
551         list_for_each_entry(asoc, &ep->asocs, asocs) {
552                 if (!asoc->peer.asconf_capable)
553                         continue;
554
555                 if (asoc->peer.addip_disabled_mask & SCTP_PARAM_ADD_IP)
556                         continue;
557
558                 if (!sctp_state(asoc, ESTABLISHED))
559                         continue;
560
561                 /* Check if any address in the packed array of addresses is
562                  * in the bind address list of the association. If so,
563                  * do not send the asconf chunk to its peer, but continue with
564                  * other associations.
565                  */
566                 addr_buf = addrs;
567                 for (i = 0; i < addrcnt; i++) {
568                         addr = addr_buf;
569                         af = sctp_get_af_specific(addr->v4.sin_family);
570                         if (!af) {
571                                 retval = -EINVAL;
572                                 goto out;
573                         }
574
575                         if (sctp_assoc_lookup_laddr(asoc, addr))
576                                 break;
577
578                         addr_buf += af->sockaddr_len;
579                 }
580                 if (i < addrcnt)
581                         continue;
582
583                 /* Use the first valid address in bind addr list of
584                  * association as Address Parameter of ASCONF CHUNK.
585                  */
586                 bp = &asoc->base.bind_addr;
587                 p = bp->address_list.next;
588                 laddr = list_entry(p, struct sctp_sockaddr_entry, list);
589                 chunk = sctp_make_asconf_update_ip(asoc, &laddr->a, addrs,
590                                                    addrcnt, SCTP_PARAM_ADD_IP);
591                 if (!chunk) {
592                         retval = -ENOMEM;
593                         goto out;
594                 }
595
596                 /* Add the new addresses to the bind address list with
597                  * use_as_src set to 0.
598                  */
599                 addr_buf = addrs;
600                 for (i = 0; i < addrcnt; i++) {
601                         addr = addr_buf;
602                         af = sctp_get_af_specific(addr->v4.sin_family);
603                         memcpy(&saveaddr, addr, af->sockaddr_len);
604                         retval = sctp_add_bind_addr(bp, &saveaddr,
605                                                     sizeof(saveaddr),
606                                                     SCTP_ADDR_NEW, GFP_ATOMIC);
607                         addr_buf += af->sockaddr_len;
608                 }
609                 if (asoc->src_out_of_asoc_ok) {
610                         struct sctp_transport *trans;
611
612                         list_for_each_entry(trans,
613                             &asoc->peer.transport_addr_list, transports) {
614                                 trans->cwnd = min(4*asoc->pathmtu, max_t(__u32,
615                                     2*asoc->pathmtu, 4380));
616                                 trans->ssthresh = asoc->peer.i.a_rwnd;
617                                 trans->rto = asoc->rto_initial;
618                                 sctp_max_rto(asoc, trans);
619                                 trans->rtt = trans->srtt = trans->rttvar = 0;
620                                 /* Clear the source and route cache */
621                                 sctp_transport_route(trans, NULL,
622                                                      sctp_sk(asoc->base.sk));
623                         }
624                 }
625                 retval = sctp_send_asconf(asoc, chunk);
626         }
627
628 out:
629         return retval;
630 }
631
632 /* Remove a list of addresses from bind addresses list.  Do not remove the
633  * last address.
634  *
635  * Basically run through each address specified in the addrs/addrcnt
636  * array/length pair, determine if it is IPv6 or IPv4 and call
637  * sctp_del_bind() on it.
638  *
639  * If any of them fails, then the operation will be reversed and the
640  * ones that were removed will be added back.
641  *
642  * At least one address has to be left; if only one address is
643  * available, the operation will return -EBUSY.
644  *
645  * Only sctp_setsockopt_bindx() is supposed to call this function.
646  */
647 static int sctp_bindx_rem(struct sock *sk, struct sockaddr *addrs, int addrcnt)
648 {
649         struct sctp_sock *sp = sctp_sk(sk);
650         struct sctp_endpoint *ep = sp->ep;
651         int cnt;
652         struct sctp_bind_addr *bp = &ep->base.bind_addr;
653         int retval = 0;
654         void *addr_buf;
655         union sctp_addr *sa_addr;
656         struct sctp_af *af;
657
658         pr_debug("%s: sk:%p, addrs:%p, addrcnt:%d\n",
659                  __func__, sk, addrs, addrcnt);
660
661         addr_buf = addrs;
662         for (cnt = 0; cnt < addrcnt; cnt++) {
663                 /* If the bind address list is empty or if there is only one
664                  * bind address, there is nothing more to be removed (we need
665                  * at least one address here).
666                  */
667                 if (list_empty(&bp->address_list) ||
668                     (sctp_list_single_entry(&bp->address_list))) {
669                         retval = -EBUSY;
670                         goto err_bindx_rem;
671                 }
672
673                 sa_addr = addr_buf;
674                 af = sctp_get_af_specific(sa_addr->sa.sa_family);
675                 if (!af) {
676                         retval = -EINVAL;
677                         goto err_bindx_rem;
678                 }
679
680                 if (!af->addr_valid(sa_addr, sp, NULL)) {
681                         retval = -EADDRNOTAVAIL;
682                         goto err_bindx_rem;
683                 }
684
685                 if (sa_addr->v4.sin_port &&
686                     sa_addr->v4.sin_port != htons(bp->port)) {
687                         retval = -EINVAL;
688                         goto err_bindx_rem;
689                 }
690
691                 if (!sa_addr->v4.sin_port)
692                         sa_addr->v4.sin_port = htons(bp->port);
693
694                 /* FIXME - There is probably a need to check if sk->sk_saddr and
695                  * sk->sk_rcv_addr are currently set to one of the addresses to
696                  * be removed. This is something which needs to be looked into
697                  * when we are fixing the outstanding issues with multi-homing
698                  * socket routing and failover schemes. Refer to comments in
699                  * sctp_do_bind(). -daisy
700                  */
701                 retval = sctp_del_bind_addr(bp, sa_addr);
702
703                 addr_buf += af->sockaddr_len;
704 err_bindx_rem:
705                 if (retval < 0) {
706                         /* Failed. Add the ones that has been removed back */
707                         if (cnt > 0)
708                                 sctp_bindx_add(sk, addrs, cnt);
709                         return retval;
710                 }
711         }
712
713         return retval;
714 }
715
716 /* Send an ASCONF chunk with Delete IP address parameters to all the peers of
717  * the associations that are part of the endpoint indicating that a list of
718  * local addresses are removed from the endpoint.
719  *
720  * If any of the addresses is already in the bind address list of the
721  * association, we do not send the chunk for that association.  But it will not
722  * affect other associations.
723  *
724  * Only sctp_setsockopt_bindx() is supposed to call this function.
725  */
726 static int sctp_send_asconf_del_ip(struct sock          *sk,
727                                    struct sockaddr      *addrs,
728                                    int                  addrcnt)
729 {
730         struct net *net = sock_net(sk);
731         struct sctp_sock        *sp;
732         struct sctp_endpoint    *ep;
733         struct sctp_association *asoc;
734         struct sctp_transport   *transport;
735         struct sctp_bind_addr   *bp;
736         struct sctp_chunk       *chunk;
737         union sctp_addr         *laddr;
738         void                    *addr_buf;
739         struct sctp_af          *af;
740         struct sctp_sockaddr_entry *saddr;
741         int                     i;
742         int                     retval = 0;
743         int                     stored = 0;
744
745         chunk = NULL;
746         if (!net->sctp.addip_enable)
747                 return retval;
748
749         sp = sctp_sk(sk);
750         ep = sp->ep;
751
752         pr_debug("%s: sk:%p, addrs:%p, addrcnt:%d\n",
753                  __func__, sk, addrs, addrcnt);
754
755         list_for_each_entry(asoc, &ep->asocs, asocs) {
756
757                 if (!asoc->peer.asconf_capable)
758                         continue;
759
760                 if (asoc->peer.addip_disabled_mask & SCTP_PARAM_DEL_IP)
761                         continue;
762
763                 if (!sctp_state(asoc, ESTABLISHED))
764                         continue;
765
766                 /* Check if any address in the packed array of addresses is
767                  * not present in the bind address list of the association.
768                  * If so, do not send the asconf chunk to its peer, but
769                  * continue with other associations.
770                  */
771                 addr_buf = addrs;
772                 for (i = 0; i < addrcnt; i++) {
773                         laddr = addr_buf;
774                         af = sctp_get_af_specific(laddr->v4.sin_family);
775                         if (!af) {
776                                 retval = -EINVAL;
777                                 goto out;
778                         }
779
780                         if (!sctp_assoc_lookup_laddr(asoc, laddr))
781                                 break;
782
783                         addr_buf += af->sockaddr_len;
784                 }
785                 if (i < addrcnt)
786                         continue;
787
788                 /* Find one address in the association's bind address list
789                  * that is not in the packed array of addresses. This is to
790                  * make sure that we do not delete all the addresses in the
791                  * association.
792                  */
793                 bp = &asoc->base.bind_addr;
794                 laddr = sctp_find_unmatch_addr(bp, (union sctp_addr *)addrs,
795                                                addrcnt, sp);
796                 if ((laddr == NULL) && (addrcnt == 1)) {
797                         if (asoc->asconf_addr_del_pending)
798                                 continue;
799                         asoc->asconf_addr_del_pending =
800                             kzalloc(sizeof(union sctp_addr), GFP_ATOMIC);
801                         if (asoc->asconf_addr_del_pending == NULL) {
802                                 retval = -ENOMEM;
803                                 goto out;
804                         }
805                         asoc->asconf_addr_del_pending->sa.sa_family =
806                                     addrs->sa_family;
807                         asoc->asconf_addr_del_pending->v4.sin_port =
808                                     htons(bp->port);
809                         if (addrs->sa_family == AF_INET) {
810                                 struct sockaddr_in *sin;
811
812                                 sin = (struct sockaddr_in *)addrs;
813                                 asoc->asconf_addr_del_pending->v4.sin_addr.s_addr = sin->sin_addr.s_addr;
814                         } else if (addrs->sa_family == AF_INET6) {
815                                 struct sockaddr_in6 *sin6;
816
817                                 sin6 = (struct sockaddr_in6 *)addrs;
818                                 asoc->asconf_addr_del_pending->v6.sin6_addr = sin6->sin6_addr;
819                         }
820
821                         pr_debug("%s: keep the last address asoc:%p %pISc at %p\n",
822                                  __func__, asoc, &asoc->asconf_addr_del_pending->sa,
823                                  asoc->asconf_addr_del_pending);
824
825                         asoc->src_out_of_asoc_ok = 1;
826                         stored = 1;
827                         goto skip_mkasconf;
828                 }
829
830                 if (laddr == NULL)
831                         return -EINVAL;
832
833                 /* We do not need RCU protection throughout this loop
834                  * because this is done under a socket lock from the
835                  * setsockopt call.
836                  */
837                 chunk = sctp_make_asconf_update_ip(asoc, laddr, addrs, addrcnt,
838                                                    SCTP_PARAM_DEL_IP);
839                 if (!chunk) {
840                         retval = -ENOMEM;
841                         goto out;
842                 }
843
844 skip_mkasconf:
845                 /* Reset use_as_src flag for the addresses in the bind address
846                  * list that are to be deleted.
847                  */
848                 addr_buf = addrs;
849                 for (i = 0; i < addrcnt; i++) {
850                         laddr = addr_buf;
851                         af = sctp_get_af_specific(laddr->v4.sin_family);
852                         list_for_each_entry(saddr, &bp->address_list, list) {
853                                 if (sctp_cmp_addr_exact(&saddr->a, laddr))
854                                         saddr->state = SCTP_ADDR_DEL;
855                         }
856                         addr_buf += af->sockaddr_len;
857                 }
858
859                 /* Update the route and saddr entries for all the transports
860                  * as some of the addresses in the bind address list are
861                  * about to be deleted and cannot be used as source addresses.
862                  */
863                 list_for_each_entry(transport, &asoc->peer.transport_addr_list,
864                                         transports) {
865                         sctp_transport_route(transport, NULL,
866                                              sctp_sk(asoc->base.sk));
867                 }
868
869                 if (stored)
870                         /* We don't need to transmit ASCONF */
871                         continue;
872                 retval = sctp_send_asconf(asoc, chunk);
873         }
874 out:
875         return retval;
876 }
877
878 /* set addr events to assocs in the endpoint.  ep and addr_wq must be locked */
879 int sctp_asconf_mgmt(struct sctp_sock *sp, struct sctp_sockaddr_entry *addrw)
880 {
881         struct sock *sk = sctp_opt2sk(sp);
882         union sctp_addr *addr;
883         struct sctp_af *af;
884
885         /* It is safe to write port space in caller. */
886         addr = &addrw->a;
887         addr->v4.sin_port = htons(sp->ep->base.bind_addr.port);
888         af = sctp_get_af_specific(addr->sa.sa_family);
889         if (!af)
890                 return -EINVAL;
891         if (sctp_verify_addr(sk, addr, af->sockaddr_len))
892                 return -EINVAL;
893
894         if (addrw->state == SCTP_ADDR_NEW)
895                 return sctp_send_asconf_add_ip(sk, (struct sockaddr *)addr, 1);
896         else
897                 return sctp_send_asconf_del_ip(sk, (struct sockaddr *)addr, 1);
898 }
899
900 /* Helper for tunneling sctp_bindx() requests through sctp_setsockopt()
901  *
902  * API 8.1
903  * int sctp_bindx(int sd, struct sockaddr *addrs, int addrcnt,
904  *                int flags);
905  *
906  * If sd is an IPv4 socket, the addresses passed must be IPv4 addresses.
907  * If the sd is an IPv6 socket, the addresses passed can either be IPv4
908  * or IPv6 addresses.
909  *
910  * A single address may be specified as INADDR_ANY or IN6ADDR_ANY, see
911  * Section 3.1.2 for this usage.
912  *
913  * addrs is a pointer to an array of one or more socket addresses. Each
914  * address is contained in its appropriate structure (i.e. struct
915  * sockaddr_in or struct sockaddr_in6) the family of the address type
916  * must be used to distinguish the address length (note that this
917  * representation is termed a "packed array" of addresses). The caller
918  * specifies the number of addresses in the array with addrcnt.
919  *
920  * On success, sctp_bindx() returns 0. On failure, sctp_bindx() returns
921  * -1, and sets errno to the appropriate error code.
922  *
923  * For SCTP, the port given in each socket address must be the same, or
924  * sctp_bindx() will fail, setting errno to EINVAL.
925  *
926  * The flags parameter is formed from the bitwise OR of zero or more of
927  * the following currently defined flags:
928  *
929  * SCTP_BINDX_ADD_ADDR
930  *
931  * SCTP_BINDX_REM_ADDR
932  *
933  * SCTP_BINDX_ADD_ADDR directs SCTP to add the given addresses to the
934  * association, and SCTP_BINDX_REM_ADDR directs SCTP to remove the given
935  * addresses from the association. The two flags are mutually exclusive;
936  * if both are given, sctp_bindx() will fail with EINVAL. A caller may
937  * not remove all addresses from an association; sctp_bindx() will
938  * reject such an attempt with EINVAL.
939  *
940  * An application can use sctp_bindx(SCTP_BINDX_ADD_ADDR) to associate
941  * additional addresses with an endpoint after calling bind().  Or use
942  * sctp_bindx(SCTP_BINDX_REM_ADDR) to remove some addresses a listening
943  * socket is associated with so that no new association accepted will be
944  * associated with those addresses. If the endpoint supports dynamic
945  * address a SCTP_BINDX_REM_ADDR or SCTP_BINDX_ADD_ADDR may cause a
946  * endpoint to send the appropriate message to the peer to change the
947  * peers address lists.
948  *
949  * Adding and removing addresses from a connected association is
950  * optional functionality. Implementations that do not support this
951  * functionality should return EOPNOTSUPP.
952  *
953  * Basically do nothing but copying the addresses from user to kernel
954  * land and invoking either sctp_bindx_add() or sctp_bindx_rem() on the sk.
955  * This is used for tunneling the sctp_bindx() request through sctp_setsockopt()
956  * from userspace.
957  *
958  * On exit there is no need to do sockfd_put(), sys_setsockopt() does
959  * it.
960  *
961  * sk        The sk of the socket
962  * addrs     The pointer to the addresses in user land
963  * addrssize Size of the addrs buffer
964  * op        Operation to perform (add or remove, see the flags of
965  *           sctp_bindx)
966  *
967  * Returns 0 if ok, <0 errno code on error.
968  */
969 static int sctp_setsockopt_bindx(struct sock *sk,
970                                  struct sockaddr __user *addrs,
971                                  int addrs_size, int op)
972 {
973         struct sockaddr *kaddrs;
974         int err;
975         int addrcnt = 0;
976         int walk_size = 0;
977         struct sockaddr *sa_addr;
978         void *addr_buf;
979         struct sctp_af *af;
980
981         pr_debug("%s: sk:%p addrs:%p addrs_size:%d opt:%d\n",
982                  __func__, sk, addrs, addrs_size, op);
983
984         if (unlikely(addrs_size <= 0))
985                 return -EINVAL;
986
987         kaddrs = memdup_user(addrs, addrs_size);
988         if (unlikely(IS_ERR(kaddrs)))
989                 return PTR_ERR(kaddrs);
990
991         /* Walk through the addrs buffer and count the number of addresses. */
992         addr_buf = kaddrs;
993         while (walk_size < addrs_size) {
994                 if (walk_size + sizeof(sa_family_t) > addrs_size) {
995                         kfree(kaddrs);
996                         return -EINVAL;
997                 }
998
999                 sa_addr = addr_buf;
1000                 af = sctp_get_af_specific(sa_addr->sa_family);
1001
1002                 /* If the address family is not supported or if this address
1003                  * causes the address buffer to overflow return EINVAL.
1004                  */
1005                 if (!af || (walk_size + af->sockaddr_len) > addrs_size) {
1006                         kfree(kaddrs);
1007                         return -EINVAL;
1008                 }
1009                 addrcnt++;
1010                 addr_buf += af->sockaddr_len;
1011                 walk_size += af->sockaddr_len;
1012         }
1013
1014         /* Do the work. */
1015         switch (op) {
1016         case SCTP_BINDX_ADD_ADDR:
1017                 /* Allow security module to validate bindx addresses. */
1018                 err = security_sctp_bind_connect(sk, SCTP_SOCKOPT_BINDX_ADD,
1019                                                  (struct sockaddr *)kaddrs,
1020                                                  addrs_size);
1021                 if (err)
1022                         goto out;
1023                 err = sctp_bindx_add(sk, kaddrs, addrcnt);
1024                 if (err)
1025                         goto out;
1026                 err = sctp_send_asconf_add_ip(sk, kaddrs, addrcnt);
1027                 break;
1028
1029         case SCTP_BINDX_REM_ADDR:
1030                 err = sctp_bindx_rem(sk, kaddrs, addrcnt);
1031                 if (err)
1032                         goto out;
1033                 err = sctp_send_asconf_del_ip(sk, kaddrs, addrcnt);
1034                 break;
1035
1036         default:
1037                 err = -EINVAL;
1038                 break;
1039         }
1040
1041 out:
1042         kfree(kaddrs);
1043
1044         return err;
1045 }
1046
1047 /* __sctp_connect(struct sock* sk, struct sockaddr *kaddrs, int addrs_size)
1048  *
1049  * Common routine for handling connect() and sctp_connectx().
1050  * Connect will come in with just a single address.
1051  */
1052 static int __sctp_connect(struct sock *sk,
1053                           struct sockaddr *kaddrs,
1054                           int addrs_size, int flags,
1055                           sctp_assoc_t *assoc_id)
1056 {
1057         struct net *net = sock_net(sk);
1058         struct sctp_sock *sp;
1059         struct sctp_endpoint *ep;
1060         struct sctp_association *asoc = NULL;
1061         struct sctp_association *asoc2;
1062         struct sctp_transport *transport;
1063         union sctp_addr to;
1064         enum sctp_scope scope;
1065         long timeo;
1066         int err = 0;
1067         int addrcnt = 0;
1068         int walk_size = 0;
1069         union sctp_addr *sa_addr = NULL;
1070         void *addr_buf;
1071         unsigned short port;
1072
1073         sp = sctp_sk(sk);
1074         ep = sp->ep;
1075
1076         /* connect() cannot be done on a socket that is already in ESTABLISHED
1077          * state - UDP-style peeled off socket or a TCP-style socket that
1078          * is already connected.
1079          * It cannot be done even on a TCP-style listening socket.
1080          */
1081         if (sctp_sstate(sk, ESTABLISHED) || sctp_sstate(sk, CLOSING) ||
1082             (sctp_style(sk, TCP) && sctp_sstate(sk, LISTENING))) {
1083                 err = -EISCONN;
1084                 goto out_free;
1085         }
1086
1087         /* Walk through the addrs buffer and count the number of addresses. */
1088         addr_buf = kaddrs;
1089         while (walk_size < addrs_size) {
1090                 struct sctp_af *af;
1091
1092                 if (walk_size + sizeof(sa_family_t) > addrs_size) {
1093                         err = -EINVAL;
1094                         goto out_free;
1095                 }
1096
1097                 sa_addr = addr_buf;
1098                 af = sctp_get_af_specific(sa_addr->sa.sa_family);
1099
1100                 /* If the address family is not supported or if this address
1101                  * causes the address buffer to overflow return EINVAL.
1102                  */
1103                 if (!af || (walk_size + af->sockaddr_len) > addrs_size) {
1104                         err = -EINVAL;
1105                         goto out_free;
1106                 }
1107
1108                 port = ntohs(sa_addr->v4.sin_port);
1109
1110                 /* Save current address so we can work with it */
1111                 memcpy(&to, sa_addr, af->sockaddr_len);
1112
1113                 err = sctp_verify_addr(sk, &to, af->sockaddr_len);
1114                 if (err)
1115                         goto out_free;
1116
1117                 /* Make sure the destination port is correctly set
1118                  * in all addresses.
1119                  */
1120                 if (asoc && asoc->peer.port && asoc->peer.port != port) {
1121                         err = -EINVAL;
1122                         goto out_free;
1123                 }
1124
1125                 /* Check if there already is a matching association on the
1126                  * endpoint (other than the one created here).
1127                  */
1128                 asoc2 = sctp_endpoint_lookup_assoc(ep, &to, &transport);
1129                 if (asoc2 && asoc2 != asoc) {
1130                         if (asoc2->state >= SCTP_STATE_ESTABLISHED)
1131                                 err = -EISCONN;
1132                         else
1133                                 err = -EALREADY;
1134                         goto out_free;
1135                 }
1136
1137                 /* If we could not find a matching association on the endpoint,
1138                  * make sure that there is no peeled-off association matching
1139                  * the peer address even on another socket.
1140                  */
1141                 if (sctp_endpoint_is_peeled_off(ep, &to)) {
1142                         err = -EADDRNOTAVAIL;
1143                         goto out_free;
1144                 }
1145
1146                 if (!asoc) {
1147                         /* If a bind() or sctp_bindx() is not called prior to
1148                          * an sctp_connectx() call, the system picks an
1149                          * ephemeral port and will choose an address set
1150                          * equivalent to binding with a wildcard address.
1151                          */
1152                         if (!ep->base.bind_addr.port) {
1153                                 if (sctp_autobind(sk)) {
1154                                         err = -EAGAIN;
1155                                         goto out_free;
1156                                 }
1157                         } else {
1158                                 /*
1159                                  * If an unprivileged user inherits a 1-many
1160                                  * style socket with open associations on a
1161                                  * privileged port, it MAY be permitted to
1162                                  * accept new associations, but it SHOULD NOT
1163                                  * be permitted to open new associations.
1164                                  */
1165                                 if (ep->base.bind_addr.port <
1166                                     inet_prot_sock(net) &&
1167                                     !ns_capable(net->user_ns,
1168                                     CAP_NET_BIND_SERVICE)) {
1169                                         err = -EACCES;
1170                                         goto out_free;
1171                                 }
1172                         }
1173
1174                         scope = sctp_scope(&to);
1175                         asoc = sctp_association_new(ep, sk, scope, GFP_KERNEL);
1176                         if (!asoc) {
1177                                 err = -ENOMEM;
1178                                 goto out_free;
1179                         }
1180
1181                         err = sctp_assoc_set_bind_addr_from_ep(asoc, scope,
1182                                                               GFP_KERNEL);
1183                         if (err < 0) {
1184                                 goto out_free;
1185                         }
1186
1187                 }
1188
1189                 /* Prime the peer's transport structures.  */
1190                 transport = sctp_assoc_add_peer(asoc, &to, GFP_KERNEL,
1191                                                 SCTP_UNKNOWN);
1192                 if (!transport) {
1193                         err = -ENOMEM;
1194                         goto out_free;
1195                 }
1196
1197                 addrcnt++;
1198                 addr_buf += af->sockaddr_len;
1199                 walk_size += af->sockaddr_len;
1200         }
1201
1202         /* In case the user of sctp_connectx() wants an association
1203          * id back, assign one now.
1204          */
1205         if (assoc_id) {
1206                 err = sctp_assoc_set_id(asoc, GFP_KERNEL);
1207                 if (err < 0)
1208                         goto out_free;
1209         }
1210
1211         err = sctp_primitive_ASSOCIATE(net, asoc, NULL);
1212         if (err < 0) {
1213                 goto out_free;
1214         }
1215
1216         /* Initialize sk's dport and daddr for getpeername() */
1217         inet_sk(sk)->inet_dport = htons(asoc->peer.port);
1218         sp->pf->to_sk_daddr(sa_addr, sk);
1219         sk->sk_err = 0;
1220
1221         timeo = sock_sndtimeo(sk, flags & O_NONBLOCK);
1222
1223         if (assoc_id)
1224                 *assoc_id = asoc->assoc_id;
1225
1226         err = sctp_wait_for_connect(asoc, &timeo);
1227         /* Note: the asoc may be freed after the return of
1228          * sctp_wait_for_connect.
1229          */
1230
1231         /* Don't free association on exit. */
1232         asoc = NULL;
1233
1234 out_free:
1235         pr_debug("%s: took out_free path with asoc:%p kaddrs:%p err:%d\n",
1236                  __func__, asoc, kaddrs, err);
1237
1238         if (asoc) {
1239                 /* sctp_primitive_ASSOCIATE may have added this association
1240                  * To the hash table, try to unhash it, just in case, its a noop
1241                  * if it wasn't hashed so we're safe
1242                  */
1243                 sctp_association_free(asoc);
1244         }
1245         return err;
1246 }
1247
1248 /* Helper for tunneling sctp_connectx() requests through sctp_setsockopt()
1249  *
1250  * API 8.9
1251  * int sctp_connectx(int sd, struct sockaddr *addrs, int addrcnt,
1252  *                      sctp_assoc_t *asoc);
1253  *
1254  * If sd is an IPv4 socket, the addresses passed must be IPv4 addresses.
1255  * If the sd is an IPv6 socket, the addresses passed can either be IPv4
1256  * or IPv6 addresses.
1257  *
1258  * A single address may be specified as INADDR_ANY or IN6ADDR_ANY, see
1259  * Section 3.1.2 for this usage.
1260  *
1261  * addrs is a pointer to an array of one or more socket addresses. Each
1262  * address is contained in its appropriate structure (i.e. struct
1263  * sockaddr_in or struct sockaddr_in6) the family of the address type
1264  * must be used to distengish the address length (note that this
1265  * representation is termed a "packed array" of addresses). The caller
1266  * specifies the number of addresses in the array with addrcnt.
1267  *
1268  * On success, sctp_connectx() returns 0. It also sets the assoc_id to
1269  * the association id of the new association.  On failure, sctp_connectx()
1270  * returns -1, and sets errno to the appropriate error code.  The assoc_id
1271  * is not touched by the kernel.
1272  *
1273  * For SCTP, the port given in each socket address must be the same, or
1274  * sctp_connectx() will fail, setting errno to EINVAL.
1275  *
1276  * An application can use sctp_connectx to initiate an association with
1277  * an endpoint that is multi-homed.  Much like sctp_bindx() this call
1278  * allows a caller to specify multiple addresses at which a peer can be
1279  * reached.  The way the SCTP stack uses the list of addresses to set up
1280  * the association is implementation dependent.  This function only
1281  * specifies that the stack will try to make use of all the addresses in
1282  * the list when needed.
1283  *
1284  * Note that the list of addresses passed in is only used for setting up
1285  * the association.  It does not necessarily equal the set of addresses
1286  * the peer uses for the resulting association.  If the caller wants to
1287  * find out the set of peer addresses, it must use sctp_getpaddrs() to
1288  * retrieve them after the association has been set up.
1289  *
1290  * Basically do nothing but copying the addresses from user to kernel
1291  * land and invoking either sctp_connectx(). This is used for tunneling
1292  * the sctp_connectx() request through sctp_setsockopt() from userspace.
1293  *
1294  * On exit there is no need to do sockfd_put(), sys_setsockopt() does
1295  * it.
1296  *
1297  * sk        The sk of the socket
1298  * addrs     The pointer to the addresses in user land
1299  * addrssize Size of the addrs buffer
1300  *
1301  * Returns >=0 if ok, <0 errno code on error.
1302  */
1303 static int __sctp_setsockopt_connectx(struct sock *sk,
1304                                       struct sockaddr __user *addrs,
1305                                       int addrs_size,
1306                                       sctp_assoc_t *assoc_id)
1307 {
1308         struct sockaddr *kaddrs;
1309         int err = 0, flags = 0;
1310
1311         pr_debug("%s: sk:%p addrs:%p addrs_size:%d\n",
1312                  __func__, sk, addrs, addrs_size);
1313
1314         if (unlikely(addrs_size <= 0))
1315                 return -EINVAL;
1316
1317         kaddrs = memdup_user(addrs, addrs_size);
1318         if (unlikely(IS_ERR(kaddrs)))
1319                 return PTR_ERR(kaddrs);
1320
1321         /* Allow security module to validate connectx addresses. */
1322         err = security_sctp_bind_connect(sk, SCTP_SOCKOPT_CONNECTX,
1323                                          (struct sockaddr *)kaddrs,
1324                                           addrs_size);
1325         if (err)
1326                 goto out_free;
1327
1328         /* in-kernel sockets don't generally have a file allocated to them
1329          * if all they do is call sock_create_kern().
1330          */
1331         if (sk->sk_socket->file)
1332                 flags = sk->sk_socket->file->f_flags;
1333
1334         err = __sctp_connect(sk, kaddrs, addrs_size, flags, assoc_id);
1335
1336 out_free:
1337         kfree(kaddrs);
1338
1339         return err;
1340 }
1341
1342 /*
1343  * This is an older interface.  It's kept for backward compatibility
1344  * to the option that doesn't provide association id.
1345  */
1346 static int sctp_setsockopt_connectx_old(struct sock *sk,
1347                                         struct sockaddr __user *addrs,
1348                                         int addrs_size)
1349 {
1350         return __sctp_setsockopt_connectx(sk, addrs, addrs_size, NULL);
1351 }
1352
1353 /*
1354  * New interface for the API.  The since the API is done with a socket
1355  * option, to make it simple we feed back the association id is as a return
1356  * indication to the call.  Error is always negative and association id is
1357  * always positive.
1358  */
1359 static int sctp_setsockopt_connectx(struct sock *sk,
1360                                     struct sockaddr __user *addrs,
1361                                     int addrs_size)
1362 {
1363         sctp_assoc_t assoc_id = 0;
1364         int err = 0;
1365
1366         err = __sctp_setsockopt_connectx(sk, addrs, addrs_size, &assoc_id);
1367
1368         if (err)
1369                 return err;
1370         else
1371                 return assoc_id;
1372 }
1373
1374 /*
1375  * New (hopefully final) interface for the API.
1376  * We use the sctp_getaddrs_old structure so that use-space library
1377  * can avoid any unnecessary allocations. The only different part
1378  * is that we store the actual length of the address buffer into the
1379  * addrs_num structure member. That way we can re-use the existing
1380  * code.
1381  */
1382 #ifdef CONFIG_COMPAT
1383 struct compat_sctp_getaddrs_old {
1384         sctp_assoc_t    assoc_id;
1385         s32             addr_num;
1386         compat_uptr_t   addrs;          /* struct sockaddr * */
1387 };
1388 #endif
1389
1390 static int sctp_getsockopt_connectx3(struct sock *sk, int len,
1391                                      char __user *optval,
1392                                      int __user *optlen)
1393 {
1394         struct sctp_getaddrs_old param;
1395         sctp_assoc_t assoc_id = 0;
1396         int err = 0;
1397
1398 #ifdef CONFIG_COMPAT
1399         if (in_compat_syscall()) {
1400                 struct compat_sctp_getaddrs_old param32;
1401
1402                 if (len < sizeof(param32))
1403                         return -EINVAL;
1404                 if (copy_from_user(&param32, optval, sizeof(param32)))
1405                         return -EFAULT;
1406
1407                 param.assoc_id = param32.assoc_id;
1408                 param.addr_num = param32.addr_num;
1409                 param.addrs = compat_ptr(param32.addrs);
1410         } else
1411 #endif
1412         {
1413                 if (len < sizeof(param))
1414                         return -EINVAL;
1415                 if (copy_from_user(&param, optval, sizeof(param)))
1416                         return -EFAULT;
1417         }
1418
1419         err = __sctp_setsockopt_connectx(sk, (struct sockaddr __user *)
1420                                          param.addrs, param.addr_num,
1421                                          &assoc_id);
1422         if (err == 0 || err == -EINPROGRESS) {
1423                 if (copy_to_user(optval, &assoc_id, sizeof(assoc_id)))
1424                         return -EFAULT;
1425                 if (put_user(sizeof(assoc_id), optlen))
1426                         return -EFAULT;
1427         }
1428
1429         return err;
1430 }
1431
1432 /* API 3.1.4 close() - UDP Style Syntax
1433  * Applications use close() to perform graceful shutdown (as described in
1434  * Section 10.1 of [SCTP]) on ALL the associations currently represented
1435  * by a UDP-style socket.
1436  *
1437  * The syntax is
1438  *
1439  *   ret = close(int sd);
1440  *
1441  *   sd      - the socket descriptor of the associations to be closed.
1442  *
1443  * To gracefully shutdown a specific association represented by the
1444  * UDP-style socket, an application should use the sendmsg() call,
1445  * passing no user data, but including the appropriate flag in the
1446  * ancillary data (see Section xxxx).
1447  *
1448  * If sd in the close() call is a branched-off socket representing only
1449  * one association, the shutdown is performed on that association only.
1450  *
1451  * 4.1.6 close() - TCP Style Syntax
1452  *
1453  * Applications use close() to gracefully close down an association.
1454  *
1455  * The syntax is:
1456  *
1457  *    int close(int sd);
1458  *
1459  *      sd      - the socket descriptor of the association to be closed.
1460  *
1461  * After an application calls close() on a socket descriptor, no further
1462  * socket operations will succeed on that descriptor.
1463  *
1464  * API 7.1.4 SO_LINGER
1465  *
1466  * An application using the TCP-style socket can use this option to
1467  * perform the SCTP ABORT primitive.  The linger option structure is:
1468  *
1469  *  struct  linger {
1470  *     int     l_onoff;                // option on/off
1471  *     int     l_linger;               // linger time
1472  * };
1473  *
1474  * To enable the option, set l_onoff to 1.  If the l_linger value is set
1475  * to 0, calling close() is the same as the ABORT primitive.  If the
1476  * value is set to a negative value, the setsockopt() call will return
1477  * an error.  If the value is set to a positive value linger_time, the
1478  * close() can be blocked for at most linger_time ms.  If the graceful
1479  * shutdown phase does not finish during this period, close() will
1480  * return but the graceful shutdown phase continues in the system.
1481  */
1482 static void sctp_close(struct sock *sk, long timeout)
1483 {
1484         struct net *net = sock_net(sk);
1485         struct sctp_endpoint *ep;
1486         struct sctp_association *asoc;
1487         struct list_head *pos, *temp;
1488         unsigned int data_was_unread;
1489
1490         pr_debug("%s: sk:%p, timeout:%ld\n", __func__, sk, timeout);
1491
1492         lock_sock_nested(sk, SINGLE_DEPTH_NESTING);
1493         sk->sk_shutdown = SHUTDOWN_MASK;
1494         inet_sk_set_state(sk, SCTP_SS_CLOSING);
1495
1496         ep = sctp_sk(sk)->ep;
1497
1498         /* Clean up any skbs sitting on the receive queue.  */
1499         data_was_unread = sctp_queue_purge_ulpevents(&sk->sk_receive_queue);
1500         data_was_unread += sctp_queue_purge_ulpevents(&sctp_sk(sk)->pd_lobby);
1501
1502         /* Walk all associations on an endpoint.  */
1503         list_for_each_safe(pos, temp, &ep->asocs) {
1504                 asoc = list_entry(pos, struct sctp_association, asocs);
1505
1506                 if (sctp_style(sk, TCP)) {
1507                         /* A closed association can still be in the list if
1508                          * it belongs to a TCP-style listening socket that is
1509                          * not yet accepted. If so, free it. If not, send an
1510                          * ABORT or SHUTDOWN based on the linger options.
1511                          */
1512                         if (sctp_state(asoc, CLOSED)) {
1513                                 sctp_association_free(asoc);
1514                                 continue;
1515                         }
1516                 }
1517
1518                 if (data_was_unread || !skb_queue_empty(&asoc->ulpq.lobby) ||
1519                     !skb_queue_empty(&asoc->ulpq.reasm) ||
1520                     !skb_queue_empty(&asoc->ulpq.reasm_uo) ||
1521                     (sock_flag(sk, SOCK_LINGER) && !sk->sk_lingertime)) {
1522                         struct sctp_chunk *chunk;
1523
1524                         chunk = sctp_make_abort_user(asoc, NULL, 0);
1525                         sctp_primitive_ABORT(net, asoc, chunk);
1526                 } else
1527                         sctp_primitive_SHUTDOWN(net, asoc, NULL);
1528         }
1529
1530         /* On a TCP-style socket, block for at most linger_time if set. */
1531         if (sctp_style(sk, TCP) && timeout)
1532                 sctp_wait_for_close(sk, timeout);
1533
1534         /* This will run the backlog queue.  */
1535         release_sock(sk);
1536
1537         /* Supposedly, no process has access to the socket, but
1538          * the net layers still may.
1539          * Also, sctp_destroy_sock() needs to be called with addr_wq_lock
1540          * held and that should be grabbed before socket lock.
1541          */
1542         spin_lock_bh(&net->sctp.addr_wq_lock);
1543         bh_lock_sock_nested(sk);
1544
1545         /* Hold the sock, since sk_common_release() will put sock_put()
1546          * and we have just a little more cleanup.
1547          */
1548         sock_hold(sk);
1549         sk_common_release(sk);
1550
1551         bh_unlock_sock(sk);
1552         spin_unlock_bh(&net->sctp.addr_wq_lock);
1553
1554         sock_put(sk);
1555
1556         SCTP_DBG_OBJCNT_DEC(sock);
1557 }
1558
1559 /* Handle EPIPE error. */
1560 static int sctp_error(struct sock *sk, int flags, int err)
1561 {
1562         if (err == -EPIPE)
1563                 err = sock_error(sk) ? : -EPIPE;
1564         if (err == -EPIPE && !(flags & MSG_NOSIGNAL))
1565                 send_sig(SIGPIPE, current, 0);
1566         return err;
1567 }
1568
1569 /* API 3.1.3 sendmsg() - UDP Style Syntax
1570  *
1571  * An application uses sendmsg() and recvmsg() calls to transmit data to
1572  * and receive data from its peer.
1573  *
1574  *  ssize_t sendmsg(int socket, const struct msghdr *message,
1575  *                  int flags);
1576  *
1577  *  socket  - the socket descriptor of the endpoint.
1578  *  message - pointer to the msghdr structure which contains a single
1579  *            user message and possibly some ancillary data.
1580  *
1581  *            See Section 5 for complete description of the data
1582  *            structures.
1583  *
1584  *  flags   - flags sent or received with the user message, see Section
1585  *            5 for complete description of the flags.
1586  *
1587  * Note:  This function could use a rewrite especially when explicit
1588  * connect support comes in.
1589  */
1590 /* BUG:  We do not implement the equivalent of sk_stream_wait_memory(). */
1591
1592 static int sctp_msghdr_parse(const struct msghdr *msg,
1593                              struct sctp_cmsgs *cmsgs);
1594
1595 static int sctp_sendmsg_parse(struct sock *sk, struct sctp_cmsgs *cmsgs,
1596                               struct sctp_sndrcvinfo *srinfo,
1597                               const struct msghdr *msg, size_t msg_len)
1598 {
1599         __u16 sflags;
1600         int err;
1601
1602         if (sctp_sstate(sk, LISTENING) && sctp_style(sk, TCP))
1603                 return -EPIPE;
1604
1605         if (msg_len > sk->sk_sndbuf)
1606                 return -EMSGSIZE;
1607
1608         memset(cmsgs, 0, sizeof(*cmsgs));
1609         err = sctp_msghdr_parse(msg, cmsgs);
1610         if (err) {
1611                 pr_debug("%s: msghdr parse err:%x\n", __func__, err);
1612                 return err;
1613         }
1614
1615         memset(srinfo, 0, sizeof(*srinfo));
1616         if (cmsgs->srinfo) {
1617                 srinfo->sinfo_stream = cmsgs->srinfo->sinfo_stream;
1618                 srinfo->sinfo_flags = cmsgs->srinfo->sinfo_flags;
1619                 srinfo->sinfo_ppid = cmsgs->srinfo->sinfo_ppid;
1620                 srinfo->sinfo_context = cmsgs->srinfo->sinfo_context;
1621                 srinfo->sinfo_assoc_id = cmsgs->srinfo->sinfo_assoc_id;
1622                 srinfo->sinfo_timetolive = cmsgs->srinfo->sinfo_timetolive;
1623         }
1624
1625         if (cmsgs->sinfo) {
1626                 srinfo->sinfo_stream = cmsgs->sinfo->snd_sid;
1627                 srinfo->sinfo_flags = cmsgs->sinfo->snd_flags;
1628                 srinfo->sinfo_ppid = cmsgs->sinfo->snd_ppid;
1629                 srinfo->sinfo_context = cmsgs->sinfo->snd_context;
1630                 srinfo->sinfo_assoc_id = cmsgs->sinfo->snd_assoc_id;
1631         }
1632
1633         if (cmsgs->prinfo) {
1634                 srinfo->sinfo_timetolive = cmsgs->prinfo->pr_value;
1635                 SCTP_PR_SET_POLICY(srinfo->sinfo_flags,
1636                                    cmsgs->prinfo->pr_policy);
1637         }
1638
1639         sflags = srinfo->sinfo_flags;
1640         if (!sflags && msg_len)
1641                 return 0;
1642
1643         if (sctp_style(sk, TCP) && (sflags & (SCTP_EOF | SCTP_ABORT)))
1644                 return -EINVAL;
1645
1646         if (((sflags & SCTP_EOF) && msg_len > 0) ||
1647             (!(sflags & (SCTP_EOF | SCTP_ABORT)) && msg_len == 0))
1648                 return -EINVAL;
1649
1650         if ((sflags & SCTP_ADDR_OVER) && !msg->msg_name)
1651                 return -EINVAL;
1652
1653         return 0;
1654 }
1655
1656 static int sctp_sendmsg_new_asoc(struct sock *sk, __u16 sflags,
1657                                  struct sctp_cmsgs *cmsgs,
1658                                  union sctp_addr *daddr,
1659                                  struct sctp_transport **tp)
1660 {
1661         struct sctp_endpoint *ep = sctp_sk(sk)->ep;
1662         struct net *net = sock_net(sk);
1663         struct sctp_association *asoc;
1664         enum sctp_scope scope;
1665         struct cmsghdr *cmsg;
1666         __be32 flowinfo = 0;
1667         struct sctp_af *af;
1668         int err;
1669
1670         *tp = NULL;
1671
1672         if (sflags & (SCTP_EOF | SCTP_ABORT))
1673                 return -EINVAL;
1674
1675         if (sctp_style(sk, TCP) && (sctp_sstate(sk, ESTABLISHED) ||
1676                                     sctp_sstate(sk, CLOSING)))
1677                 return -EADDRNOTAVAIL;
1678
1679         if (sctp_endpoint_is_peeled_off(ep, daddr))
1680                 return -EADDRNOTAVAIL;
1681
1682         if (!ep->base.bind_addr.port) {
1683                 if (sctp_autobind(sk))
1684                         return -EAGAIN;
1685         } else {
1686                 if (ep->base.bind_addr.port < inet_prot_sock(net) &&
1687                     !ns_capable(net->user_ns, CAP_NET_BIND_SERVICE))
1688                         return -EACCES;
1689         }
1690
1691         scope = sctp_scope(daddr);
1692
1693         /* Label connection socket for first association 1-to-many
1694          * style for client sequence socket()->sendmsg(). This
1695          * needs to be done before sctp_assoc_add_peer() as that will
1696          * set up the initial packet that needs to account for any
1697          * security ip options (CIPSO/CALIPSO) added to the packet.
1698          */
1699         af = sctp_get_af_specific(daddr->sa.sa_family);
1700         if (!af)
1701                 return -EINVAL;
1702         err = security_sctp_bind_connect(sk, SCTP_SENDMSG_CONNECT,
1703                                          (struct sockaddr *)daddr,
1704                                          af->sockaddr_len);
1705         if (err < 0)
1706                 return err;
1707
1708         asoc = sctp_association_new(ep, sk, scope, GFP_KERNEL);
1709         if (!asoc)
1710                 return -ENOMEM;
1711
1712         if (sctp_assoc_set_bind_addr_from_ep(asoc, scope, GFP_KERNEL) < 0) {
1713                 err = -ENOMEM;
1714                 goto free;
1715         }
1716
1717         if (cmsgs->init) {
1718                 struct sctp_initmsg *init = cmsgs->init;
1719
1720                 if (init->sinit_num_ostreams) {
1721                         __u16 outcnt = init->sinit_num_ostreams;
1722
1723                         asoc->c.sinit_num_ostreams = outcnt;
1724                         /* outcnt has been changed, need to re-init stream */
1725                         err = sctp_stream_init(&asoc->stream, outcnt, 0,
1726                                                GFP_KERNEL);
1727                         if (err)
1728                                 goto free;
1729                 }
1730
1731                 if (init->sinit_max_instreams)
1732                         asoc->c.sinit_max_instreams = init->sinit_max_instreams;
1733
1734                 if (init->sinit_max_attempts)
1735                         asoc->max_init_attempts = init->sinit_max_attempts;
1736
1737                 if (init->sinit_max_init_timeo)
1738                         asoc->max_init_timeo =
1739                                 msecs_to_jiffies(init->sinit_max_init_timeo);
1740         }
1741
1742         *tp = sctp_assoc_add_peer(asoc, daddr, GFP_KERNEL, SCTP_UNKNOWN);
1743         if (!*tp) {
1744                 err = -ENOMEM;
1745                 goto free;
1746         }
1747
1748         if (!cmsgs->addrs_msg)
1749                 return 0;
1750
1751         if (daddr->sa.sa_family == AF_INET6)
1752                 flowinfo = daddr->v6.sin6_flowinfo;
1753
1754         /* sendv addr list parse */
1755         for_each_cmsghdr(cmsg, cmsgs->addrs_msg) {
1756                 struct sctp_transport *transport;
1757                 struct sctp_association *old;
1758                 union sctp_addr _daddr;
1759                 int dlen;
1760
1761                 if (cmsg->cmsg_level != IPPROTO_SCTP ||
1762                     (cmsg->cmsg_type != SCTP_DSTADDRV4 &&
1763                      cmsg->cmsg_type != SCTP_DSTADDRV6))
1764                         continue;
1765
1766                 daddr = &_daddr;
1767                 memset(daddr, 0, sizeof(*daddr));
1768                 dlen = cmsg->cmsg_len - sizeof(struct cmsghdr);
1769                 if (cmsg->cmsg_type == SCTP_DSTADDRV4) {
1770                         if (dlen < sizeof(struct in_addr)) {
1771                                 err = -EINVAL;
1772                                 goto free;
1773                         }
1774
1775                         dlen = sizeof(struct in_addr);
1776                         daddr->v4.sin_family = AF_INET;
1777                         daddr->v4.sin_port = htons(asoc->peer.port);
1778                         memcpy(&daddr->v4.sin_addr, CMSG_DATA(cmsg), dlen);
1779                 } else {
1780                         if (dlen < sizeof(struct in6_addr)) {
1781                                 err = -EINVAL;
1782                                 goto free;
1783                         }
1784
1785                         dlen = sizeof(struct in6_addr);
1786                         daddr->v6.sin6_flowinfo = flowinfo;
1787                         daddr->v6.sin6_family = AF_INET6;
1788                         daddr->v6.sin6_port = htons(asoc->peer.port);
1789                         memcpy(&daddr->v6.sin6_addr, CMSG_DATA(cmsg), dlen);
1790                 }
1791                 err = sctp_verify_addr(sk, daddr, sizeof(*daddr));
1792                 if (err)
1793                         goto free;
1794
1795                 old = sctp_endpoint_lookup_assoc(ep, daddr, &transport);
1796                 if (old && old != asoc) {
1797                         if (old->state >= SCTP_STATE_ESTABLISHED)
1798                                 err = -EISCONN;
1799                         else
1800                                 err = -EALREADY;
1801                         goto free;
1802                 }
1803
1804                 if (sctp_endpoint_is_peeled_off(ep, daddr)) {
1805                         err = -EADDRNOTAVAIL;
1806                         goto free;
1807                 }
1808
1809                 transport = sctp_assoc_add_peer(asoc, daddr, GFP_KERNEL,
1810                                                 SCTP_UNKNOWN);
1811                 if (!transport) {
1812                         err = -ENOMEM;
1813                         goto free;
1814                 }
1815         }
1816
1817         return 0;
1818
1819 free:
1820         sctp_association_free(asoc);
1821         return err;
1822 }
1823
1824 static int sctp_sendmsg_check_sflags(struct sctp_association *asoc,
1825                                      __u16 sflags, struct msghdr *msg,
1826                                      size_t msg_len)
1827 {
1828         struct sock *sk = asoc->base.sk;
1829         struct net *net = sock_net(sk);
1830
1831         if (sctp_state(asoc, CLOSED) && sctp_style(sk, TCP))
1832                 return -EPIPE;
1833
1834         if ((sflags & SCTP_SENDALL) && sctp_style(sk, UDP) &&
1835             !sctp_state(asoc, ESTABLISHED))
1836                 return 0;
1837
1838         if (sflags & SCTP_EOF) {
1839                 pr_debug("%s: shutting down association:%p\n", __func__, asoc);
1840                 sctp_primitive_SHUTDOWN(net, asoc, NULL);
1841
1842                 return 0;
1843         }
1844
1845         if (sflags & SCTP_ABORT) {
1846                 struct sctp_chunk *chunk;
1847
1848                 chunk = sctp_make_abort_user(asoc, msg, msg_len);
1849                 if (!chunk)
1850                         return -ENOMEM;
1851
1852                 pr_debug("%s: aborting association:%p\n", __func__, asoc);
1853                 sctp_primitive_ABORT(net, asoc, chunk);
1854                 iov_iter_revert(&msg->msg_iter, msg_len);
1855
1856                 return 0;
1857         }
1858
1859         return 1;
1860 }
1861
1862 static int sctp_sendmsg_to_asoc(struct sctp_association *asoc,
1863                                 struct msghdr *msg, size_t msg_len,
1864                                 struct sctp_transport *transport,
1865                                 struct sctp_sndrcvinfo *sinfo)
1866 {
1867         struct sock *sk = asoc->base.sk;
1868         struct sctp_sock *sp = sctp_sk(sk);
1869         struct net *net = sock_net(sk);
1870         struct sctp_datamsg *datamsg;
1871         bool wait_connect = false;
1872         struct sctp_chunk *chunk;
1873         long timeo;
1874         int err;
1875
1876         if (sinfo->sinfo_stream >= asoc->stream.outcnt) {
1877                 err = -EINVAL;
1878                 goto err;
1879         }
1880
1881         if (unlikely(!SCTP_SO(&asoc->stream, sinfo->sinfo_stream)->ext)) {
1882                 err = sctp_stream_init_ext(&asoc->stream, sinfo->sinfo_stream);
1883                 if (err)
1884                         goto err;
1885         }
1886
1887         if (sp->disable_fragments && msg_len > asoc->frag_point) {
1888                 err = -EMSGSIZE;
1889                 goto err;
1890         }
1891
1892         if (asoc->pmtu_pending) {
1893                 if (sp->param_flags & SPP_PMTUD_ENABLE)
1894                         sctp_assoc_sync_pmtu(asoc);
1895                 asoc->pmtu_pending = 0;
1896         }
1897
1898         if (sctp_wspace(asoc) < (int)msg_len)
1899                 sctp_prsctp_prune(asoc, sinfo, msg_len - sctp_wspace(asoc));
1900
1901         if (sk_under_memory_pressure(sk))
1902                 sk_mem_reclaim(sk);
1903
1904         if (sctp_wspace(asoc) <= 0 || !sk_wmem_schedule(sk, msg_len)) {
1905                 timeo = sock_sndtimeo(sk, msg->msg_flags & MSG_DONTWAIT);
1906                 err = sctp_wait_for_sndbuf(asoc, &timeo, msg_len);
1907                 if (err)
1908                         goto err;
1909         }
1910
1911         if (sctp_state(asoc, CLOSED)) {
1912                 err = sctp_primitive_ASSOCIATE(net, asoc, NULL);
1913                 if (err)
1914                         goto err;
1915
1916                 if (sp->strm_interleave) {
1917                         timeo = sock_sndtimeo(sk, 0);
1918                         err = sctp_wait_for_connect(asoc, &timeo);
1919                         if (err) {
1920                                 err = -ESRCH;
1921                                 goto err;
1922                         }
1923                 } else {
1924                         wait_connect = true;
1925                 }
1926
1927                 pr_debug("%s: we associated primitively\n", __func__);
1928         }
1929
1930         datamsg = sctp_datamsg_from_user(asoc, sinfo, &msg->msg_iter);
1931         if (IS_ERR(datamsg)) {
1932                 err = PTR_ERR(datamsg);
1933                 goto err;
1934         }
1935
1936         asoc->force_delay = !!(msg->msg_flags & MSG_MORE);
1937
1938         list_for_each_entry(chunk, &datamsg->chunks, frag_list) {
1939                 sctp_chunk_hold(chunk);
1940                 sctp_set_owner_w(chunk);
1941                 chunk->transport = transport;
1942         }
1943
1944         err = sctp_primitive_SEND(net, asoc, datamsg);
1945         if (err) {
1946                 sctp_datamsg_free(datamsg);
1947                 goto err;
1948         }
1949
1950         pr_debug("%s: we sent primitively\n", __func__);
1951
1952         sctp_datamsg_put(datamsg);
1953
1954         if (unlikely(wait_connect)) {
1955                 timeo = sock_sndtimeo(sk, msg->msg_flags & MSG_DONTWAIT);
1956                 sctp_wait_for_connect(asoc, &timeo);
1957         }
1958
1959         err = msg_len;
1960
1961 err:
1962         return err;
1963 }
1964
1965 static union sctp_addr *sctp_sendmsg_get_daddr(struct sock *sk,
1966                                                const struct msghdr *msg,
1967                                                struct sctp_cmsgs *cmsgs)
1968 {
1969         union sctp_addr *daddr = NULL;
1970         int err;
1971
1972         if (!sctp_style(sk, UDP_HIGH_BANDWIDTH) && msg->msg_name) {
1973                 int len = msg->msg_namelen;
1974
1975                 if (len > sizeof(*daddr))
1976                         len = sizeof(*daddr);
1977
1978                 daddr = (union sctp_addr *)msg->msg_name;
1979
1980                 err = sctp_verify_addr(sk, daddr, len);
1981                 if (err)
1982                         return ERR_PTR(err);
1983         }
1984
1985         return daddr;
1986 }
1987
1988 static void sctp_sendmsg_update_sinfo(struct sctp_association *asoc,
1989                                       struct sctp_sndrcvinfo *sinfo,
1990                                       struct sctp_cmsgs *cmsgs)
1991 {
1992         if (!cmsgs->srinfo && !cmsgs->sinfo) {
1993                 sinfo->sinfo_stream = asoc->default_stream;
1994                 sinfo->sinfo_ppid = asoc->default_ppid;
1995                 sinfo->sinfo_context = asoc->default_context;
1996                 sinfo->sinfo_assoc_id = sctp_assoc2id(asoc);
1997
1998                 if (!cmsgs->prinfo)
1999                         sinfo->sinfo_flags = asoc->default_flags;
2000         }
2001
2002         if (!cmsgs->srinfo && !cmsgs->prinfo)
2003                 sinfo->sinfo_timetolive = asoc->default_timetolive;
2004
2005         if (cmsgs->authinfo) {
2006                 /* Reuse sinfo_tsn to indicate that authinfo was set and
2007                  * sinfo_ssn to save the keyid on tx path.
2008                  */
2009                 sinfo->sinfo_tsn = 1;
2010                 sinfo->sinfo_ssn = cmsgs->authinfo->auth_keynumber;
2011         }
2012 }
2013
2014 static int sctp_sendmsg(struct sock *sk, struct msghdr *msg, size_t msg_len)
2015 {
2016         struct sctp_endpoint *ep = sctp_sk(sk)->ep;
2017         struct sctp_transport *transport = NULL;
2018         struct sctp_sndrcvinfo _sinfo, *sinfo;
2019         struct sctp_association *asoc, *tmp;
2020         struct sctp_cmsgs cmsgs;
2021         union sctp_addr *daddr;
2022         bool new = false;
2023         __u16 sflags;
2024         int err;
2025
2026         /* Parse and get snd_info */
2027         err = sctp_sendmsg_parse(sk, &cmsgs, &_sinfo, msg, msg_len);
2028         if (err)
2029                 goto out;
2030
2031         sinfo  = &_sinfo;
2032         sflags = sinfo->sinfo_flags;
2033
2034         /* Get daddr from msg */
2035         daddr = sctp_sendmsg_get_daddr(sk, msg, &cmsgs);
2036         if (IS_ERR(daddr)) {
2037                 err = PTR_ERR(daddr);
2038                 goto out;
2039         }
2040
2041         lock_sock(sk);
2042
2043         /* SCTP_SENDALL process */
2044         if ((sflags & SCTP_SENDALL) && sctp_style(sk, UDP)) {
2045                 list_for_each_entry_safe(asoc, tmp, &ep->asocs, asocs) {
2046                         err = sctp_sendmsg_check_sflags(asoc, sflags, msg,
2047                                                         msg_len);
2048                         if (err == 0)
2049                                 continue;
2050                         if (err < 0)
2051                                 goto out_unlock;
2052
2053                         sctp_sendmsg_update_sinfo(asoc, sinfo, &cmsgs);
2054
2055                         err = sctp_sendmsg_to_asoc(asoc, msg, msg_len,
2056                                                    NULL, sinfo);
2057                         if (err < 0)
2058                                 goto out_unlock;
2059
2060                         iov_iter_revert(&msg->msg_iter, err);
2061                 }
2062
2063                 goto out_unlock;
2064         }
2065
2066         /* Get and check or create asoc */
2067         if (daddr) {
2068                 asoc = sctp_endpoint_lookup_assoc(ep, daddr, &transport);
2069                 if (asoc) {
2070                         err = sctp_sendmsg_check_sflags(asoc, sflags, msg,
2071                                                         msg_len);
2072                         if (err <= 0)
2073                                 goto out_unlock;
2074                 } else {
2075                         err = sctp_sendmsg_new_asoc(sk, sflags, &cmsgs, daddr,
2076                                                     &transport);
2077                         if (err)
2078                                 goto out_unlock;
2079
2080                         asoc = transport->asoc;
2081                         new = true;
2082                 }
2083
2084                 if (!sctp_style(sk, TCP) && !(sflags & SCTP_ADDR_OVER))
2085                         transport = NULL;
2086         } else {
2087                 asoc = sctp_id2assoc(sk, sinfo->sinfo_assoc_id);
2088                 if (!asoc) {
2089                         err = -EPIPE;
2090                         goto out_unlock;
2091                 }
2092
2093                 err = sctp_sendmsg_check_sflags(asoc, sflags, msg, msg_len);
2094                 if (err <= 0)
2095                         goto out_unlock;
2096         }
2097
2098         /* Update snd_info with the asoc */
2099         sctp_sendmsg_update_sinfo(asoc, sinfo, &cmsgs);
2100
2101         /* Send msg to the asoc */
2102         err = sctp_sendmsg_to_asoc(asoc, msg, msg_len, transport, sinfo);
2103         if (err < 0 && err != -ESRCH && new)
2104                 sctp_association_free(asoc);
2105
2106 out_unlock:
2107         release_sock(sk);
2108 out:
2109         return sctp_error(sk, msg->msg_flags, err);
2110 }
2111
2112 /* This is an extended version of skb_pull() that removes the data from the
2113  * start of a skb even when data is spread across the list of skb's in the
2114  * frag_list. len specifies the total amount of data that needs to be removed.
2115  * when 'len' bytes could be removed from the skb, it returns 0.
2116  * If 'len' exceeds the total skb length,  it returns the no. of bytes that
2117  * could not be removed.
2118  */
2119 static int sctp_skb_pull(struct sk_buff *skb, int len)
2120 {
2121         struct sk_buff *list;
2122         int skb_len = skb_headlen(skb);
2123         int rlen;
2124
2125         if (len <= skb_len) {
2126                 __skb_pull(skb, len);
2127                 return 0;
2128         }
2129         len -= skb_len;
2130         __skb_pull(skb, skb_len);
2131
2132         skb_walk_frags(skb, list) {
2133                 rlen = sctp_skb_pull(list, len);
2134                 skb->len -= (len-rlen);
2135                 skb->data_len -= (len-rlen);
2136
2137                 if (!rlen)
2138                         return 0;
2139
2140                 len = rlen;
2141         }
2142
2143         return len;
2144 }
2145
2146 /* API 3.1.3  recvmsg() - UDP Style Syntax
2147  *
2148  *  ssize_t recvmsg(int socket, struct msghdr *message,
2149  *                    int flags);
2150  *
2151  *  socket  - the socket descriptor of the endpoint.
2152  *  message - pointer to the msghdr structure which contains a single
2153  *            user message and possibly some ancillary data.
2154  *
2155  *            See Section 5 for complete description of the data
2156  *            structures.
2157  *
2158  *  flags   - flags sent or received with the user message, see Section
2159  *            5 for complete description of the flags.
2160  */
2161 static int sctp_recvmsg(struct sock *sk, struct msghdr *msg, size_t len,
2162                         int noblock, int flags, int *addr_len)
2163 {
2164         struct sctp_ulpevent *event = NULL;
2165         struct sctp_sock *sp = sctp_sk(sk);
2166         struct sk_buff *skb, *head_skb;
2167         int copied;
2168         int err = 0;
2169         int skb_len;
2170
2171         pr_debug("%s: sk:%p, msghdr:%p, len:%zd, noblock:%d, flags:0x%x, "
2172                  "addr_len:%p)\n", __func__, sk, msg, len, noblock, flags,
2173                  addr_len);
2174
2175         lock_sock(sk);
2176
2177         if (sctp_style(sk, TCP) && !sctp_sstate(sk, ESTABLISHED) &&
2178             !sctp_sstate(sk, CLOSING) && !sctp_sstate(sk, CLOSED)) {
2179                 err = -ENOTCONN;
2180                 goto out;
2181         }
2182
2183         skb = sctp_skb_recv_datagram(sk, flags, noblock, &err);
2184         if (!skb)
2185                 goto out;
2186
2187         /* Get the total length of the skb including any skb's in the
2188          * frag_list.
2189          */
2190         skb_len = skb->len;
2191
2192         copied = skb_len;
2193         if (copied > len)
2194                 copied = len;
2195
2196         err = skb_copy_datagram_msg(skb, 0, msg, copied);
2197
2198         event = sctp_skb2event(skb);
2199
2200         if (err)
2201                 goto out_free;
2202
2203         if (event->chunk && event->chunk->head_skb)
2204                 head_skb = event->chunk->head_skb;
2205         else
2206                 head_skb = skb;
2207         sock_recv_ts_and_drops(msg, sk, head_skb);
2208         if (sctp_ulpevent_is_notification(event)) {
2209                 msg->msg_flags |= MSG_NOTIFICATION;
2210                 sp->pf->event_msgname(event, msg->msg_name, addr_len);
2211         } else {
2212                 sp->pf->skb_msgname(head_skb, msg->msg_name, addr_len);
2213         }
2214
2215         /* Check if we allow SCTP_NXTINFO. */
2216         if (sp->recvnxtinfo)
2217                 sctp_ulpevent_read_nxtinfo(event, msg, sk);
2218         /* Check if we allow SCTP_RCVINFO. */
2219         if (sp->recvrcvinfo)
2220                 sctp_ulpevent_read_rcvinfo(event, msg);
2221         /* Check if we allow SCTP_SNDRCVINFO. */
2222         if (sctp_ulpevent_type_enabled(sp->subscribe, SCTP_DATA_IO_EVENT))
2223                 sctp_ulpevent_read_sndrcvinfo(event, msg);
2224
2225         err = copied;
2226
2227         /* If skb's length exceeds the user's buffer, update the skb and
2228          * push it back to the receive_queue so that the next call to
2229          * recvmsg() will return the remaining data. Don't set MSG_EOR.
2230          */
2231         if (skb_len > copied) {
2232                 msg->msg_flags &= ~MSG_EOR;
2233                 if (flags & MSG_PEEK)
2234                         goto out_free;
2235                 sctp_skb_pull(skb, copied);
2236                 skb_queue_head(&sk->sk_receive_queue, skb);
2237
2238                 /* When only partial message is copied to the user, increase
2239                  * rwnd by that amount. If all the data in the skb is read,
2240                  * rwnd is updated when the event is freed.
2241                  */
2242                 if (!sctp_ulpevent_is_notification(event))
2243                         sctp_assoc_rwnd_increase(event->asoc, copied);
2244                 goto out;
2245         } else if ((event->msg_flags & MSG_NOTIFICATION) ||
2246                    (event->msg_flags & MSG_EOR))
2247                 msg->msg_flags |= MSG_EOR;
2248         else
2249                 msg->msg_flags &= ~MSG_EOR;
2250
2251 out_free:
2252         if (flags & MSG_PEEK) {
2253                 /* Release the skb reference acquired after peeking the skb in
2254                  * sctp_skb_recv_datagram().
2255                  */
2256                 kfree_skb(skb);
2257         } else {
2258                 /* Free the event which includes releasing the reference to
2259                  * the owner of the skb, freeing the skb and updating the
2260                  * rwnd.
2261                  */
2262                 sctp_ulpevent_free(event);
2263         }
2264 out:
2265         release_sock(sk);
2266         return err;
2267 }
2268
2269 /* 7.1.12 Enable/Disable message fragmentation (SCTP_DISABLE_FRAGMENTS)
2270  *
2271  * This option is a on/off flag.  If enabled no SCTP message
2272  * fragmentation will be performed.  Instead if a message being sent
2273  * exceeds the current PMTU size, the message will NOT be sent and
2274  * instead a error will be indicated to the user.
2275  */
2276 static int sctp_setsockopt_disable_fragments(struct sock *sk,
2277                                              char __user *optval,
2278                                              unsigned int optlen)
2279 {
2280         int val;
2281
2282         if (optlen < sizeof(int))
2283                 return -EINVAL;
2284
2285         if (get_user(val, (int __user *)optval))
2286                 return -EFAULT;
2287
2288         sctp_sk(sk)->disable_fragments = (val == 0) ? 0 : 1;
2289
2290         return 0;
2291 }
2292
2293 static int sctp_setsockopt_events(struct sock *sk, char __user *optval,
2294                                   unsigned int optlen)
2295 {
2296         struct sctp_event_subscribe subscribe;
2297         __u8 *sn_type = (__u8 *)&subscribe;
2298         struct sctp_sock *sp = sctp_sk(sk);
2299         struct sctp_association *asoc;
2300         int i;
2301
2302         if (optlen > sizeof(struct sctp_event_subscribe))
2303                 return -EINVAL;
2304
2305         if (copy_from_user(&subscribe, optval, optlen))
2306                 return -EFAULT;
2307
2308         for (i = 0; i < optlen; i++)
2309                 sctp_ulpevent_type_set(&sp->subscribe, SCTP_SN_TYPE_BASE + i,
2310                                        sn_type[i]);
2311
2312         list_for_each_entry(asoc, &sp->ep->asocs, asocs)
2313                 asoc->subscribe = sctp_sk(sk)->subscribe;
2314
2315         /* At the time when a user app subscribes to SCTP_SENDER_DRY_EVENT,
2316          * if there is no data to be sent or retransmit, the stack will
2317          * immediately send up this notification.
2318          */
2319         if (sctp_ulpevent_type_enabled(sp->subscribe, SCTP_SENDER_DRY_EVENT)) {
2320                 struct sctp_ulpevent *event;
2321
2322                 asoc = sctp_id2assoc(sk, 0);
2323                 if (asoc && sctp_outq_is_empty(&asoc->outqueue)) {
2324                         event = sctp_ulpevent_make_sender_dry_event(asoc,
2325                                         GFP_USER | __GFP_NOWARN);
2326                         if (!event)
2327                                 return -ENOMEM;
2328
2329                         asoc->stream.si->enqueue_event(&asoc->ulpq, event);
2330                 }
2331         }
2332
2333         return 0;
2334 }
2335
2336 /* 7.1.8 Automatic Close of associations (SCTP_AUTOCLOSE)
2337  *
2338  * This socket option is applicable to the UDP-style socket only.  When
2339  * set it will cause associations that are idle for more than the
2340  * specified number of seconds to automatically close.  An association
2341  * being idle is defined an association that has NOT sent or received
2342  * user data.  The special value of '0' indicates that no automatic
2343  * close of any associations should be performed.  The option expects an
2344  * integer defining the number of seconds of idle time before an
2345  * association is closed.
2346  */
2347 static int sctp_setsockopt_autoclose(struct sock *sk, char __user *optval,
2348                                      unsigned int optlen)
2349 {
2350         struct sctp_sock *sp = sctp_sk(sk);
2351         struct net *net = sock_net(sk);
2352
2353         /* Applicable to UDP-style socket only */
2354         if (sctp_style(sk, TCP))
2355                 return -EOPNOTSUPP;
2356         if (optlen != sizeof(int))
2357                 return -EINVAL;
2358         if (copy_from_user(&sp->autoclose, optval, optlen))
2359                 return -EFAULT;
2360
2361         if (sp->autoclose > net->sctp.max_autoclose)
2362                 sp->autoclose = net->sctp.max_autoclose;
2363
2364         return 0;
2365 }
2366
2367 /* 7.1.13 Peer Address Parameters (SCTP_PEER_ADDR_PARAMS)
2368  *
2369  * Applications can enable or disable heartbeats for any peer address of
2370  * an association, modify an address's heartbeat interval, force a
2371  * heartbeat to be sent immediately, and adjust the address's maximum
2372  * number of retransmissions sent before an address is considered
2373  * unreachable.  The following structure is used to access and modify an
2374  * address's parameters:
2375  *
2376  *  struct sctp_paddrparams {
2377  *     sctp_assoc_t            spp_assoc_id;
2378  *     struct sockaddr_storage spp_address;
2379  *     uint32_t                spp_hbinterval;
2380  *     uint16_t                spp_pathmaxrxt;
2381  *     uint32_t                spp_pathmtu;
2382  *     uint32_t                spp_sackdelay;
2383  *     uint32_t                spp_flags;
2384  *     uint32_t                spp_ipv6_flowlabel;
2385  *     uint8_t                 spp_dscp;
2386  * };
2387  *
2388  *   spp_assoc_id    - (one-to-many style socket) This is filled in the
2389  *                     application, and identifies the association for
2390  *                     this query.
2391  *   spp_address     - This specifies which address is of interest.
2392  *   spp_hbinterval  - This contains the value of the heartbeat interval,
2393  *                     in milliseconds.  If a  value of zero
2394  *                     is present in this field then no changes are to
2395  *                     be made to this parameter.
2396  *   spp_pathmaxrxt  - This contains the maximum number of
2397  *                     retransmissions before this address shall be
2398  *                     considered unreachable. If a  value of zero
2399  *                     is present in this field then no changes are to
2400  *                     be made to this parameter.
2401  *   spp_pathmtu     - When Path MTU discovery is disabled the value
2402  *                     specified here will be the "fixed" path mtu.
2403  *                     Note that if the spp_address field is empty
2404  *                     then all associations on this address will
2405  *                     have this fixed path mtu set upon them.
2406  *
2407  *   spp_sackdelay   - When delayed sack is enabled, this value specifies
2408  *                     the number of milliseconds that sacks will be delayed
2409  *                     for. This value will apply to all addresses of an
2410  *                     association if the spp_address field is empty. Note
2411  *                     also, that if delayed sack is enabled and this
2412  *                     value is set to 0, no change is made to the last
2413  *                     recorded delayed sack timer value.
2414  *
2415  *   spp_flags       - These flags are used to control various features
2416  *                     on an association. The flag field may contain
2417  *                     zero or more of the following options.
2418  *
2419  *                     SPP_HB_ENABLE  - Enable heartbeats on the
2420  *                     specified address. Note that if the address
2421  *                     field is empty all addresses for the association
2422  *                     have heartbeats enabled upon them.
2423  *
2424  *                     SPP_HB_DISABLE - Disable heartbeats on the
2425  *                     speicifed address. Note that if the address
2426  *                     field is empty all addresses for the association
2427  *                     will have their heartbeats disabled. Note also
2428  *                     that SPP_HB_ENABLE and SPP_HB_DISABLE are
2429  *                     mutually exclusive, only one of these two should
2430  *                     be specified. Enabling both fields will have
2431  *                     undetermined results.
2432  *
2433  *                     SPP_HB_DEMAND - Request a user initiated heartbeat
2434  *                     to be made immediately.
2435  *
2436  *                     SPP_HB_TIME_IS_ZERO - Specify's that the time for
2437  *                     heartbeat delayis to be set to the value of 0
2438  *                     milliseconds.
2439  *
2440  *                     SPP_PMTUD_ENABLE - This field will enable PMTU
2441  *                     discovery upon the specified address. Note that
2442  *                     if the address feild is empty then all addresses
2443  *                     on the association are effected.
2444  *
2445  *                     SPP_PMTUD_DISABLE - This field will disable PMTU
2446  *                     discovery upon the specified address. Note that
2447  *                     if the address feild is empty then all addresses
2448  *                     on the association are effected. Not also that
2449  *                     SPP_PMTUD_ENABLE and SPP_PMTUD_DISABLE are mutually
2450  *                     exclusive. Enabling both will have undetermined
2451  *                     results.
2452  *
2453  *                     SPP_SACKDELAY_ENABLE - Setting this flag turns
2454  *                     on delayed sack. The time specified in spp_sackdelay
2455  *                     is used to specify the sack delay for this address. Note
2456  *                     that if spp_address is empty then all addresses will
2457  *                     enable delayed sack and take on the sack delay
2458  *                     value specified in spp_sackdelay.
2459  *                     SPP_SACKDELAY_DISABLE - Setting this flag turns
2460  *                     off delayed sack. If the spp_address field is blank then
2461  *                     delayed sack is disabled for the entire association. Note
2462  *                     also that this field is mutually exclusive to
2463  *                     SPP_SACKDELAY_ENABLE, setting both will have undefined
2464  *                     results.
2465  *
2466  *                     SPP_IPV6_FLOWLABEL:  Setting this flag enables the
2467  *                     setting of the IPV6 flow label value.  The value is
2468  *                     contained in the spp_ipv6_flowlabel field.
2469  *                     Upon retrieval, this flag will be set to indicate that
2470  *                     the spp_ipv6_flowlabel field has a valid value returned.
2471  *                     If a specific destination address is set (in the
2472  *                     spp_address field), then the value returned is that of
2473  *                     the address.  If just an association is specified (and
2474  *                     no address), then the association's default flow label
2475  *                     is returned.  If neither an association nor a destination
2476  *                     is specified, then the socket's default flow label is
2477  *                     returned.  For non-IPv6 sockets, this flag will be left
2478  *                     cleared.
2479  *
2480  *                     SPP_DSCP:  Setting this flag enables the setting of the
2481  *                     Differentiated Services Code Point (DSCP) value
2482  *                     associated with either the association or a specific
2483  *                     address.  The value is obtained in the spp_dscp field.
2484  *                     Upon retrieval, this flag will be set to indicate that
2485  *                     the spp_dscp field has a valid value returned.  If a
2486  *                     specific destination address is set when called (in the
2487  *                     spp_address field), then that specific destination
2488  *                     address's DSCP value is returned.  If just an association
2489  *                     is specified, then the association's default DSCP is
2490  *                     returned.  If neither an association nor a destination is
2491  *                     specified, then the socket's default DSCP is returned.
2492  *
2493  *   spp_ipv6_flowlabel
2494  *                   - This field is used in conjunction with the
2495  *                     SPP_IPV6_FLOWLABEL flag and contains the IPv6 flow label.
2496  *                     The 20 least significant bits are used for the flow
2497  *                     label.  This setting has precedence over any IPv6-layer
2498  *                     setting.
2499  *
2500  *   spp_dscp        - This field is used in conjunction with the SPP_DSCP flag
2501  *                     and contains the DSCP.  The 6 most significant bits are
2502  *                     used for the DSCP.  This setting has precedence over any
2503  *                     IPv4- or IPv6- layer setting.
2504  */
2505 static int sctp_apply_peer_addr_params(struct sctp_paddrparams *params,
2506                                        struct sctp_transport   *trans,
2507                                        struct sctp_association *asoc,
2508                                        struct sctp_sock        *sp,
2509                                        int                      hb_change,
2510                                        int                      pmtud_change,
2511                                        int                      sackdelay_change)
2512 {
2513         int error;
2514
2515         if (params->spp_flags & SPP_HB_DEMAND && trans) {
2516                 struct net *net = sock_net(trans->asoc->base.sk);
2517
2518                 error = sctp_primitive_REQUESTHEARTBEAT(net, trans->asoc, trans);
2519                 if (error)
2520                         return error;
2521         }
2522
2523         /* Note that unless the spp_flag is set to SPP_HB_ENABLE the value of
2524          * this field is ignored.  Note also that a value of zero indicates
2525          * the current setting should be left unchanged.
2526          */
2527         if (params->spp_flags & SPP_HB_ENABLE) {
2528
2529                 /* Re-zero the interval if the SPP_HB_TIME_IS_ZERO is
2530                  * set.  This lets us use 0 value when this flag
2531                  * is set.
2532                  */
2533                 if (params->spp_flags & SPP_HB_TIME_IS_ZERO)
2534                         params->spp_hbinterval = 0;
2535
2536                 if (params->spp_hbinterval ||
2537                     (params->spp_flags & SPP_HB_TIME_IS_ZERO)) {
2538                         if (trans) {
2539                                 trans->hbinterval =
2540                                     msecs_to_jiffies(params->spp_hbinterval);
2541                         } else if (asoc) {
2542                                 asoc->hbinterval =
2543                                     msecs_to_jiffies(params->spp_hbinterval);
2544                         } else {
2545                                 sp->hbinterval = params->spp_hbinterval;
2546                         }
2547                 }
2548         }
2549
2550         if (hb_change) {
2551                 if (trans) {
2552                         trans->param_flags =
2553                                 (trans->param_flags & ~SPP_HB) | hb_change;
2554                 } else if (asoc) {
2555                         asoc->param_flags =
2556                                 (asoc->param_flags & ~SPP_HB) | hb_change;
2557                 } else {
2558                         sp->param_flags =
2559                                 (sp->param_flags & ~SPP_HB) | hb_change;
2560                 }
2561         }
2562
2563         /* When Path MTU discovery is disabled the value specified here will
2564          * be the "fixed" path mtu (i.e. the value of the spp_flags field must
2565          * include the flag SPP_PMTUD_DISABLE for this field to have any
2566          * effect).
2567          */
2568         if ((params->spp_flags & SPP_PMTUD_DISABLE) && params->spp_pathmtu) {
2569                 if (trans) {
2570                         trans->pathmtu = params->spp_pathmtu;
2571                         sctp_assoc_sync_pmtu(asoc);
2572                 } else if (asoc) {
2573                         sctp_assoc_set_pmtu(asoc, params->spp_pathmtu);
2574                 } else {
2575                         sp->pathmtu = params->spp_pathmtu;
2576                 }
2577         }
2578
2579         if (pmtud_change) {
2580                 if (trans) {
2581                         int update = (trans->param_flags & SPP_PMTUD_DISABLE) &&
2582                                 (params->spp_flags & SPP_PMTUD_ENABLE);
2583                         trans->param_flags =
2584                                 (trans->param_flags & ~SPP_PMTUD) | pmtud_change;
2585                         if (update) {
2586                                 sctp_transport_pmtu(trans, sctp_opt2sk(sp));
2587                                 sctp_assoc_sync_pmtu(asoc);
2588                         }
2589                 } else if (asoc) {
2590                         asoc->param_flags =
2591                                 (asoc->param_flags & ~SPP_PMTUD) | pmtud_change;
2592                 } else {
2593                         sp->param_flags =
2594                                 (sp->param_flags & ~SPP_PMTUD) | pmtud_change;
2595                 }
2596         }
2597
2598         /* Note that unless the spp_flag is set to SPP_SACKDELAY_ENABLE the
2599          * value of this field is ignored.  Note also that a value of zero
2600          * indicates the current setting should be left unchanged.
2601          */
2602         if ((params->spp_flags & SPP_SACKDELAY_ENABLE) && params->spp_sackdelay) {
2603                 if (trans) {
2604                         trans->sackdelay =
2605                                 msecs_to_jiffies(params->spp_sackdelay);
2606                 } else if (asoc) {
2607                         asoc->sackdelay =
2608                                 msecs_to_jiffies(params->spp_sackdelay);
2609                 } else {
2610                         sp->sackdelay = params->spp_sackdelay;
2611                 }
2612         }
2613
2614         if (sackdelay_change) {
2615                 if (trans) {
2616                         trans->param_flags =
2617                                 (trans->param_flags & ~SPP_SACKDELAY) |
2618                                 sackdelay_change;
2619                 } else if (asoc) {
2620                         asoc->param_flags =
2621                                 (asoc->param_flags & ~SPP_SACKDELAY) |
2622                                 sackdelay_change;
2623                 } else {
2624                         sp->param_flags =
2625                                 (sp->param_flags & ~SPP_SACKDELAY) |
2626                                 sackdelay_change;
2627                 }
2628         }
2629
2630         /* Note that a value of zero indicates the current setting should be
2631            left unchanged.
2632          */
2633         if (params->spp_pathmaxrxt) {
2634                 if (trans) {
2635                         trans->pathmaxrxt = params->spp_pathmaxrxt;
2636                 } else if (asoc) {
2637                         asoc->pathmaxrxt = params->spp_pathmaxrxt;
2638                 } else {
2639                         sp->pathmaxrxt = params->spp_pathmaxrxt;
2640                 }
2641         }
2642
2643         if (params->spp_flags & SPP_IPV6_FLOWLABEL) {
2644                 if (trans) {
2645                         if (trans->ipaddr.sa.sa_family == AF_INET6) {
2646                                 trans->flowlabel = params->spp_ipv6_flowlabel &
2647                                                    SCTP_FLOWLABEL_VAL_MASK;
2648                                 trans->flowlabel |= SCTP_FLOWLABEL_SET_MASK;
2649                         }
2650                 } else if (asoc) {
2651                         struct sctp_transport *t;
2652
2653                         list_for_each_entry(t, &asoc->peer.transport_addr_list,
2654                                             transports) {
2655                                 if (t->ipaddr.sa.sa_family != AF_INET6)
2656                                         continue;
2657                                 t->flowlabel = params->spp_ipv6_flowlabel &
2658                                                SCTP_FLOWLABEL_VAL_MASK;
2659                                 t->flowlabel |= SCTP_FLOWLABEL_SET_MASK;
2660                         }
2661                         asoc->flowlabel = params->spp_ipv6_flowlabel &
2662                                           SCTP_FLOWLABEL_VAL_MASK;
2663                         asoc->flowlabel |= SCTP_FLOWLABEL_SET_MASK;
2664                 } else if (sctp_opt2sk(sp)->sk_family == AF_INET6) {
2665                         sp->flowlabel = params->spp_ipv6_flowlabel &
2666                                         SCTP_FLOWLABEL_VAL_MASK;
2667                         sp->flowlabel |= SCTP_FLOWLABEL_SET_MASK;
2668                 }
2669         }
2670
2671         if (params->spp_flags & SPP_DSCP) {
2672                 if (trans) {
2673                         trans->dscp = params->spp_dscp & SCTP_DSCP_VAL_MASK;
2674                         trans->dscp |= SCTP_DSCP_SET_MASK;
2675                 } else if (asoc) {
2676                         struct sctp_transport *t;
2677
2678                         list_for_each_entry(t, &asoc->peer.transport_addr_list,
2679                                             transports) {
2680                                 t->dscp = params->spp_dscp &
2681                                           SCTP_DSCP_VAL_MASK;
2682                                 t->dscp |= SCTP_DSCP_SET_MASK;
2683                         }
2684                         asoc->dscp = params->spp_dscp & SCTP_DSCP_VAL_MASK;
2685                         asoc->dscp |= SCTP_DSCP_SET_MASK;
2686                 } else {
2687                         sp->dscp = params->spp_dscp & SCTP_DSCP_VAL_MASK;
2688                         sp->dscp |= SCTP_DSCP_SET_MASK;
2689                 }
2690         }
2691
2692         return 0;
2693 }
2694
2695 static int sctp_setsockopt_peer_addr_params(struct sock *sk,
2696                                             char __user *optval,
2697                                             unsigned int optlen)
2698 {
2699         struct sctp_paddrparams  params;
2700         struct sctp_transport   *trans = NULL;
2701         struct sctp_association *asoc = NULL;
2702         struct sctp_sock        *sp = sctp_sk(sk);
2703         int error;
2704         int hb_change, pmtud_change, sackdelay_change;
2705
2706         if (optlen == sizeof(params)) {
2707                 if (copy_from_user(&params, optval, optlen))
2708                         return -EFAULT;
2709         } else if (optlen == ALIGN(offsetof(struct sctp_paddrparams,
2710                                             spp_ipv6_flowlabel), 4)) {
2711                 if (copy_from_user(&params, optval, optlen))
2712                         return -EFAULT;
2713                 if (params.spp_flags & (SPP_DSCP | SPP_IPV6_FLOWLABEL))
2714                         return -EINVAL;
2715         } else {
2716                 return -EINVAL;
2717         }
2718
2719         /* Validate flags and value parameters. */
2720         hb_change        = params.spp_flags & SPP_HB;
2721         pmtud_change     = params.spp_flags & SPP_PMTUD;
2722         sackdelay_change = params.spp_flags & SPP_SACKDELAY;
2723
2724         if (hb_change        == SPP_HB ||
2725             pmtud_change     == SPP_PMTUD ||
2726             sackdelay_change == SPP_SACKDELAY ||
2727             params.spp_sackdelay > 500 ||
2728             (params.spp_pathmtu &&
2729              params.spp_pathmtu < SCTP_DEFAULT_MINSEGMENT))
2730                 return -EINVAL;
2731
2732         /* If an address other than INADDR_ANY is specified, and
2733          * no transport is found, then the request is invalid.
2734          */
2735         if (!sctp_is_any(sk, (union sctp_addr *)&params.spp_address)) {
2736                 trans = sctp_addr_id2transport(sk, &params.spp_address,
2737                                                params.spp_assoc_id);
2738                 if (!trans)
2739                         return -EINVAL;
2740         }
2741
2742         /* Get association, if assoc_id != SCTP_FUTURE_ASSOC and the
2743          * socket is a one to many style socket, and an association
2744          * was not found, then the id was invalid.
2745          */
2746         asoc = sctp_id2assoc(sk, params.spp_assoc_id);
2747         if (!asoc && params.spp_assoc_id != SCTP_FUTURE_ASSOC &&
2748             sctp_style(sk, UDP))
2749                 return -EINVAL;
2750
2751         /* Heartbeat demand can only be sent on a transport or
2752          * association, but not a socket.
2753          */
2754         if (params.spp_flags & SPP_HB_DEMAND && !trans && !asoc)
2755                 return -EINVAL;
2756
2757         /* Process parameters. */
2758         error = sctp_apply_peer_addr_params(&params, trans, asoc, sp,
2759                                             hb_change, pmtud_change,
2760                                             sackdelay_change);
2761
2762         if (error)
2763                 return error;
2764
2765         /* If changes are for association, also apply parameters to each
2766          * transport.
2767          */
2768         if (!trans && asoc) {
2769                 list_for_each_entry(trans, &asoc->peer.transport_addr_list,
2770                                 transports) {
2771                         sctp_apply_peer_addr_params(&params, trans, asoc, sp,
2772                                                     hb_change, pmtud_change,
2773                                                     sackdelay_change);
2774                 }
2775         }
2776
2777         return 0;
2778 }
2779
2780 static inline __u32 sctp_spp_sackdelay_enable(__u32 param_flags)
2781 {
2782         return (param_flags & ~SPP_SACKDELAY) | SPP_SACKDELAY_ENABLE;
2783 }
2784
2785 static inline __u32 sctp_spp_sackdelay_disable(__u32 param_flags)
2786 {
2787         return (param_flags & ~SPP_SACKDELAY) | SPP_SACKDELAY_DISABLE;
2788 }
2789
2790 static void sctp_apply_asoc_delayed_ack(struct sctp_sack_info *params,
2791                                         struct sctp_association *asoc)
2792 {
2793         struct sctp_transport *trans;
2794
2795         if (params->sack_delay) {
2796                 asoc->sackdelay = msecs_to_jiffies(params->sack_delay);
2797                 asoc->param_flags =
2798                         sctp_spp_sackdelay_enable(asoc->param_flags);
2799         }
2800         if (params->sack_freq == 1) {
2801                 asoc->param_flags =
2802                         sctp_spp_sackdelay_disable(asoc->param_flags);
2803         } else if (params->sack_freq > 1) {
2804                 asoc->sackfreq = params->sack_freq;
2805                 asoc->param_flags =
2806                         sctp_spp_sackdelay_enable(asoc->param_flags);
2807         }
2808
2809         list_for_each_entry(trans, &asoc->peer.transport_addr_list,
2810                             transports) {
2811                 if (params->sack_delay) {
2812                         trans->sackdelay = msecs_to_jiffies(params->sack_delay);
2813                         trans->param_flags =
2814                                 sctp_spp_sackdelay_enable(trans->param_flags);
2815                 }
2816                 if (params->sack_freq == 1) {
2817                         trans->param_flags =
2818                                 sctp_spp_sackdelay_disable(trans->param_flags);
2819                 } else if (params->sack_freq > 1) {
2820                         trans->sackfreq = params->sack_freq;
2821                         trans->param_flags =
2822                                 sctp_spp_sackdelay_enable(trans->param_flags);
2823                 }
2824         }
2825 }
2826
2827 /*
2828  * 7.1.23.  Get or set delayed ack timer (SCTP_DELAYED_SACK)
2829  *
2830  * This option will effect the way delayed acks are performed.  This
2831  * option allows you to get or set the delayed ack time, in
2832  * milliseconds.  It also allows changing the delayed ack frequency.
2833  * Changing the frequency to 1 disables the delayed sack algorithm.  If
2834  * the assoc_id is 0, then this sets or gets the endpoints default
2835  * values.  If the assoc_id field is non-zero, then the set or get
2836  * effects the specified association for the one to many model (the
2837  * assoc_id field is ignored by the one to one model).  Note that if
2838  * sack_delay or sack_freq are 0 when setting this option, then the
2839  * current values will remain unchanged.
2840  *
2841  * struct sctp_sack_info {
2842  *     sctp_assoc_t            sack_assoc_id;
2843  *     uint32_t                sack_delay;
2844  *     uint32_t                sack_freq;
2845  * };
2846  *
2847  * sack_assoc_id -  This parameter, indicates which association the user
2848  *    is performing an action upon.  Note that if this field's value is
2849  *    zero then the endpoints default value is changed (effecting future
2850  *    associations only).
2851  *
2852  * sack_delay -  This parameter contains the number of milliseconds that
2853  *    the user is requesting the delayed ACK timer be set to.  Note that
2854  *    this value is defined in the standard to be between 200 and 500
2855  *    milliseconds.
2856  *
2857  * sack_freq -  This parameter contains the number of packets that must
2858  *    be received before a sack is sent without waiting for the delay
2859  *    timer to expire.  The default value for this is 2, setting this
2860  *    value to 1 will disable the delayed sack algorithm.
2861  */
2862
2863 static int sctp_setsockopt_delayed_ack(struct sock *sk,
2864                                        char __user *optval, unsigned int optlen)
2865 {
2866         struct sctp_sock *sp = sctp_sk(sk);
2867         struct sctp_association *asoc;
2868         struct sctp_sack_info params;
2869
2870         if (optlen == sizeof(struct sctp_sack_info)) {
2871                 if (copy_from_user(&params, optval, optlen))
2872                         return -EFAULT;
2873
2874                 if (params.sack_delay == 0 && params.sack_freq == 0)
2875                         return 0;
2876         } else if (optlen == sizeof(struct sctp_assoc_value)) {
2877                 pr_warn_ratelimited(DEPRECATED
2878                                     "%s (pid %d) "
2879                                     "Use of struct sctp_assoc_value in delayed_ack socket option.\n"
2880                                     "Use struct sctp_sack_info instead\n",
2881                                     current->comm, task_pid_nr(current));
2882                 if (copy_from_user(&params, optval, optlen))
2883                         return -EFAULT;
2884
2885                 if (params.sack_delay == 0)
2886                         params.sack_freq = 1;
2887                 else
2888                         params.sack_freq = 0;
2889         } else
2890                 return -EINVAL;
2891
2892         /* Validate value parameter. */
2893         if (params.sack_delay > 500)
2894                 return -EINVAL;
2895
2896         /* Get association, if sack_assoc_id != SCTP_FUTURE_ASSOC and the
2897          * socket is a one to many style socket, and an association
2898          * was not found, then the id was invalid.
2899          */
2900         asoc = sctp_id2assoc(sk, params.sack_assoc_id);
2901         if (!asoc && params.sack_assoc_id > SCTP_ALL_ASSOC &&
2902             sctp_style(sk, UDP))
2903                 return -EINVAL;
2904
2905         if (asoc) {
2906                 sctp_apply_asoc_delayed_ack(&params, asoc);
2907
2908                 return 0;
2909         }
2910
2911         if (sctp_style(sk, TCP))
2912                 params.sack_assoc_id = SCTP_FUTURE_ASSOC;
2913
2914         if (params.sack_assoc_id == SCTP_FUTURE_ASSOC ||
2915             params.sack_assoc_id == SCTP_ALL_ASSOC) {
2916                 if (params.sack_delay) {
2917                         sp->sackdelay = params.sack_delay;
2918                         sp->param_flags =
2919                                 sctp_spp_sackdelay_enable(sp->param_flags);
2920                 }
2921                 if (params.sack_freq == 1) {
2922                         sp->param_flags =
2923                                 sctp_spp_sackdelay_disable(sp->param_flags);
2924                 } else if (params.sack_freq > 1) {
2925                         sp->sackfreq = params.sack_freq;
2926                         sp->param_flags =
2927                                 sctp_spp_sackdelay_enable(sp->param_flags);
2928                 }
2929         }
2930
2931         if (params.sack_assoc_id == SCTP_CURRENT_ASSOC ||
2932             params.sack_assoc_id == SCTP_ALL_ASSOC)
2933                 list_for_each_entry(asoc, &sp->ep->asocs, asocs)
2934                         sctp_apply_asoc_delayed_ack(&params, asoc);
2935
2936         return 0;
2937 }
2938
2939 /* 7.1.3 Initialization Parameters (SCTP_INITMSG)
2940  *
2941  * Applications can specify protocol parameters for the default association
2942  * initialization.  The option name argument to setsockopt() and getsockopt()
2943  * is SCTP_INITMSG.
2944  *
2945  * Setting initialization parameters is effective only on an unconnected
2946  * socket (for UDP-style sockets only future associations are effected
2947  * by the change).  With TCP-style sockets, this option is inherited by
2948  * sockets derived from a listener socket.
2949  */
2950 static int sctp_setsockopt_initmsg(struct sock *sk, char __user *optval, unsigned int optlen)
2951 {
2952         struct sctp_initmsg sinit;
2953         struct sctp_sock *sp = sctp_sk(sk);
2954
2955         if (optlen != sizeof(struct sctp_initmsg))
2956                 return -EINVAL;
2957         if (copy_from_user(&sinit, optval, optlen))
2958                 return -EFAULT;
2959
2960         if (sinit.sinit_num_ostreams)
2961                 sp->initmsg.sinit_num_ostreams = sinit.sinit_num_ostreams;
2962         if (sinit.sinit_max_instreams)
2963                 sp->initmsg.sinit_max_instreams = sinit.sinit_max_instreams;
2964         if (sinit.sinit_max_attempts)
2965                 sp->initmsg.sinit_max_attempts = sinit.sinit_max_attempts;
2966         if (sinit.sinit_max_init_timeo)
2967                 sp->initmsg.sinit_max_init_timeo = sinit.sinit_max_init_timeo;
2968
2969         return 0;
2970 }
2971
2972 /*
2973  * 7.1.14 Set default send parameters (SCTP_DEFAULT_SEND_PARAM)
2974  *
2975  *   Applications that wish to use the sendto() system call may wish to
2976  *   specify a default set of parameters that would normally be supplied
2977  *   through the inclusion of ancillary data.  This socket option allows
2978  *   such an application to set the default sctp_sndrcvinfo structure.
2979  *   The application that wishes to use this socket option simply passes
2980  *   in to this call the sctp_sndrcvinfo structure defined in Section
2981  *   5.2.2) The input parameters accepted by this call include
2982  *   sinfo_stream, sinfo_flags, sinfo_ppid, sinfo_context,
2983  *   sinfo_timetolive.  The user must provide the sinfo_assoc_id field in
2984  *   to this call if the caller is using the UDP model.
2985  */
2986 static int sctp_setsockopt_default_send_param(struct sock *sk,
2987                                               char __user *optval,
2988                                               unsigned int optlen)
2989 {
2990         struct sctp_sock *sp = sctp_sk(sk);
2991         struct sctp_association *asoc;
2992         struct sctp_sndrcvinfo info;
2993
2994         if (optlen != sizeof(info))
2995                 return -EINVAL;
2996         if (copy_from_user(&info, optval, optlen))
2997                 return -EFAULT;
2998         if (info.sinfo_flags &
2999             ~(SCTP_UNORDERED | SCTP_ADDR_OVER |
3000               SCTP_ABORT | SCTP_EOF))
3001                 return -EINVAL;
3002
3003         asoc = sctp_id2assoc(sk, info.sinfo_assoc_id);
3004         if (!asoc && info.sinfo_assoc_id > SCTP_ALL_ASSOC &&
3005             sctp_style(sk, UDP))
3006                 return -EINVAL;
3007
3008         if (asoc) {
3009                 asoc->default_stream = info.sinfo_stream;
3010                 asoc->default_flags = info.sinfo_flags;
3011                 asoc->default_ppid = info.sinfo_ppid;
3012                 asoc->default_context = info.sinfo_context;
3013                 asoc->default_timetolive = info.sinfo_timetolive;
3014
3015                 return 0;
3016         }
3017
3018         if (sctp_style(sk, TCP))
3019                 info.sinfo_assoc_id = SCTP_FUTURE_ASSOC;
3020
3021         if (info.sinfo_assoc_id == SCTP_FUTURE_ASSOC ||
3022             info.sinfo_assoc_id == SCTP_ALL_ASSOC) {
3023                 sp->default_stream = info.sinfo_stream;
3024                 sp->default_flags = info.sinfo_flags;
3025                 sp->default_ppid = info.sinfo_ppid;
3026                 sp->default_context = info.sinfo_context;
3027                 sp->default_timetolive = info.sinfo_timetolive;
3028         }
3029
3030         if (info.sinfo_assoc_id == SCTP_CURRENT_ASSOC ||
3031             info.sinfo_assoc_id == SCTP_ALL_ASSOC) {
3032                 list_for_each_entry(asoc, &sp->ep->asocs, asocs) {
3033                         asoc->default_stream = info.sinfo_stream;
3034                         asoc->default_flags = info.sinfo_flags;
3035                         asoc->default_ppid = info.sinfo_ppid;
3036                         asoc->default_context = info.sinfo_context;
3037                         asoc->default_timetolive = info.sinfo_timetolive;
3038                 }
3039         }
3040
3041         return 0;
3042 }
3043
3044 /* RFC6458, Section 8.1.31. Set/get Default Send Parameters
3045  * (SCTP_DEFAULT_SNDINFO)
3046  */
3047 static int sctp_setsockopt_default_sndinfo(struct sock *sk,
3048                                            char __user *optval,
3049                                            unsigned int optlen)
3050 {
3051         struct sctp_sock *sp = sctp_sk(sk);
3052         struct sctp_association *asoc;
3053         struct sctp_sndinfo info;
3054
3055         if (optlen != sizeof(info))
3056                 return -EINVAL;
3057         if (copy_from_user(&info, optval, optlen))
3058                 return -EFAULT;
3059         if (info.snd_flags &
3060             ~(SCTP_UNORDERED | SCTP_ADDR_OVER |
3061               SCTP_ABORT | SCTP_EOF))
3062                 return -EINVAL;
3063
3064         asoc = sctp_id2assoc(sk, info.snd_assoc_id);
3065         if (!asoc && info.snd_assoc_id > SCTP_ALL_ASSOC &&
3066             sctp_style(sk, UDP))
3067                 return -EINVAL;
3068
3069         if (asoc) {
3070                 asoc->default_stream = info.snd_sid;
3071                 asoc->default_flags = info.snd_flags;
3072                 asoc->default_ppid = info.snd_ppid;
3073                 asoc->default_context = info.snd_context;
3074
3075                 return 0;
3076         }
3077
3078         if (sctp_style(sk, TCP))
3079                 info.snd_assoc_id = SCTP_FUTURE_ASSOC;
3080
3081         if (info.snd_assoc_id == SCTP_FUTURE_ASSOC ||
3082             info.snd_assoc_id == SCTP_ALL_ASSOC) {
3083                 sp->default_stream = info.snd_sid;
3084                 sp->default_flags = info.snd_flags;
3085                 sp->default_ppid = info.snd_ppid;
3086                 sp->default_context = info.snd_context;
3087         }
3088
3089         if (info.snd_assoc_id == SCTP_CURRENT_ASSOC ||
3090             info.snd_assoc_id == SCTP_ALL_ASSOC) {
3091                 list_for_each_entry(asoc, &sp->ep->asocs, asocs) {
3092                         asoc->default_stream = info.snd_sid;
3093                         asoc->default_flags = info.snd_flags;
3094                         asoc->default_ppid = info.snd_ppid;
3095                         asoc->default_context = info.snd_context;
3096                 }
3097         }
3098
3099         return 0;
3100 }
3101
3102 /* 7.1.10 Set Primary Address (SCTP_PRIMARY_ADDR)
3103  *
3104  * Requests that the local SCTP stack use the enclosed peer address as
3105  * the association primary.  The enclosed address must be one of the
3106  * association peer's addresses.
3107  */
3108 static int sctp_setsockopt_primary_addr(struct sock *sk, char __user *optval,
3109                                         unsigned int optlen)
3110 {
3111         struct sctp_prim prim;
3112         struct sctp_transport *trans;
3113         struct sctp_af *af;
3114         int err;
3115
3116         if (optlen != sizeof(struct sctp_prim))
3117                 return -EINVAL;
3118
3119         if (copy_from_user(&prim, optval, sizeof(struct sctp_prim)))
3120                 return -EFAULT;
3121
3122         /* Allow security module to validate address but need address len. */
3123         af = sctp_get_af_specific(prim.ssp_addr.ss_family);
3124         if (!af)
3125                 return -EINVAL;
3126
3127         err = security_sctp_bind_connect(sk, SCTP_PRIMARY_ADDR,
3128                                          (struct sockaddr *)&prim.ssp_addr,
3129                                          af->sockaddr_len);
3130         if (err)
3131                 return err;
3132
3133         trans = sctp_addr_id2transport(sk, &prim.ssp_addr, prim.ssp_assoc_id);
3134         if (!trans)
3135                 return -EINVAL;
3136
3137         sctp_assoc_set_primary(trans->asoc, trans);
3138
3139         return 0;
3140 }
3141
3142 /*
3143  * 7.1.5 SCTP_NODELAY
3144  *
3145  * Turn on/off any Nagle-like algorithm.  This means that packets are
3146  * generally sent as soon as possible and no unnecessary delays are
3147  * introduced, at the cost of more packets in the network.  Expects an
3148  *  integer boolean flag.
3149  */
3150 static int sctp_setsockopt_nodelay(struct sock *sk, char __user *optval,
3151                                    unsigned int optlen)
3152 {
3153         int val;
3154
3155         if (optlen < sizeof(int))
3156                 return -EINVAL;
3157         if (get_user(val, (int __user *)optval))
3158                 return -EFAULT;
3159
3160         sctp_sk(sk)->nodelay = (val == 0) ? 0 : 1;
3161         return 0;
3162 }
3163
3164 /*
3165  *
3166  * 7.1.1 SCTP_RTOINFO
3167  *
3168  * The protocol parameters used to initialize and bound retransmission
3169  * timeout (RTO) are tunable. sctp_rtoinfo structure is used to access
3170  * and modify these parameters.
3171  * All parameters are time values, in milliseconds.  A value of 0, when
3172  * modifying the parameters, indicates that the current value should not
3173  * be changed.
3174  *
3175  */
3176 static int sctp_setsockopt_rtoinfo(struct sock *sk, char __user *optval, unsigned int optlen)
3177 {
3178         struct sctp_rtoinfo rtoinfo;
3179         struct sctp_association *asoc;
3180         unsigned long rto_min, rto_max;
3181         struct sctp_sock *sp = sctp_sk(sk);
3182
3183         if (optlen != sizeof (struct sctp_rtoinfo))
3184                 return -EINVAL;
3185
3186         if (copy_from_user(&rtoinfo, optval, optlen))
3187                 return -EFAULT;
3188
3189         asoc = sctp_id2assoc(sk, rtoinfo.srto_assoc_id);
3190
3191         /* Set the values to the specific association */
3192         if (!asoc && rtoinfo.srto_assoc_id != SCTP_FUTURE_ASSOC &&
3193             sctp_style(sk, UDP))
3194                 return -EINVAL;
3195
3196         rto_max = rtoinfo.srto_max;
3197         rto_min = rtoinfo.srto_min;
3198
3199         if (rto_max)
3200                 rto_max = asoc ? msecs_to_jiffies(rto_max) : rto_max;
3201         else
3202                 rto_max = asoc ? asoc->rto_max : sp->rtoinfo.srto_max;
3203
3204         if (rto_min)
3205                 rto_min = asoc ? msecs_to_jiffies(rto_min) : rto_min;
3206         else
3207                 rto_min = asoc ? asoc->rto_min : sp->rtoinfo.srto_min;
3208
3209         if (rto_min > rto_max)
3210                 return -EINVAL;
3211
3212         if (asoc) {
3213                 if (rtoinfo.srto_initial != 0)
3214                         asoc->rto_initial =
3215                                 msecs_to_jiffies(rtoinfo.srto_initial);
3216                 asoc->rto_max = rto_max;
3217                 asoc->rto_min = rto_min;
3218         } else {
3219                 /* If there is no association or the association-id = 0
3220                  * set the values to the endpoint.
3221                  */
3222                 if (rtoinfo.srto_initial != 0)
3223                         sp->rtoinfo.srto_initial = rtoinfo.srto_initial;
3224                 sp->rtoinfo.srto_max = rto_max;
3225                 sp->rtoinfo.srto_min = rto_min;
3226         }
3227
3228         return 0;
3229 }
3230
3231 /*
3232  *
3233  * 7.1.2 SCTP_ASSOCINFO
3234  *
3235  * This option is used to tune the maximum retransmission attempts
3236  * of the association.
3237  * Returns an error if the new association retransmission value is
3238  * greater than the sum of the retransmission value  of the peer.
3239  * See [SCTP] for more information.
3240  *
3241  */
3242 static int sctp_setsockopt_associnfo(struct sock *sk, char __user *optval, unsigned int optlen)
3243 {
3244
3245         struct sctp_assocparams assocparams;
3246         struct sctp_association *asoc;
3247
3248         if (optlen != sizeof(struct sctp_assocparams))
3249                 return -EINVAL;
3250         if (copy_from_user(&assocparams, optval, optlen))
3251                 return -EFAULT;
3252
3253         asoc = sctp_id2assoc(sk, assocparams.sasoc_assoc_id);
3254
3255         if (!asoc && assocparams.sasoc_assoc_id != SCTP_FUTURE_ASSOC &&
3256             sctp_style(sk, UDP))
3257                 return -EINVAL;
3258
3259         /* Set the values to the specific association */
3260         if (asoc) {
3261                 if (assocparams.sasoc_asocmaxrxt != 0) {
3262                         __u32 path_sum = 0;
3263                         int   paths = 0;
3264                         struct sctp_transport *peer_addr;
3265
3266                         list_for_each_entry(peer_addr, &asoc->peer.transport_addr_list,
3267                                         transports) {
3268                                 path_sum += peer_addr->pathmaxrxt;
3269                                 paths++;
3270                         }
3271
3272                         /* Only validate asocmaxrxt if we have more than
3273                          * one path/transport.  We do this because path
3274                          * retransmissions are only counted when we have more
3275                          * then one path.
3276                          */
3277                         if (paths > 1 &&
3278                             assocparams.sasoc_asocmaxrxt > path_sum)
3279                                 return -EINVAL;
3280
3281                         asoc->max_retrans = assocparams.sasoc_asocmaxrxt;
3282                 }
3283
3284                 if (assocparams.sasoc_cookie_life != 0)
3285                         asoc->cookie_life = ms_to_ktime(assocparams.sasoc_cookie_life);
3286         } else {
3287                 /* Set the values to the endpoint */
3288                 struct sctp_sock *sp = sctp_sk(sk);
3289
3290                 if (assocparams.sasoc_asocmaxrxt != 0)
3291                         sp->assocparams.sasoc_asocmaxrxt =
3292                                                 assocparams.sasoc_asocmaxrxt;
3293                 if (assocparams.sasoc_cookie_life != 0)
3294                         sp->assocparams.sasoc_cookie_life =
3295                                                 assocparams.sasoc_cookie_life;
3296         }
3297         return 0;
3298 }
3299
3300 /*
3301  * 7.1.16 Set/clear IPv4 mapped addresses (SCTP_I_WANT_MAPPED_V4_ADDR)
3302  *
3303  * This socket option is a boolean flag which turns on or off mapped V4
3304  * addresses.  If this option is turned on and the socket is type
3305  * PF_INET6, then IPv4 addresses will be mapped to V6 representation.
3306  * If this option is turned off, then no mapping will be done of V4
3307  * addresses and a user will receive both PF_INET6 and PF_INET type
3308  * addresses on the socket.
3309  */
3310 static int sctp_setsockopt_mappedv4(struct sock *sk, char __user *optval, unsigned int optlen)
3311 {
3312         int val;
3313         struct sctp_sock *sp = sctp_sk(sk);
3314
3315         if (optlen < sizeof(int))
3316                 return -EINVAL;
3317         if (get_user(val, (int __user *)optval))
3318                 return -EFAULT;
3319         if (val)
3320                 sp->v4mapped = 1;
3321         else
3322                 sp->v4mapped = 0;
3323
3324         return 0;
3325 }
3326
3327 /*
3328  * 8.1.16.  Get or Set the Maximum Fragmentation Size (SCTP_MAXSEG)
3329  * This option will get or set the maximum size to put in any outgoing
3330  * SCTP DATA chunk.  If a message is larger than this size it will be
3331  * fragmented by SCTP into the specified size.  Note that the underlying
3332  * SCTP implementation may fragment into smaller sized chunks when the
3333  * PMTU of the underlying association is smaller than the value set by
3334  * the user.  The default value for this option is '0' which indicates
3335  * the user is NOT limiting fragmentation and only the PMTU will effect
3336  * SCTP's choice of DATA chunk size.  Note also that values set larger
3337  * than the maximum size of an IP datagram will effectively let SCTP
3338  * control fragmentation (i.e. the same as setting this option to 0).
3339  *
3340  * The following structure is used to access and modify this parameter:
3341  *
3342  * struct sctp_assoc_value {
3343  *   sctp_assoc_t assoc_id;
3344  *   uint32_t assoc_value;
3345  * };
3346  *
3347  * assoc_id:  This parameter is ignored for one-to-one style sockets.
3348  *    For one-to-many style sockets this parameter indicates which
3349  *    association the user is performing an action upon.  Note that if
3350  *    this field's value is zero then the endpoints default value is
3351  *    changed (effecting future associations only).
3352  * assoc_value:  This parameter specifies the maximum size in bytes.
3353  */
3354 static int sctp_setsockopt_maxseg(struct sock *sk, char __user *optval, unsigned int optlen)
3355 {
3356         struct sctp_sock *sp = sctp_sk(sk);
3357         struct sctp_assoc_value params;
3358         struct sctp_association *asoc;
3359         int val;
3360
3361         if (optlen == sizeof(int)) {
3362                 pr_warn_ratelimited(DEPRECATED
3363                                     "%s (pid %d) "
3364                                     "Use of int in maxseg socket option.\n"
3365                                     "Use struct sctp_assoc_value instead\n",
3366                                     current->comm, task_pid_nr(current));
3367                 if (copy_from_user(&val, optval, optlen))
3368                         return -EFAULT;
3369                 params.assoc_id = SCTP_FUTURE_ASSOC;
3370         } else if (optlen == sizeof(struct sctp_assoc_value)) {
3371                 if (copy_from_user(&params, optval, optlen))
3372                         return -EFAULT;
3373                 val = params.assoc_value;
3374         } else {
3375                 return -EINVAL;
3376         }
3377
3378         asoc = sctp_id2assoc(sk, params.assoc_id);
3379         if (!asoc && params.assoc_id != SCTP_FUTURE_ASSOC &&
3380             sctp_style(sk, UDP))
3381                 return -EINVAL;
3382
3383         if (val) {
3384                 int min_len, max_len;
3385                 __u16 datasize = asoc ? sctp_datachk_len(&asoc->stream) :
3386                                  sizeof(struct sctp_data_chunk);
3387
3388                 min_len = sctp_min_frag_point(sp, datasize);
3389                 max_len = SCTP_MAX_CHUNK_LEN - datasize;
3390
3391                 if (val < min_len || val > max_len)
3392                         return -EINVAL;
3393         }
3394
3395         if (asoc) {
3396                 asoc->user_frag = val;
3397                 sctp_assoc_update_frag_point(asoc);
3398         } else {
3399                 sp->user_frag = val;
3400         }
3401
3402         return 0;
3403 }
3404
3405
3406 /*
3407  *  7.1.9 Set Peer Primary Address (SCTP_SET_PEER_PRIMARY_ADDR)
3408  *
3409  *   Requests that the peer mark the enclosed address as the association
3410  *   primary. The enclosed address must be one of the association's
3411  *   locally bound addresses. The following structure is used to make a
3412  *   set primary request:
3413  */
3414 static int sctp_setsockopt_peer_primary_addr(struct sock *sk, char __user *optval,
3415                                              unsigned int optlen)
3416 {
3417         struct net *net = sock_net(sk);
3418         struct sctp_sock        *sp;
3419         struct sctp_association *asoc = NULL;
3420         struct sctp_setpeerprim prim;
3421         struct sctp_chunk       *chunk;
3422         struct sctp_af          *af;
3423         int                     err;
3424
3425         sp = sctp_sk(sk);
3426
3427         if (!net->sctp.addip_enable)
3428                 return -EPERM;
3429
3430         if (optlen != sizeof(struct sctp_setpeerprim))
3431                 return -EINVAL;
3432
3433         if (copy_from_user(&prim, optval, optlen))
3434                 return -EFAULT;
3435
3436         asoc = sctp_id2assoc(sk, prim.sspp_assoc_id);
3437         if (!asoc)
3438                 return -EINVAL;
3439
3440         if (!asoc->peer.asconf_capable)
3441                 return -EPERM;
3442
3443         if (asoc->peer.addip_disabled_mask & SCTP_PARAM_SET_PRIMARY)
3444                 return -EPERM;
3445
3446         if (!sctp_state(asoc, ESTABLISHED))
3447                 return -ENOTCONN;
3448
3449         af = sctp_get_af_specific(prim.sspp_addr.ss_family);
3450         if (!af)
3451                 return -EINVAL;
3452
3453         if (!af->addr_valid((union sctp_addr *)&prim.sspp_addr, sp, NULL))
3454                 return -EADDRNOTAVAIL;
3455
3456         if (!sctp_assoc_lookup_laddr(asoc, (union sctp_addr *)&prim.sspp_addr))
3457                 return -EADDRNOTAVAIL;
3458
3459         /* Allow security module to validate address. */
3460         err = security_sctp_bind_connect(sk, SCTP_SET_PEER_PRIMARY_ADDR,
3461                                          (struct sockaddr *)&prim.sspp_addr,
3462                                          af->sockaddr_len);
3463         if (err)
3464                 return err;
3465
3466         /* Create an ASCONF chunk with SET_PRIMARY parameter    */
3467         chunk = sctp_make_asconf_set_prim(asoc,
3468                                           (union sctp_addr *)&prim.sspp_addr);
3469         if (!chunk)
3470                 return -ENOMEM;
3471
3472         err = sctp_send_asconf(asoc, chunk);
3473
3474         pr_debug("%s: we set peer primary addr primitively\n", __func__);
3475
3476         return err;
3477 }
3478
3479 static int sctp_setsockopt_adaptation_layer(struct sock *sk, char __user *optval,
3480                                             unsigned int optlen)
3481 {
3482         struct sctp_setadaptation adaptation;
3483
3484         if (optlen != sizeof(struct sctp_setadaptation))
3485                 return -EINVAL;
3486         if (copy_from_user(&adaptation, optval, optlen))
3487                 return -EFAULT;
3488
3489         sctp_sk(sk)->adaptation_ind = adaptation.ssb_adaptation_ind;
3490
3491         return 0;
3492 }
3493
3494 /*
3495  * 7.1.29.  Set or Get the default context (SCTP_CONTEXT)
3496  *
3497  * The context field in the sctp_sndrcvinfo structure is normally only
3498  * used when a failed message is retrieved holding the value that was
3499  * sent down on the actual send call.  This option allows the setting of
3500  * a default context on an association basis that will be received on
3501  * reading messages from the peer.  This is especially helpful in the
3502  * one-2-many model for an application to keep some reference to an
3503  * internal state machine that is processing messages on the
3504  * association.  Note that the setting of this value only effects
3505  * received messages from the peer and does not effect the value that is
3506  * saved with outbound messages.
3507  */
3508 static int sctp_setsockopt_context(struct sock *sk, char __user *optval,
3509                                    unsigned int optlen)
3510 {
3511         struct sctp_sock *sp = sctp_sk(sk);
3512         struct sctp_assoc_value params;
3513         struct sctp_association *asoc;
3514
3515         if (optlen != sizeof(struct sctp_assoc_value))
3516                 return -EINVAL;
3517         if (copy_from_user(&params, optval, optlen))
3518                 return -EFAULT;
3519
3520         asoc = sctp_id2assoc(sk, params.assoc_id);
3521         if (!asoc && params.assoc_id > SCTP_ALL_ASSOC &&
3522             sctp_style(sk, UDP))
3523                 return -EINVAL;
3524
3525         if (asoc) {
3526                 asoc->default_rcv_context = params.assoc_value;
3527
3528                 return 0;
3529         }
3530
3531         if (sctp_style(sk, TCP))
3532                 params.assoc_id = SCTP_FUTURE_ASSOC;
3533
3534         if (params.assoc_id == SCTP_FUTURE_ASSOC ||
3535             params.assoc_id == SCTP_ALL_ASSOC)
3536                 sp->default_rcv_context = params.assoc_value;
3537
3538         if (params.assoc_id == SCTP_CURRENT_ASSOC ||
3539             params.assoc_id == SCTP_ALL_ASSOC)
3540                 list_for_each_entry(asoc, &sp->ep->asocs, asocs)
3541                         asoc->default_rcv_context = params.assoc_value;
3542
3543         return 0;
3544 }
3545
3546 /*
3547  * 7.1.24.  Get or set fragmented interleave (SCTP_FRAGMENT_INTERLEAVE)
3548  *
3549  * This options will at a minimum specify if the implementation is doing
3550  * fragmented interleave.  Fragmented interleave, for a one to many
3551  * socket, is when subsequent calls to receive a message may return
3552  * parts of messages from different associations.  Some implementations
3553  * may allow you to turn this value on or off.  If so, when turned off,
3554  * no fragment interleave will occur (which will cause a head of line
3555  * blocking amongst multiple associations sharing the same one to many
3556  * socket).  When this option is turned on, then each receive call may
3557  * come from a different association (thus the user must receive data
3558  * with the extended calls (e.g. sctp_recvmsg) to keep track of which
3559  * association each receive belongs to.
3560  *
3561  * This option takes a boolean value.  A non-zero value indicates that
3562  * fragmented interleave is on.  A value of zero indicates that
3563  * fragmented interleave is off.
3564  *
3565  * Note that it is important that an implementation that allows this
3566  * option to be turned on, have it off by default.  Otherwise an unaware
3567  * application using the one to many model may become confused and act
3568  * incorrectly.
3569  */
3570 static int sctp_setsockopt_fragment_interleave(struct sock *sk,
3571                                                char __user *optval,
3572                                                unsigned int optlen)
3573 {
3574         int val;
3575
3576         if (optlen != sizeof(int))
3577                 return -EINVAL;
3578         if (get_user(val, (int __user *)optval))
3579                 return -EFAULT;
3580
3581         sctp_sk(sk)->frag_interleave = !!val;
3582
3583         if (!sctp_sk(sk)->frag_interleave)
3584                 sctp_sk(sk)->strm_interleave = 0;
3585
3586         return 0;
3587 }
3588
3589 /*
3590  * 8.1.21.  Set or Get the SCTP Partial Delivery Point
3591  *       (SCTP_PARTIAL_DELIVERY_POINT)
3592  *
3593  * This option will set or get the SCTP partial delivery point.  This
3594  * point is the size of a message where the partial delivery API will be
3595  * invoked to help free up rwnd space for the peer.  Setting this to a
3596  * lower value will cause partial deliveries to happen more often.  The
3597  * calls argument is an integer that sets or gets the partial delivery
3598  * point.  Note also that the call will fail if the user attempts to set
3599  * this value larger than the socket receive buffer size.
3600  *
3601  * Note that any single message having a length smaller than or equal to
3602  * the SCTP partial delivery point will be delivered in one single read
3603  * call as long as the user provided buffer is large enough to hold the
3604  * message.
3605  */
3606 static int sctp_setsockopt_partial_delivery_point(struct sock *sk,
3607                                                   char __user *optval,
3608                                                   unsigned int optlen)
3609 {
3610         u32 val;
3611
3612         if (optlen != sizeof(u32))
3613                 return -EINVAL;
3614         if (get_user(val, (int __user *)optval))
3615                 return -EFAULT;
3616
3617         /* Note: We double the receive buffer from what the user sets
3618          * it to be, also initial rwnd is based on rcvbuf/2.
3619          */
3620         if (val > (sk->sk_rcvbuf >> 1))
3621                 return -EINVAL;
3622
3623         sctp_sk(sk)->pd_point = val;
3624
3625         return 0; /* is this the right error code? */
3626 }
3627
3628 /*
3629  * 7.1.28.  Set or Get the maximum burst (SCTP_MAX_BURST)
3630  *
3631  * This option will allow a user to change the maximum burst of packets
3632  * that can be emitted by this association.  Note that the default value
3633  * is 4, and some implementations may restrict this setting so that it
3634  * can only be lowered.