Merge branch 'linus' into x86/urgent, to pick up dependent changes
[sfrench/cifs-2.6.git] / net / sctp / socket.c
1 /* SCTP kernel implementation
2  * (C) Copyright IBM Corp. 2001, 2004
3  * Copyright (c) 1999-2000 Cisco, Inc.
4  * Copyright (c) 1999-2001 Motorola, Inc.
5  * Copyright (c) 2001-2003 Intel Corp.
6  * Copyright (c) 2001-2002 Nokia, Inc.
7  * Copyright (c) 2001 La Monte H.P. Yarroll
8  *
9  * This file is part of the SCTP kernel implementation
10  *
11  * These functions interface with the sockets layer to implement the
12  * SCTP Extensions for the Sockets API.
13  *
14  * Note that the descriptions from the specification are USER level
15  * functions--this file is the functions which populate the struct proto
16  * for SCTP which is the BOTTOM of the sockets interface.
17  *
18  * This SCTP implementation is free software;
19  * you can redistribute it and/or modify it under the terms of
20  * the GNU General Public License as published by
21  * the Free Software Foundation; either version 2, or (at your option)
22  * any later version.
23  *
24  * This SCTP implementation is distributed in the hope that it
25  * will be useful, but WITHOUT ANY WARRANTY; without even the implied
26  *                 ************************
27  * warranty of MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.
28  * See the GNU General Public License for more details.
29  *
30  * You should have received a copy of the GNU General Public License
31  * along with GNU CC; see the file COPYING.  If not, see
32  * <http://www.gnu.org/licenses/>.
33  *
34  * Please send any bug reports or fixes you make to the
35  * email address(es):
36  *    lksctp developers <linux-sctp@vger.kernel.org>
37  *
38  * Written or modified by:
39  *    La Monte H.P. Yarroll <piggy@acm.org>
40  *    Narasimha Budihal     <narsi@refcode.org>
41  *    Karl Knutson          <karl@athena.chicago.il.us>
42  *    Jon Grimm             <jgrimm@us.ibm.com>
43  *    Xingang Guo           <xingang.guo@intel.com>
44  *    Daisy Chang           <daisyc@us.ibm.com>
45  *    Sridhar Samudrala     <samudrala@us.ibm.com>
46  *    Inaky Perez-Gonzalez  <inaky.gonzalez@intel.com>
47  *    Ardelle Fan           <ardelle.fan@intel.com>
48  *    Ryan Layer            <rmlayer@us.ibm.com>
49  *    Anup Pemmaiah         <pemmaiah@cc.usu.edu>
50  *    Kevin Gao             <kevin.gao@intel.com>
51  */
52
53 #define pr_fmt(fmt) KBUILD_MODNAME ": " fmt
54
55 #include <crypto/hash.h>
56 #include <linux/types.h>
57 #include <linux/kernel.h>
58 #include <linux/wait.h>
59 #include <linux/time.h>
60 #include <linux/sched/signal.h>
61 #include <linux/ip.h>
62 #include <linux/capability.h>
63 #include <linux/fcntl.h>
64 #include <linux/poll.h>
65 #include <linux/init.h>
66 #include <linux/slab.h>
67 #include <linux/file.h>
68 #include <linux/compat.h>
69 #include <linux/rhashtable.h>
70
71 #include <net/ip.h>
72 #include <net/icmp.h>
73 #include <net/route.h>
74 #include <net/ipv6.h>
75 #include <net/inet_common.h>
76 #include <net/busy_poll.h>
77
78 #include <linux/socket.h> /* for sa_family_t */
79 #include <linux/export.h>
80 #include <net/sock.h>
81 #include <net/sctp/sctp.h>
82 #include <net/sctp/sm.h>
83 #include <net/sctp/stream_sched.h>
84
85 /* Forward declarations for internal helper functions. */
86 static bool sctp_writeable(struct sock *sk);
87 static void sctp_wfree(struct sk_buff *skb);
88 static int sctp_wait_for_sndbuf(struct sctp_association *asoc, long *timeo_p,
89                                 size_t msg_len);
90 static int sctp_wait_for_packet(struct sock *sk, int *err, long *timeo_p);
91 static int sctp_wait_for_connect(struct sctp_association *, long *timeo_p);
92 static int sctp_wait_for_accept(struct sock *sk, long timeo);
93 static void sctp_wait_for_close(struct sock *sk, long timeo);
94 static void sctp_destruct_sock(struct sock *sk);
95 static struct sctp_af *sctp_sockaddr_af(struct sctp_sock *opt,
96                                         union sctp_addr *addr, int len);
97 static int sctp_bindx_add(struct sock *, struct sockaddr *, int);
98 static int sctp_bindx_rem(struct sock *, struct sockaddr *, int);
99 static int sctp_send_asconf_add_ip(struct sock *, struct sockaddr *, int);
100 static int sctp_send_asconf_del_ip(struct sock *, struct sockaddr *, int);
101 static int sctp_send_asconf(struct sctp_association *asoc,
102                             struct sctp_chunk *chunk);
103 static int sctp_do_bind(struct sock *, union sctp_addr *, int);
104 static int sctp_autobind(struct sock *sk);
105 static int sctp_sock_migrate(struct sock *oldsk, struct sock *newsk,
106                              struct sctp_association *assoc,
107                              enum sctp_socket_type type);
108
109 static unsigned long sctp_memory_pressure;
110 static atomic_long_t sctp_memory_allocated;
111 struct percpu_counter sctp_sockets_allocated;
112
113 static void sctp_enter_memory_pressure(struct sock *sk)
114 {
115         sctp_memory_pressure = 1;
116 }
117
118
119 /* Get the sndbuf space available at the time on the association.  */
120 static inline int sctp_wspace(struct sctp_association *asoc)
121 {
122         struct sock *sk = asoc->base.sk;
123
124         return asoc->ep->sndbuf_policy ? sk->sk_sndbuf - asoc->sndbuf_used
125                                        : sk_stream_wspace(sk);
126 }
127
128 /* Increment the used sndbuf space count of the corresponding association by
129  * the size of the outgoing data chunk.
130  * Also, set the skb destructor for sndbuf accounting later.
131  *
132  * Since it is always 1-1 between chunk and skb, and also a new skb is always
133  * allocated for chunk bundling in sctp_packet_transmit(), we can use the
134  * destructor in the data chunk skb for the purpose of the sndbuf space
135  * tracking.
136  */
137 static inline void sctp_set_owner_w(struct sctp_chunk *chunk)
138 {
139         struct sctp_association *asoc = chunk->asoc;
140         struct sock *sk = asoc->base.sk;
141
142         /* The sndbuf space is tracked per association.  */
143         sctp_association_hold(asoc);
144
145         if (chunk->shkey)
146                 sctp_auth_shkey_hold(chunk->shkey);
147
148         skb_set_owner_w(chunk->skb, sk);
149
150         chunk->skb->destructor = sctp_wfree;
151         /* Save the chunk pointer in skb for sctp_wfree to use later.  */
152         skb_shinfo(chunk->skb)->destructor_arg = chunk;
153
154         refcount_add(sizeof(struct sctp_chunk), &sk->sk_wmem_alloc);
155         asoc->sndbuf_used += chunk->skb->truesize + sizeof(struct sctp_chunk);
156         sk->sk_wmem_queued += chunk->skb->truesize + sizeof(struct sctp_chunk);
157         sk_mem_charge(sk, chunk->skb->truesize);
158 }
159
160 static void sctp_clear_owner_w(struct sctp_chunk *chunk)
161 {
162         skb_orphan(chunk->skb);
163 }
164
165 static void sctp_for_each_tx_datachunk(struct sctp_association *asoc,
166                                        void (*cb)(struct sctp_chunk *))
167
168 {
169         struct sctp_outq *q = &asoc->outqueue;
170         struct sctp_transport *t;
171         struct sctp_chunk *chunk;
172
173         list_for_each_entry(t, &asoc->peer.transport_addr_list, transports)
174                 list_for_each_entry(chunk, &t->transmitted, transmitted_list)
175                         cb(chunk);
176
177         list_for_each_entry(chunk, &q->retransmit, transmitted_list)
178                 cb(chunk);
179
180         list_for_each_entry(chunk, &q->sacked, transmitted_list)
181                 cb(chunk);
182
183         list_for_each_entry(chunk, &q->abandoned, transmitted_list)
184                 cb(chunk);
185
186         list_for_each_entry(chunk, &q->out_chunk_list, list)
187                 cb(chunk);
188 }
189
190 static void sctp_for_each_rx_skb(struct sctp_association *asoc, struct sock *sk,
191                                  void (*cb)(struct sk_buff *, struct sock *))
192
193 {
194         struct sk_buff *skb, *tmp;
195
196         sctp_skb_for_each(skb, &asoc->ulpq.lobby, tmp)
197                 cb(skb, sk);
198
199         sctp_skb_for_each(skb, &asoc->ulpq.reasm, tmp)
200                 cb(skb, sk);
201
202         sctp_skb_for_each(skb, &asoc->ulpq.reasm_uo, tmp)
203                 cb(skb, sk);
204 }
205
206 /* Verify that this is a valid address. */
207 static inline int sctp_verify_addr(struct sock *sk, union sctp_addr *addr,
208                                    int len)
209 {
210         struct sctp_af *af;
211
212         /* Verify basic sockaddr. */
213         af = sctp_sockaddr_af(sctp_sk(sk), addr, len);
214         if (!af)
215                 return -EINVAL;
216
217         /* Is this a valid SCTP address?  */
218         if (!af->addr_valid(addr, sctp_sk(sk), NULL))
219                 return -EINVAL;
220
221         if (!sctp_sk(sk)->pf->send_verify(sctp_sk(sk), (addr)))
222                 return -EINVAL;
223
224         return 0;
225 }
226
227 /* Look up the association by its id.  If this is not a UDP-style
228  * socket, the ID field is always ignored.
229  */
230 struct sctp_association *sctp_id2assoc(struct sock *sk, sctp_assoc_t id)
231 {
232         struct sctp_association *asoc = NULL;
233
234         /* If this is not a UDP-style socket, assoc id should be ignored. */
235         if (!sctp_style(sk, UDP)) {
236                 /* Return NULL if the socket state is not ESTABLISHED. It
237                  * could be a TCP-style listening socket or a socket which
238                  * hasn't yet called connect() to establish an association.
239                  */
240                 if (!sctp_sstate(sk, ESTABLISHED) && !sctp_sstate(sk, CLOSING))
241                         return NULL;
242
243                 /* Get the first and the only association from the list. */
244                 if (!list_empty(&sctp_sk(sk)->ep->asocs))
245                         asoc = list_entry(sctp_sk(sk)->ep->asocs.next,
246                                           struct sctp_association, asocs);
247                 return asoc;
248         }
249
250         /* Otherwise this is a UDP-style socket. */
251         if (id <= SCTP_ALL_ASSOC)
252                 return NULL;
253
254         spin_lock_bh(&sctp_assocs_id_lock);
255         asoc = (struct sctp_association *)idr_find(&sctp_assocs_id, (int)id);
256         if (asoc && (asoc->base.sk != sk || asoc->base.dead))
257                 asoc = NULL;
258         spin_unlock_bh(&sctp_assocs_id_lock);
259
260         return asoc;
261 }
262
263 /* Look up the transport from an address and an assoc id. If both address and
264  * id are specified, the associations matching the address and the id should be
265  * the same.
266  */
267 static struct sctp_transport *sctp_addr_id2transport(struct sock *sk,
268                                               struct sockaddr_storage *addr,
269                                               sctp_assoc_t id)
270 {
271         struct sctp_association *addr_asoc = NULL, *id_asoc = NULL;
272         struct sctp_af *af = sctp_get_af_specific(addr->ss_family);
273         union sctp_addr *laddr = (union sctp_addr *)addr;
274         struct sctp_transport *transport;
275
276         if (!af || sctp_verify_addr(sk, laddr, af->sockaddr_len))
277                 return NULL;
278
279         addr_asoc = sctp_endpoint_lookup_assoc(sctp_sk(sk)->ep,
280                                                laddr,
281                                                &transport);
282
283         if (!addr_asoc)
284                 return NULL;
285
286         id_asoc = sctp_id2assoc(sk, id);
287         if (id_asoc && (id_asoc != addr_asoc))
288                 return NULL;
289
290         sctp_get_pf_specific(sk->sk_family)->addr_to_user(sctp_sk(sk),
291                                                 (union sctp_addr *)addr);
292
293         return transport;
294 }
295
296 /* API 3.1.2 bind() - UDP Style Syntax
297  * The syntax of bind() is,
298  *
299  *   ret = bind(int sd, struct sockaddr *addr, int addrlen);
300  *
301  *   sd      - the socket descriptor returned by socket().
302  *   addr    - the address structure (struct sockaddr_in or struct
303  *             sockaddr_in6 [RFC 2553]),
304  *   addr_len - the size of the address structure.
305  */
306 static int sctp_bind(struct sock *sk, struct sockaddr *addr, int addr_len)
307 {
308         int retval = 0;
309
310         lock_sock(sk);
311
312         pr_debug("%s: sk:%p, addr:%p, addr_len:%d\n", __func__, sk,
313                  addr, addr_len);
314
315         /* Disallow binding twice. */
316         if (!sctp_sk(sk)->ep->base.bind_addr.port)
317                 retval = sctp_do_bind(sk, (union sctp_addr *)addr,
318                                       addr_len);
319         else
320                 retval = -EINVAL;
321
322         release_sock(sk);
323
324         return retval;
325 }
326
327 static long sctp_get_port_local(struct sock *, union sctp_addr *);
328
329 /* Verify this is a valid sockaddr. */
330 static struct sctp_af *sctp_sockaddr_af(struct sctp_sock *opt,
331                                         union sctp_addr *addr, int len)
332 {
333         struct sctp_af *af;
334
335         /* Check minimum size.  */
336         if (len < sizeof (struct sockaddr))
337                 return NULL;
338
339         if (!opt->pf->af_supported(addr->sa.sa_family, opt))
340                 return NULL;
341
342         if (addr->sa.sa_family == AF_INET6) {
343                 if (len < SIN6_LEN_RFC2133)
344                         return NULL;
345                 /* V4 mapped address are really of AF_INET family */
346                 if (ipv6_addr_v4mapped(&addr->v6.sin6_addr) &&
347                     !opt->pf->af_supported(AF_INET, opt))
348                         return NULL;
349         }
350
351         /* If we get this far, af is valid. */
352         af = sctp_get_af_specific(addr->sa.sa_family);
353
354         if (len < af->sockaddr_len)
355                 return NULL;
356
357         return af;
358 }
359
360 /* Bind a local address either to an endpoint or to an association.  */
361 static int sctp_do_bind(struct sock *sk, union sctp_addr *addr, int len)
362 {
363         struct net *net = sock_net(sk);
364         struct sctp_sock *sp = sctp_sk(sk);
365         struct sctp_endpoint *ep = sp->ep;
366         struct sctp_bind_addr *bp = &ep->base.bind_addr;
367         struct sctp_af *af;
368         unsigned short snum;
369         int ret = 0;
370
371         /* Common sockaddr verification. */
372         af = sctp_sockaddr_af(sp, addr, len);
373         if (!af) {
374                 pr_debug("%s: sk:%p, newaddr:%p, len:%d EINVAL\n",
375                          __func__, sk, addr, len);
376                 return -EINVAL;
377         }
378
379         snum = ntohs(addr->v4.sin_port);
380
381         pr_debug("%s: sk:%p, new addr:%pISc, port:%d, new port:%d, len:%d\n",
382                  __func__, sk, &addr->sa, bp->port, snum, len);
383
384         /* PF specific bind() address verification. */
385         if (!sp->pf->bind_verify(sp, addr))
386                 return -EADDRNOTAVAIL;
387
388         /* We must either be unbound, or bind to the same port.
389          * It's OK to allow 0 ports if we are already bound.
390          * We'll just inhert an already bound port in this case
391          */
392         if (bp->port) {
393                 if (!snum)
394                         snum = bp->port;
395                 else if (snum != bp->port) {
396                         pr_debug("%s: new port %d doesn't match existing port "
397                                  "%d\n", __func__, snum, bp->port);
398                         return -EINVAL;
399                 }
400         }
401
402         if (snum && snum < inet_prot_sock(net) &&
403             !ns_capable(net->user_ns, CAP_NET_BIND_SERVICE))
404                 return -EACCES;
405
406         /* See if the address matches any of the addresses we may have
407          * already bound before checking against other endpoints.
408          */
409         if (sctp_bind_addr_match(bp, addr, sp))
410                 return -EINVAL;
411
412         /* Make sure we are allowed to bind here.
413          * The function sctp_get_port_local() does duplicate address
414          * detection.
415          */
416         addr->v4.sin_port = htons(snum);
417         if ((ret = sctp_get_port_local(sk, addr))) {
418                 return -EADDRINUSE;
419         }
420
421         /* Refresh ephemeral port.  */
422         if (!bp->port)
423                 bp->port = inet_sk(sk)->inet_num;
424
425         /* Add the address to the bind address list.
426          * Use GFP_ATOMIC since BHs will be disabled.
427          */
428         ret = sctp_add_bind_addr(bp, addr, af->sockaddr_len,
429                                  SCTP_ADDR_SRC, GFP_ATOMIC);
430
431         /* Copy back into socket for getsockname() use. */
432         if (!ret) {
433                 inet_sk(sk)->inet_sport = htons(inet_sk(sk)->inet_num);
434                 sp->pf->to_sk_saddr(addr, sk);
435         }
436
437         return ret;
438 }
439
440  /* ADDIP Section 4.1.1 Congestion Control of ASCONF Chunks
441  *
442  * R1) One and only one ASCONF Chunk MAY be in transit and unacknowledged
443  * at any one time.  If a sender, after sending an ASCONF chunk, decides
444  * it needs to transfer another ASCONF Chunk, it MUST wait until the
445  * ASCONF-ACK Chunk returns from the previous ASCONF Chunk before sending a
446  * subsequent ASCONF. Note this restriction binds each side, so at any
447  * time two ASCONF may be in-transit on any given association (one sent
448  * from each endpoint).
449  */
450 static int sctp_send_asconf(struct sctp_association *asoc,
451                             struct sctp_chunk *chunk)
452 {
453         struct net      *net = sock_net(asoc->base.sk);
454         int             retval = 0;
455
456         /* If there is an outstanding ASCONF chunk, queue it for later
457          * transmission.
458          */
459         if (asoc->addip_last_asconf) {
460                 list_add_tail(&chunk->list, &asoc->addip_chunk_list);
461                 goto out;
462         }
463
464         /* Hold the chunk until an ASCONF_ACK is received. */
465         sctp_chunk_hold(chunk);
466         retval = sctp_primitive_ASCONF(net, asoc, chunk);
467         if (retval)
468                 sctp_chunk_free(chunk);
469         else
470                 asoc->addip_last_asconf = chunk;
471
472 out:
473         return retval;
474 }
475
476 /* Add a list of addresses as bind addresses to local endpoint or
477  * association.
478  *
479  * Basically run through each address specified in the addrs/addrcnt
480  * array/length pair, determine if it is IPv6 or IPv4 and call
481  * sctp_do_bind() on it.
482  *
483  * If any of them fails, then the operation will be reversed and the
484  * ones that were added will be removed.
485  *
486  * Only sctp_setsockopt_bindx() is supposed to call this function.
487  */
488 static int sctp_bindx_add(struct sock *sk, struct sockaddr *addrs, int addrcnt)
489 {
490         int cnt;
491         int retval = 0;
492         void *addr_buf;
493         struct sockaddr *sa_addr;
494         struct sctp_af *af;
495
496         pr_debug("%s: sk:%p, addrs:%p, addrcnt:%d\n", __func__, sk,
497                  addrs, addrcnt);
498
499         addr_buf = addrs;
500         for (cnt = 0; cnt < addrcnt; cnt++) {
501                 /* The list may contain either IPv4 or IPv6 address;
502                  * determine the address length for walking thru the list.
503                  */
504                 sa_addr = addr_buf;
505                 af = sctp_get_af_specific(sa_addr->sa_family);
506                 if (!af) {
507                         retval = -EINVAL;
508                         goto err_bindx_add;
509                 }
510
511                 retval = sctp_do_bind(sk, (union sctp_addr *)sa_addr,
512                                       af->sockaddr_len);
513
514                 addr_buf += af->sockaddr_len;
515
516 err_bindx_add:
517                 if (retval < 0) {
518                         /* Failed. Cleanup the ones that have been added */
519                         if (cnt > 0)
520                                 sctp_bindx_rem(sk, addrs, cnt);
521                         return retval;
522                 }
523         }
524
525         return retval;
526 }
527
528 /* Send an ASCONF chunk with Add IP address parameters to all the peers of the
529  * associations that are part of the endpoint indicating that a list of local
530  * addresses are added to the endpoint.
531  *
532  * If any of the addresses is already in the bind address list of the
533  * association, we do not send the chunk for that association.  But it will not
534  * affect other associations.
535  *
536  * Only sctp_setsockopt_bindx() is supposed to call this function.
537  */
538 static int sctp_send_asconf_add_ip(struct sock          *sk,
539                                    struct sockaddr      *addrs,
540                                    int                  addrcnt)
541 {
542         struct net *net = sock_net(sk);
543         struct sctp_sock                *sp;
544         struct sctp_endpoint            *ep;
545         struct sctp_association         *asoc;
546         struct sctp_bind_addr           *bp;
547         struct sctp_chunk               *chunk;
548         struct sctp_sockaddr_entry      *laddr;
549         union sctp_addr                 *addr;
550         union sctp_addr                 saveaddr;
551         void                            *addr_buf;
552         struct sctp_af                  *af;
553         struct list_head                *p;
554         int                             i;
555         int                             retval = 0;
556
557         if (!net->sctp.addip_enable)
558                 return retval;
559
560         sp = sctp_sk(sk);
561         ep = sp->ep;
562
563         pr_debug("%s: sk:%p, addrs:%p, addrcnt:%d\n",
564                  __func__, sk, addrs, addrcnt);
565
566         list_for_each_entry(asoc, &ep->asocs, asocs) {
567                 if (!asoc->peer.asconf_capable)
568                         continue;
569
570                 if (asoc->peer.addip_disabled_mask & SCTP_PARAM_ADD_IP)
571                         continue;
572
573                 if (!sctp_state(asoc, ESTABLISHED))
574                         continue;
575
576                 /* Check if any address in the packed array of addresses is
577                  * in the bind address list of the association. If so,
578                  * do not send the asconf chunk to its peer, but continue with
579                  * other associations.
580                  */
581                 addr_buf = addrs;
582                 for (i = 0; i < addrcnt; i++) {
583                         addr = addr_buf;
584                         af = sctp_get_af_specific(addr->v4.sin_family);
585                         if (!af) {
586                                 retval = -EINVAL;
587                                 goto out;
588                         }
589
590                         if (sctp_assoc_lookup_laddr(asoc, addr))
591                                 break;
592
593                         addr_buf += af->sockaddr_len;
594                 }
595                 if (i < addrcnt)
596                         continue;
597
598                 /* Use the first valid address in bind addr list of
599                  * association as Address Parameter of ASCONF CHUNK.
600                  */
601                 bp = &asoc->base.bind_addr;
602                 p = bp->address_list.next;
603                 laddr = list_entry(p, struct sctp_sockaddr_entry, list);
604                 chunk = sctp_make_asconf_update_ip(asoc, &laddr->a, addrs,
605                                                    addrcnt, SCTP_PARAM_ADD_IP);
606                 if (!chunk) {
607                         retval = -ENOMEM;
608                         goto out;
609                 }
610
611                 /* Add the new addresses to the bind address list with
612                  * use_as_src set to 0.
613                  */
614                 addr_buf = addrs;
615                 for (i = 0; i < addrcnt; i++) {
616                         addr = addr_buf;
617                         af = sctp_get_af_specific(addr->v4.sin_family);
618                         memcpy(&saveaddr, addr, af->sockaddr_len);
619                         retval = sctp_add_bind_addr(bp, &saveaddr,
620                                                     sizeof(saveaddr),
621                                                     SCTP_ADDR_NEW, GFP_ATOMIC);
622                         addr_buf += af->sockaddr_len;
623                 }
624                 if (asoc->src_out_of_asoc_ok) {
625                         struct sctp_transport *trans;
626
627                         list_for_each_entry(trans,
628                             &asoc->peer.transport_addr_list, transports) {
629                                 trans->cwnd = min(4*asoc->pathmtu, max_t(__u32,
630                                     2*asoc->pathmtu, 4380));
631                                 trans->ssthresh = asoc->peer.i.a_rwnd;
632                                 trans->rto = asoc->rto_initial;
633                                 sctp_max_rto(asoc, trans);
634                                 trans->rtt = trans->srtt = trans->rttvar = 0;
635                                 /* Clear the source and route cache */
636                                 sctp_transport_route(trans, NULL,
637                                                      sctp_sk(asoc->base.sk));
638                         }
639                 }
640                 retval = sctp_send_asconf(asoc, chunk);
641         }
642
643 out:
644         return retval;
645 }
646
647 /* Remove a list of addresses from bind addresses list.  Do not remove the
648  * last address.
649  *
650  * Basically run through each address specified in the addrs/addrcnt
651  * array/length pair, determine if it is IPv6 or IPv4 and call
652  * sctp_del_bind() on it.
653  *
654  * If any of them fails, then the operation will be reversed and the
655  * ones that were removed will be added back.
656  *
657  * At least one address has to be left; if only one address is
658  * available, the operation will return -EBUSY.
659  *
660  * Only sctp_setsockopt_bindx() is supposed to call this function.
661  */
662 static int sctp_bindx_rem(struct sock *sk, struct sockaddr *addrs, int addrcnt)
663 {
664         struct sctp_sock *sp = sctp_sk(sk);
665         struct sctp_endpoint *ep = sp->ep;
666         int cnt;
667         struct sctp_bind_addr *bp = &ep->base.bind_addr;
668         int retval = 0;
669         void *addr_buf;
670         union sctp_addr *sa_addr;
671         struct sctp_af *af;
672
673         pr_debug("%s: sk:%p, addrs:%p, addrcnt:%d\n",
674                  __func__, sk, addrs, addrcnt);
675
676         addr_buf = addrs;
677         for (cnt = 0; cnt < addrcnt; cnt++) {
678                 /* If the bind address list is empty or if there is only one
679                  * bind address, there is nothing more to be removed (we need
680                  * at least one address here).
681                  */
682                 if (list_empty(&bp->address_list) ||
683                     (sctp_list_single_entry(&bp->address_list))) {
684                         retval = -EBUSY;
685                         goto err_bindx_rem;
686                 }
687
688                 sa_addr = addr_buf;
689                 af = sctp_get_af_specific(sa_addr->sa.sa_family);
690                 if (!af) {
691                         retval = -EINVAL;
692                         goto err_bindx_rem;
693                 }
694
695                 if (!af->addr_valid(sa_addr, sp, NULL)) {
696                         retval = -EADDRNOTAVAIL;
697                         goto err_bindx_rem;
698                 }
699
700                 if (sa_addr->v4.sin_port &&
701                     sa_addr->v4.sin_port != htons(bp->port)) {
702                         retval = -EINVAL;
703                         goto err_bindx_rem;
704                 }
705
706                 if (!sa_addr->v4.sin_port)
707                         sa_addr->v4.sin_port = htons(bp->port);
708
709                 /* FIXME - There is probably a need to check if sk->sk_saddr and
710                  * sk->sk_rcv_addr are currently set to one of the addresses to
711                  * be removed. This is something which needs to be looked into
712                  * when we are fixing the outstanding issues with multi-homing
713                  * socket routing and failover schemes. Refer to comments in
714                  * sctp_do_bind(). -daisy
715                  */
716                 retval = sctp_del_bind_addr(bp, sa_addr);
717
718                 addr_buf += af->sockaddr_len;
719 err_bindx_rem:
720                 if (retval < 0) {
721                         /* Failed. Add the ones that has been removed back */
722                         if (cnt > 0)
723                                 sctp_bindx_add(sk, addrs, cnt);
724                         return retval;
725                 }
726         }
727
728         return retval;
729 }
730
731 /* Send an ASCONF chunk with Delete IP address parameters to all the peers of
732  * the associations that are part of the endpoint indicating that a list of
733  * local addresses are removed from the endpoint.
734  *
735  * If any of the addresses is already in the bind address list of the
736  * association, we do not send the chunk for that association.  But it will not
737  * affect other associations.
738  *
739  * Only sctp_setsockopt_bindx() is supposed to call this function.
740  */
741 static int sctp_send_asconf_del_ip(struct sock          *sk,
742                                    struct sockaddr      *addrs,
743                                    int                  addrcnt)
744 {
745         struct net *net = sock_net(sk);
746         struct sctp_sock        *sp;
747         struct sctp_endpoint    *ep;
748         struct sctp_association *asoc;
749         struct sctp_transport   *transport;
750         struct sctp_bind_addr   *bp;
751         struct sctp_chunk       *chunk;
752         union sctp_addr         *laddr;
753         void                    *addr_buf;
754         struct sctp_af          *af;
755         struct sctp_sockaddr_entry *saddr;
756         int                     i;
757         int                     retval = 0;
758         int                     stored = 0;
759
760         chunk = NULL;
761         if (!net->sctp.addip_enable)
762                 return retval;
763
764         sp = sctp_sk(sk);
765         ep = sp->ep;
766
767         pr_debug("%s: sk:%p, addrs:%p, addrcnt:%d\n",
768                  __func__, sk, addrs, addrcnt);
769
770         list_for_each_entry(asoc, &ep->asocs, asocs) {
771
772                 if (!asoc->peer.asconf_capable)
773                         continue;
774
775                 if (asoc->peer.addip_disabled_mask & SCTP_PARAM_DEL_IP)
776                         continue;
777
778                 if (!sctp_state(asoc, ESTABLISHED))
779                         continue;
780
781                 /* Check if any address in the packed array of addresses is
782                  * not present in the bind address list of the association.
783                  * If so, do not send the asconf chunk to its peer, but
784                  * continue with other associations.
785                  */
786                 addr_buf = addrs;
787                 for (i = 0; i < addrcnt; i++) {
788                         laddr = addr_buf;
789                         af = sctp_get_af_specific(laddr->v4.sin_family);
790                         if (!af) {
791                                 retval = -EINVAL;
792                                 goto out;
793                         }
794
795                         if (!sctp_assoc_lookup_laddr(asoc, laddr))
796                                 break;
797
798                         addr_buf += af->sockaddr_len;
799                 }
800                 if (i < addrcnt)
801                         continue;
802
803                 /* Find one address in the association's bind address list
804                  * that is not in the packed array of addresses. This is to
805                  * make sure that we do not delete all the addresses in the
806                  * association.
807                  */
808                 bp = &asoc->base.bind_addr;
809                 laddr = sctp_find_unmatch_addr(bp, (union sctp_addr *)addrs,
810                                                addrcnt, sp);
811                 if ((laddr == NULL) && (addrcnt == 1)) {
812                         if (asoc->asconf_addr_del_pending)
813                                 continue;
814                         asoc->asconf_addr_del_pending =
815                             kzalloc(sizeof(union sctp_addr), GFP_ATOMIC);
816                         if (asoc->asconf_addr_del_pending == NULL) {
817                                 retval = -ENOMEM;
818                                 goto out;
819                         }
820                         asoc->asconf_addr_del_pending->sa.sa_family =
821                                     addrs->sa_family;
822                         asoc->asconf_addr_del_pending->v4.sin_port =
823                                     htons(bp->port);
824                         if (addrs->sa_family == AF_INET) {
825                                 struct sockaddr_in *sin;
826
827                                 sin = (struct sockaddr_in *)addrs;
828                                 asoc->asconf_addr_del_pending->v4.sin_addr.s_addr = sin->sin_addr.s_addr;
829                         } else if (addrs->sa_family == AF_INET6) {
830                                 struct sockaddr_in6 *sin6;
831
832                                 sin6 = (struct sockaddr_in6 *)addrs;
833                                 asoc->asconf_addr_del_pending->v6.sin6_addr = sin6->sin6_addr;
834                         }
835
836                         pr_debug("%s: keep the last address asoc:%p %pISc at %p\n",
837                                  __func__, asoc, &asoc->asconf_addr_del_pending->sa,
838                                  asoc->asconf_addr_del_pending);
839
840                         asoc->src_out_of_asoc_ok = 1;
841                         stored = 1;
842                         goto skip_mkasconf;
843                 }
844
845                 if (laddr == NULL)
846                         return -EINVAL;
847
848                 /* We do not need RCU protection throughout this loop
849                  * because this is done under a socket lock from the
850                  * setsockopt call.
851                  */
852                 chunk = sctp_make_asconf_update_ip(asoc, laddr, addrs, addrcnt,
853                                                    SCTP_PARAM_DEL_IP);
854                 if (!chunk) {
855                         retval = -ENOMEM;
856                         goto out;
857                 }
858
859 skip_mkasconf:
860                 /* Reset use_as_src flag for the addresses in the bind address
861                  * list that are to be deleted.
862                  */
863                 addr_buf = addrs;
864                 for (i = 0; i < addrcnt; i++) {
865                         laddr = addr_buf;
866                         af = sctp_get_af_specific(laddr->v4.sin_family);
867                         list_for_each_entry(saddr, &bp->address_list, list) {
868                                 if (sctp_cmp_addr_exact(&saddr->a, laddr))
869                                         saddr->state = SCTP_ADDR_DEL;
870                         }
871                         addr_buf += af->sockaddr_len;
872                 }
873
874                 /* Update the route and saddr entries for all the transports
875                  * as some of the addresses in the bind address list are
876                  * about to be deleted and cannot be used as source addresses.
877                  */
878                 list_for_each_entry(transport, &asoc->peer.transport_addr_list,
879                                         transports) {
880                         sctp_transport_route(transport, NULL,
881                                              sctp_sk(asoc->base.sk));
882                 }
883
884                 if (stored)
885                         /* We don't need to transmit ASCONF */
886                         continue;
887                 retval = sctp_send_asconf(asoc, chunk);
888         }
889 out:
890         return retval;
891 }
892
893 /* set addr events to assocs in the endpoint.  ep and addr_wq must be locked */
894 int sctp_asconf_mgmt(struct sctp_sock *sp, struct sctp_sockaddr_entry *addrw)
895 {
896         struct sock *sk = sctp_opt2sk(sp);
897         union sctp_addr *addr;
898         struct sctp_af *af;
899
900         /* It is safe to write port space in caller. */
901         addr = &addrw->a;
902         addr->v4.sin_port = htons(sp->ep->base.bind_addr.port);
903         af = sctp_get_af_specific(addr->sa.sa_family);
904         if (!af)
905                 return -EINVAL;
906         if (sctp_verify_addr(sk, addr, af->sockaddr_len))
907                 return -EINVAL;
908
909         if (addrw->state == SCTP_ADDR_NEW)
910                 return sctp_send_asconf_add_ip(sk, (struct sockaddr *)addr, 1);
911         else
912                 return sctp_send_asconf_del_ip(sk, (struct sockaddr *)addr, 1);
913 }
914
915 /* Helper for tunneling sctp_bindx() requests through sctp_setsockopt()
916  *
917  * API 8.1
918  * int sctp_bindx(int sd, struct sockaddr *addrs, int addrcnt,
919  *                int flags);
920  *
921  * If sd is an IPv4 socket, the addresses passed must be IPv4 addresses.
922  * If the sd is an IPv6 socket, the addresses passed can either be IPv4
923  * or IPv6 addresses.
924  *
925  * A single address may be specified as INADDR_ANY or IN6ADDR_ANY, see
926  * Section 3.1.2 for this usage.
927  *
928  * addrs is a pointer to an array of one or more socket addresses. Each
929  * address is contained in its appropriate structure (i.e. struct
930  * sockaddr_in or struct sockaddr_in6) the family of the address type
931  * must be used to distinguish the address length (note that this
932  * representation is termed a "packed array" of addresses). The caller
933  * specifies the number of addresses in the array with addrcnt.
934  *
935  * On success, sctp_bindx() returns 0. On failure, sctp_bindx() returns
936  * -1, and sets errno to the appropriate error code.
937  *
938  * For SCTP, the port given in each socket address must be the same, or
939  * sctp_bindx() will fail, setting errno to EINVAL.
940  *
941  * The flags parameter is formed from the bitwise OR of zero or more of
942  * the following currently defined flags:
943  *
944  * SCTP_BINDX_ADD_ADDR
945  *
946  * SCTP_BINDX_REM_ADDR
947  *
948  * SCTP_BINDX_ADD_ADDR directs SCTP to add the given addresses to the
949  * association, and SCTP_BINDX_REM_ADDR directs SCTP to remove the given
950  * addresses from the association. The two flags are mutually exclusive;
951  * if both are given, sctp_bindx() will fail with EINVAL. A caller may
952  * not remove all addresses from an association; sctp_bindx() will
953  * reject such an attempt with EINVAL.
954  *
955  * An application can use sctp_bindx(SCTP_BINDX_ADD_ADDR) to associate
956  * additional addresses with an endpoint after calling bind().  Or use
957  * sctp_bindx(SCTP_BINDX_REM_ADDR) to remove some addresses a listening
958  * socket is associated with so that no new association accepted will be
959  * associated with those addresses. If the endpoint supports dynamic
960  * address a SCTP_BINDX_REM_ADDR or SCTP_BINDX_ADD_ADDR may cause a
961  * endpoint to send the appropriate message to the peer to change the
962  * peers address lists.
963  *
964  * Adding and removing addresses from a connected association is
965  * optional functionality. Implementations that do not support this
966  * functionality should return EOPNOTSUPP.
967  *
968  * Basically do nothing but copying the addresses from user to kernel
969  * land and invoking either sctp_bindx_add() or sctp_bindx_rem() on the sk.
970  * This is used for tunneling the sctp_bindx() request through sctp_setsockopt()
971  * from userspace.
972  *
973  * On exit there is no need to do sockfd_put(), sys_setsockopt() does
974  * it.
975  *
976  * sk        The sk of the socket
977  * addrs     The pointer to the addresses in user land
978  * addrssize Size of the addrs buffer
979  * op        Operation to perform (add or remove, see the flags of
980  *           sctp_bindx)
981  *
982  * Returns 0 if ok, <0 errno code on error.
983  */
984 static int sctp_setsockopt_bindx(struct sock *sk,
985                                  struct sockaddr __user *addrs,
986                                  int addrs_size, int op)
987 {
988         struct sockaddr *kaddrs;
989         int err;
990         int addrcnt = 0;
991         int walk_size = 0;
992         struct sockaddr *sa_addr;
993         void *addr_buf;
994         struct sctp_af *af;
995
996         pr_debug("%s: sk:%p addrs:%p addrs_size:%d opt:%d\n",
997                  __func__, sk, addrs, addrs_size, op);
998
999         if (unlikely(addrs_size <= 0))
1000                 return -EINVAL;
1001
1002         kaddrs = memdup_user(addrs, addrs_size);
1003         if (unlikely(IS_ERR(kaddrs)))
1004                 return PTR_ERR(kaddrs);
1005
1006         /* Walk through the addrs buffer and count the number of addresses. */
1007         addr_buf = kaddrs;
1008         while (walk_size < addrs_size) {
1009                 if (walk_size + sizeof(sa_family_t) > addrs_size) {
1010                         kfree(kaddrs);
1011                         return -EINVAL;
1012                 }
1013
1014                 sa_addr = addr_buf;
1015                 af = sctp_get_af_specific(sa_addr->sa_family);
1016
1017                 /* If the address family is not supported or if this address
1018                  * causes the address buffer to overflow return EINVAL.
1019                  */
1020                 if (!af || (walk_size + af->sockaddr_len) > addrs_size) {
1021                         kfree(kaddrs);
1022                         return -EINVAL;
1023                 }
1024                 addrcnt++;
1025                 addr_buf += af->sockaddr_len;
1026                 walk_size += af->sockaddr_len;
1027         }
1028
1029         /* Do the work. */
1030         switch (op) {
1031         case SCTP_BINDX_ADD_ADDR:
1032                 /* Allow security module to validate bindx addresses. */
1033                 err = security_sctp_bind_connect(sk, SCTP_SOCKOPT_BINDX_ADD,
1034                                                  (struct sockaddr *)kaddrs,
1035                                                  addrs_size);
1036                 if (err)
1037                         goto out;
1038                 err = sctp_bindx_add(sk, kaddrs, addrcnt);
1039                 if (err)
1040                         goto out;
1041                 err = sctp_send_asconf_add_ip(sk, kaddrs, addrcnt);
1042                 break;
1043
1044         case SCTP_BINDX_REM_ADDR:
1045                 err = sctp_bindx_rem(sk, kaddrs, addrcnt);
1046                 if (err)
1047                         goto out;
1048                 err = sctp_send_asconf_del_ip(sk, kaddrs, addrcnt);
1049                 break;
1050
1051         default:
1052                 err = -EINVAL;
1053                 break;
1054         }
1055
1056 out:
1057         kfree(kaddrs);
1058
1059         return err;
1060 }
1061
1062 /* __sctp_connect(struct sock* sk, struct sockaddr *kaddrs, int addrs_size)
1063  *
1064  * Common routine for handling connect() and sctp_connectx().
1065  * Connect will come in with just a single address.
1066  */
1067 static int __sctp_connect(struct sock *sk,
1068                           struct sockaddr *kaddrs,
1069                           int addrs_size, int flags,
1070                           sctp_assoc_t *assoc_id)
1071 {
1072         struct net *net = sock_net(sk);
1073         struct sctp_sock *sp;
1074         struct sctp_endpoint *ep;
1075         struct sctp_association *asoc = NULL;
1076         struct sctp_association *asoc2;
1077         struct sctp_transport *transport;
1078         union sctp_addr to;
1079         enum sctp_scope scope;
1080         long timeo;
1081         int err = 0;
1082         int addrcnt = 0;
1083         int walk_size = 0;
1084         union sctp_addr *sa_addr = NULL;
1085         void *addr_buf;
1086         unsigned short port;
1087
1088         sp = sctp_sk(sk);
1089         ep = sp->ep;
1090
1091         /* connect() cannot be done on a socket that is already in ESTABLISHED
1092          * state - UDP-style peeled off socket or a TCP-style socket that
1093          * is already connected.
1094          * It cannot be done even on a TCP-style listening socket.
1095          */
1096         if (sctp_sstate(sk, ESTABLISHED) || sctp_sstate(sk, CLOSING) ||
1097             (sctp_style(sk, TCP) && sctp_sstate(sk, LISTENING))) {
1098                 err = -EISCONN;
1099                 goto out_free;
1100         }
1101
1102         /* Walk through the addrs buffer and count the number of addresses. */
1103         addr_buf = kaddrs;
1104         while (walk_size < addrs_size) {
1105                 struct sctp_af *af;
1106
1107                 if (walk_size + sizeof(sa_family_t) > addrs_size) {
1108                         err = -EINVAL;
1109                         goto out_free;
1110                 }
1111
1112                 sa_addr = addr_buf;
1113                 af = sctp_get_af_specific(sa_addr->sa.sa_family);
1114
1115                 /* If the address family is not supported or if this address
1116                  * causes the address buffer to overflow return EINVAL.
1117                  */
1118                 if (!af || (walk_size + af->sockaddr_len) > addrs_size) {
1119                         err = -EINVAL;
1120                         goto out_free;
1121                 }
1122
1123                 port = ntohs(sa_addr->v4.sin_port);
1124
1125                 /* Save current address so we can work with it */
1126                 memcpy(&to, sa_addr, af->sockaddr_len);
1127
1128                 err = sctp_verify_addr(sk, &to, af->sockaddr_len);
1129                 if (err)
1130                         goto out_free;
1131
1132                 /* Make sure the destination port is correctly set
1133                  * in all addresses.
1134                  */
1135                 if (asoc && asoc->peer.port && asoc->peer.port != port) {
1136                         err = -EINVAL;
1137                         goto out_free;
1138                 }
1139
1140                 /* Check if there already is a matching association on the
1141                  * endpoint (other than the one created here).
1142                  */
1143                 asoc2 = sctp_endpoint_lookup_assoc(ep, &to, &transport);
1144                 if (asoc2 && asoc2 != asoc) {
1145                         if (asoc2->state >= SCTP_STATE_ESTABLISHED)
1146                                 err = -EISCONN;
1147                         else
1148                                 err = -EALREADY;
1149                         goto out_free;
1150                 }
1151
1152                 /* If we could not find a matching association on the endpoint,
1153                  * make sure that there is no peeled-off association matching
1154                  * the peer address even on another socket.
1155                  */
1156                 if (sctp_endpoint_is_peeled_off(ep, &to)) {
1157                         err = -EADDRNOTAVAIL;
1158                         goto out_free;
1159                 }
1160
1161                 if (!asoc) {
1162                         /* If a bind() or sctp_bindx() is not called prior to
1163                          * an sctp_connectx() call, the system picks an
1164                          * ephemeral port and will choose an address set
1165                          * equivalent to binding with a wildcard address.
1166                          */
1167                         if (!ep->base.bind_addr.port) {
1168                                 if (sctp_autobind(sk)) {
1169                                         err = -EAGAIN;
1170                                         goto out_free;
1171                                 }
1172                         } else {
1173                                 /*
1174                                  * If an unprivileged user inherits a 1-many
1175                                  * style socket with open associations on a
1176                                  * privileged port, it MAY be permitted to
1177                                  * accept new associations, but it SHOULD NOT
1178                                  * be permitted to open new associations.
1179                                  */
1180                                 if (ep->base.bind_addr.port <
1181                                     inet_prot_sock(net) &&
1182                                     !ns_capable(net->user_ns,
1183                                     CAP_NET_BIND_SERVICE)) {
1184                                         err = -EACCES;
1185                                         goto out_free;
1186                                 }
1187                         }
1188
1189                         scope = sctp_scope(&to);
1190                         asoc = sctp_association_new(ep, sk, scope, GFP_KERNEL);
1191                         if (!asoc) {
1192                                 err = -ENOMEM;
1193                                 goto out_free;
1194                         }
1195
1196                         err = sctp_assoc_set_bind_addr_from_ep(asoc, scope,
1197                                                               GFP_KERNEL);
1198                         if (err < 0) {
1199                                 goto out_free;
1200                         }
1201
1202                 }
1203
1204                 /* Prime the peer's transport structures.  */
1205                 transport = sctp_assoc_add_peer(asoc, &to, GFP_KERNEL,
1206                                                 SCTP_UNKNOWN);
1207                 if (!transport) {
1208                         err = -ENOMEM;
1209                         goto out_free;
1210                 }
1211
1212                 addrcnt++;
1213                 addr_buf += af->sockaddr_len;
1214                 walk_size += af->sockaddr_len;
1215         }
1216
1217         /* In case the user of sctp_connectx() wants an association
1218          * id back, assign one now.
1219          */
1220         if (assoc_id) {
1221                 err = sctp_assoc_set_id(asoc, GFP_KERNEL);
1222                 if (err < 0)
1223                         goto out_free;
1224         }
1225
1226         err = sctp_primitive_ASSOCIATE(net, asoc, NULL);
1227         if (err < 0) {
1228                 goto out_free;
1229         }
1230
1231         /* Initialize sk's dport and daddr for getpeername() */
1232         inet_sk(sk)->inet_dport = htons(asoc->peer.port);
1233         sp->pf->to_sk_daddr(sa_addr, sk);
1234         sk->sk_err = 0;
1235
1236         timeo = sock_sndtimeo(sk, flags & O_NONBLOCK);
1237
1238         if (assoc_id)
1239                 *assoc_id = asoc->assoc_id;
1240
1241         err = sctp_wait_for_connect(asoc, &timeo);
1242         /* Note: the asoc may be freed after the return of
1243          * sctp_wait_for_connect.
1244          */
1245
1246         /* Don't free association on exit. */
1247         asoc = NULL;
1248
1249 out_free:
1250         pr_debug("%s: took out_free path with asoc:%p kaddrs:%p err:%d\n",
1251                  __func__, asoc, kaddrs, err);
1252
1253         if (asoc) {
1254                 /* sctp_primitive_ASSOCIATE may have added this association
1255                  * To the hash table, try to unhash it, just in case, its a noop
1256                  * if it wasn't hashed so we're safe
1257                  */
1258                 sctp_association_free(asoc);
1259         }
1260         return err;
1261 }
1262
1263 /* Helper for tunneling sctp_connectx() requests through sctp_setsockopt()
1264  *
1265  * API 8.9
1266  * int sctp_connectx(int sd, struct sockaddr *addrs, int addrcnt,
1267  *                      sctp_assoc_t *asoc);
1268  *
1269  * If sd is an IPv4 socket, the addresses passed must be IPv4 addresses.
1270  * If the sd is an IPv6 socket, the addresses passed can either be IPv4
1271  * or IPv6 addresses.
1272  *
1273  * A single address may be specified as INADDR_ANY or IN6ADDR_ANY, see
1274  * Section 3.1.2 for this usage.
1275  *
1276  * addrs is a pointer to an array of one or more socket addresses. Each
1277  * address is contained in its appropriate structure (i.e. struct
1278  * sockaddr_in or struct sockaddr_in6) the family of the address type
1279  * must be used to distengish the address length (note that this
1280  * representation is termed a "packed array" of addresses). The caller
1281  * specifies the number of addresses in the array with addrcnt.
1282  *
1283  * On success, sctp_connectx() returns 0. It also sets the assoc_id to
1284  * the association id of the new association.  On failure, sctp_connectx()
1285  * returns -1, and sets errno to the appropriate error code.  The assoc_id
1286  * is not touched by the kernel.
1287  *
1288  * For SCTP, the port given in each socket address must be the same, or
1289  * sctp_connectx() will fail, setting errno to EINVAL.
1290  *
1291  * An application can use sctp_connectx to initiate an association with
1292  * an endpoint that is multi-homed.  Much like sctp_bindx() this call
1293  * allows a caller to specify multiple addresses at which a peer can be
1294  * reached.  The way the SCTP stack uses the list of addresses to set up
1295  * the association is implementation dependent.  This function only
1296  * specifies that the stack will try to make use of all the addresses in
1297  * the list when needed.
1298  *
1299  * Note that the list of addresses passed in is only used for setting up
1300  * the association.  It does not necessarily equal the set of addresses
1301  * the peer uses for the resulting association.  If the caller wants to
1302  * find out the set of peer addresses, it must use sctp_getpaddrs() to
1303  * retrieve them after the association has been set up.
1304  *
1305  * Basically do nothing but copying the addresses from user to kernel
1306  * land and invoking either sctp_connectx(). This is used for tunneling
1307  * the sctp_connectx() request through sctp_setsockopt() from userspace.
1308  *
1309  * On exit there is no need to do sockfd_put(), sys_setsockopt() does
1310  * it.
1311  *
1312  * sk        The sk of the socket
1313  * addrs     The pointer to the addresses in user land
1314  * addrssize Size of the addrs buffer
1315  *
1316  * Returns >=0 if ok, <0 errno code on error.
1317  */
1318 static int __sctp_setsockopt_connectx(struct sock *sk,
1319                                       struct sockaddr __user *addrs,
1320                                       int addrs_size,
1321                                       sctp_assoc_t *assoc_id)
1322 {
1323         struct sockaddr *kaddrs;
1324         int err = 0, flags = 0;
1325
1326         pr_debug("%s: sk:%p addrs:%p addrs_size:%d\n",
1327                  __func__, sk, addrs, addrs_size);
1328
1329         if (unlikely(addrs_size <= 0))
1330                 return -EINVAL;
1331
1332         kaddrs = memdup_user(addrs, addrs_size);
1333         if (unlikely(IS_ERR(kaddrs)))
1334                 return PTR_ERR(kaddrs);
1335
1336         /* Allow security module to validate connectx addresses. */
1337         err = security_sctp_bind_connect(sk, SCTP_SOCKOPT_CONNECTX,
1338                                          (struct sockaddr *)kaddrs,
1339                                           addrs_size);
1340         if (err)
1341                 goto out_free;
1342
1343         /* in-kernel sockets don't generally have a file allocated to them
1344          * if all they do is call sock_create_kern().
1345          */
1346         if (sk->sk_socket->file)
1347                 flags = sk->sk_socket->file->f_flags;
1348
1349         err = __sctp_connect(sk, kaddrs, addrs_size, flags, assoc_id);
1350
1351 out_free:
1352         kfree(kaddrs);
1353
1354         return err;
1355 }
1356
1357 /*
1358  * This is an older interface.  It's kept for backward compatibility
1359  * to the option that doesn't provide association id.
1360  */
1361 static int sctp_setsockopt_connectx_old(struct sock *sk,
1362                                         struct sockaddr __user *addrs,
1363                                         int addrs_size)
1364 {
1365         return __sctp_setsockopt_connectx(sk, addrs, addrs_size, NULL);
1366 }
1367
1368 /*
1369  * New interface for the API.  The since the API is done with a socket
1370  * option, to make it simple we feed back the association id is as a return
1371  * indication to the call.  Error is always negative and association id is
1372  * always positive.
1373  */
1374 static int sctp_setsockopt_connectx(struct sock *sk,
1375                                     struct sockaddr __user *addrs,
1376                                     int addrs_size)
1377 {
1378         sctp_assoc_t assoc_id = 0;
1379         int err = 0;
1380
1381         err = __sctp_setsockopt_connectx(sk, addrs, addrs_size, &assoc_id);
1382
1383         if (err)
1384                 return err;
1385         else
1386                 return assoc_id;
1387 }
1388
1389 /*
1390  * New (hopefully final) interface for the API.
1391  * We use the sctp_getaddrs_old structure so that use-space library
1392  * can avoid any unnecessary allocations. The only different part
1393  * is that we store the actual length of the address buffer into the
1394  * addrs_num structure member. That way we can re-use the existing
1395  * code.
1396  */
1397 #ifdef CONFIG_COMPAT
1398 struct compat_sctp_getaddrs_old {
1399         sctp_assoc_t    assoc_id;
1400         s32             addr_num;
1401         compat_uptr_t   addrs;          /* struct sockaddr * */
1402 };
1403 #endif
1404
1405 static int sctp_getsockopt_connectx3(struct sock *sk, int len,
1406                                      char __user *optval,
1407                                      int __user *optlen)
1408 {
1409         struct sctp_getaddrs_old param;
1410         sctp_assoc_t assoc_id = 0;
1411         int err = 0;
1412
1413 #ifdef CONFIG_COMPAT
1414         if (in_compat_syscall()) {
1415                 struct compat_sctp_getaddrs_old param32;
1416
1417                 if (len < sizeof(param32))
1418                         return -EINVAL;
1419                 if (copy_from_user(&param32, optval, sizeof(param32)))
1420                         return -EFAULT;
1421
1422                 param.assoc_id = param32.assoc_id;
1423                 param.addr_num = param32.addr_num;
1424                 param.addrs = compat_ptr(param32.addrs);
1425         } else
1426 #endif
1427         {
1428                 if (len < sizeof(param))
1429                         return -EINVAL;
1430                 if (copy_from_user(&param, optval, sizeof(param)))
1431                         return -EFAULT;
1432         }
1433
1434         err = __sctp_setsockopt_connectx(sk, (struct sockaddr __user *)
1435                                          param.addrs, param.addr_num,
1436                                          &assoc_id);
1437         if (err == 0 || err == -EINPROGRESS) {
1438                 if (copy_to_user(optval, &assoc_id, sizeof(assoc_id)))
1439                         return -EFAULT;
1440                 if (put_user(sizeof(assoc_id), optlen))
1441                         return -EFAULT;
1442         }
1443
1444         return err;
1445 }
1446
1447 /* API 3.1.4 close() - UDP Style Syntax
1448  * Applications use close() to perform graceful shutdown (as described in
1449  * Section 10.1 of [SCTP]) on ALL the associations currently represented
1450  * by a UDP-style socket.
1451  *
1452  * The syntax is
1453  *
1454  *   ret = close(int sd);
1455  *
1456  *   sd      - the socket descriptor of the associations to be closed.
1457  *
1458  * To gracefully shutdown a specific association represented by the
1459  * UDP-style socket, an application should use the sendmsg() call,
1460  * passing no user data, but including the appropriate flag in the
1461  * ancillary data (see Section xxxx).
1462  *
1463  * If sd in the close() call is a branched-off socket representing only
1464  * one association, the shutdown is performed on that association only.
1465  *
1466  * 4.1.6 close() - TCP Style Syntax
1467  *
1468  * Applications use close() to gracefully close down an association.
1469  *
1470  * The syntax is:
1471  *
1472  *    int close(int sd);
1473  *
1474  *      sd      - the socket descriptor of the association to be closed.
1475  *
1476  * After an application calls close() on a socket descriptor, no further
1477  * socket operations will succeed on that descriptor.
1478  *
1479  * API 7.1.4 SO_LINGER
1480  *
1481  * An application using the TCP-style socket can use this option to
1482  * perform the SCTP ABORT primitive.  The linger option structure is:
1483  *
1484  *  struct  linger {
1485  *     int     l_onoff;                // option on/off
1486  *     int     l_linger;               // linger time
1487  * };
1488  *
1489  * To enable the option, set l_onoff to 1.  If the l_linger value is set
1490  * to 0, calling close() is the same as the ABORT primitive.  If the
1491  * value is set to a negative value, the setsockopt() call will return
1492  * an error.  If the value is set to a positive value linger_time, the
1493  * close() can be blocked for at most linger_time ms.  If the graceful
1494  * shutdown phase does not finish during this period, close() will
1495  * return but the graceful shutdown phase continues in the system.
1496  */
1497 static void sctp_close(struct sock *sk, long timeout)
1498 {
1499         struct net *net = sock_net(sk);
1500         struct sctp_endpoint *ep;
1501         struct sctp_association *asoc;
1502         struct list_head *pos, *temp;
1503         unsigned int data_was_unread;
1504
1505         pr_debug("%s: sk:%p, timeout:%ld\n", __func__, sk, timeout);
1506
1507         lock_sock_nested(sk, SINGLE_DEPTH_NESTING);
1508         sk->sk_shutdown = SHUTDOWN_MASK;
1509         inet_sk_set_state(sk, SCTP_SS_CLOSING);
1510
1511         ep = sctp_sk(sk)->ep;
1512
1513         /* Clean up any skbs sitting on the receive queue.  */
1514         data_was_unread = sctp_queue_purge_ulpevents(&sk->sk_receive_queue);
1515         data_was_unread += sctp_queue_purge_ulpevents(&sctp_sk(sk)->pd_lobby);
1516
1517         /* Walk all associations on an endpoint.  */
1518         list_for_each_safe(pos, temp, &ep->asocs) {
1519                 asoc = list_entry(pos, struct sctp_association, asocs);
1520
1521                 if (sctp_style(sk, TCP)) {
1522                         /* A closed association can still be in the list if
1523                          * it belongs to a TCP-style listening socket that is
1524                          * not yet accepted. If so, free it. If not, send an
1525                          * ABORT or SHUTDOWN based on the linger options.
1526                          */
1527                         if (sctp_state(asoc, CLOSED)) {
1528                                 sctp_association_free(asoc);
1529                                 continue;
1530                         }
1531                 }
1532
1533                 if (data_was_unread || !skb_queue_empty(&asoc->ulpq.lobby) ||
1534                     !skb_queue_empty(&asoc->ulpq.reasm) ||
1535                     !skb_queue_empty(&asoc->ulpq.reasm_uo) ||
1536                     (sock_flag(sk, SOCK_LINGER) && !sk->sk_lingertime)) {
1537                         struct sctp_chunk *chunk;
1538
1539                         chunk = sctp_make_abort_user(asoc, NULL, 0);
1540                         sctp_primitive_ABORT(net, asoc, chunk);
1541                 } else
1542                         sctp_primitive_SHUTDOWN(net, asoc, NULL);
1543         }
1544
1545         /* On a TCP-style socket, block for at most linger_time if set. */
1546         if (sctp_style(sk, TCP) && timeout)
1547                 sctp_wait_for_close(sk, timeout);
1548
1549         /* This will run the backlog queue.  */
1550         release_sock(sk);
1551
1552         /* Supposedly, no process has access to the socket, but
1553          * the net layers still may.
1554          * Also, sctp_destroy_sock() needs to be called with addr_wq_lock
1555          * held and that should be grabbed before socket lock.
1556          */
1557         spin_lock_bh(&net->sctp.addr_wq_lock);
1558         bh_lock_sock_nested(sk);
1559
1560         /* Hold the sock, since sk_common_release() will put sock_put()
1561          * and we have just a little more cleanup.
1562          */
1563         sock_hold(sk);
1564         sk_common_release(sk);
1565
1566         bh_unlock_sock(sk);
1567         spin_unlock_bh(&net->sctp.addr_wq_lock);
1568
1569         sock_put(sk);
1570
1571         SCTP_DBG_OBJCNT_DEC(sock);
1572 }
1573
1574 /* Handle EPIPE error. */
1575 static int sctp_error(struct sock *sk, int flags, int err)
1576 {
1577         if (err == -EPIPE)
1578                 err = sock_error(sk) ? : -EPIPE;
1579         if (err == -EPIPE && !(flags & MSG_NOSIGNAL))
1580                 send_sig(SIGPIPE, current, 0);
1581         return err;
1582 }
1583
1584 /* API 3.1.3 sendmsg() - UDP Style Syntax
1585  *
1586  * An application uses sendmsg() and recvmsg() calls to transmit data to
1587  * and receive data from its peer.
1588  *
1589  *  ssize_t sendmsg(int socket, const struct msghdr *message,
1590  *                  int flags);
1591  *
1592  *  socket  - the socket descriptor of the endpoint.
1593  *  message - pointer to the msghdr structure which contains a single
1594  *            user message and possibly some ancillary data.
1595  *
1596  *            See Section 5 for complete description of the data
1597  *            structures.
1598  *
1599  *  flags   - flags sent or received with the user message, see Section
1600  *            5 for complete description of the flags.
1601  *
1602  * Note:  This function could use a rewrite especially when explicit
1603  * connect support comes in.
1604  */
1605 /* BUG:  We do not implement the equivalent of sk_stream_wait_memory(). */
1606
1607 static int sctp_msghdr_parse(const struct msghdr *msg,
1608                              struct sctp_cmsgs *cmsgs);
1609
1610 static int sctp_sendmsg_parse(struct sock *sk, struct sctp_cmsgs *cmsgs,
1611                               struct sctp_sndrcvinfo *srinfo,
1612                               const struct msghdr *msg, size_t msg_len)
1613 {
1614         __u16 sflags;
1615         int err;
1616
1617         if (sctp_sstate(sk, LISTENING) && sctp_style(sk, TCP))
1618                 return -EPIPE;
1619
1620         if (msg_len > sk->sk_sndbuf)
1621                 return -EMSGSIZE;
1622
1623         memset(cmsgs, 0, sizeof(*cmsgs));
1624         err = sctp_msghdr_parse(msg, cmsgs);
1625         if (err) {
1626                 pr_debug("%s: msghdr parse err:%x\n", __func__, err);
1627                 return err;
1628         }
1629
1630         memset(srinfo, 0, sizeof(*srinfo));
1631         if (cmsgs->srinfo) {
1632                 srinfo->sinfo_stream = cmsgs->srinfo->sinfo_stream;
1633                 srinfo->sinfo_flags = cmsgs->srinfo->sinfo_flags;
1634                 srinfo->sinfo_ppid = cmsgs->srinfo->sinfo_ppid;
1635                 srinfo->sinfo_context = cmsgs->srinfo->sinfo_context;
1636                 srinfo->sinfo_assoc_id = cmsgs->srinfo->sinfo_assoc_id;
1637                 srinfo->sinfo_timetolive = cmsgs->srinfo->sinfo_timetolive;
1638         }
1639
1640         if (cmsgs->sinfo) {
1641                 srinfo->sinfo_stream = cmsgs->sinfo->snd_sid;
1642                 srinfo->sinfo_flags = cmsgs->sinfo->snd_flags;
1643                 srinfo->sinfo_ppid = cmsgs->sinfo->snd_ppid;
1644                 srinfo->sinfo_context = cmsgs->sinfo->snd_context;
1645                 srinfo->sinfo_assoc_id = cmsgs->sinfo->snd_assoc_id;
1646         }
1647
1648         if (cmsgs->prinfo) {
1649                 srinfo->sinfo_timetolive = cmsgs->prinfo->pr_value;
1650                 SCTP_PR_SET_POLICY(srinfo->sinfo_flags,
1651                                    cmsgs->prinfo->pr_policy);
1652         }
1653
1654         sflags = srinfo->sinfo_flags;
1655         if (!sflags && msg_len)
1656                 return 0;
1657
1658         if (sctp_style(sk, TCP) && (sflags & (SCTP_EOF | SCTP_ABORT)))
1659                 return -EINVAL;
1660
1661         if (((sflags & SCTP_EOF) && msg_len > 0) ||
1662             (!(sflags & (SCTP_EOF | SCTP_ABORT)) && msg_len == 0))
1663                 return -EINVAL;
1664
1665         if ((sflags & SCTP_ADDR_OVER) && !msg->msg_name)
1666                 return -EINVAL;
1667
1668         return 0;
1669 }
1670
1671 static int sctp_sendmsg_new_asoc(struct sock *sk, __u16 sflags,
1672                                  struct sctp_cmsgs *cmsgs,
1673                                  union sctp_addr *daddr,
1674                                  struct sctp_transport **tp)
1675 {
1676         struct sctp_endpoint *ep = sctp_sk(sk)->ep;
1677         struct net *net = sock_net(sk);
1678         struct sctp_association *asoc;
1679         enum sctp_scope scope;
1680         struct cmsghdr *cmsg;
1681         __be32 flowinfo = 0;
1682         struct sctp_af *af;
1683         int err;
1684
1685         *tp = NULL;
1686
1687         if (sflags & (SCTP_EOF | SCTP_ABORT))
1688                 return -EINVAL;
1689
1690         if (sctp_style(sk, TCP) && (sctp_sstate(sk, ESTABLISHED) ||
1691                                     sctp_sstate(sk, CLOSING)))
1692                 return -EADDRNOTAVAIL;
1693
1694         if (sctp_endpoint_is_peeled_off(ep, daddr))
1695                 return -EADDRNOTAVAIL;
1696
1697         if (!ep->base.bind_addr.port) {
1698                 if (sctp_autobind(sk))
1699                         return -EAGAIN;
1700         } else {
1701                 if (ep->base.bind_addr.port < inet_prot_sock(net) &&
1702                     !ns_capable(net->user_ns, CAP_NET_BIND_SERVICE))
1703                         return -EACCES;
1704         }
1705
1706         scope = sctp_scope(daddr);
1707
1708         /* Label connection socket for first association 1-to-many
1709          * style for client sequence socket()->sendmsg(). This
1710          * needs to be done before sctp_assoc_add_peer() as that will
1711          * set up the initial packet that needs to account for any
1712          * security ip options (CIPSO/CALIPSO) added to the packet.
1713          */
1714         af = sctp_get_af_specific(daddr->sa.sa_family);
1715         if (!af)
1716                 return -EINVAL;
1717         err = security_sctp_bind_connect(sk, SCTP_SENDMSG_CONNECT,
1718                                          (struct sockaddr *)daddr,
1719                                          af->sockaddr_len);
1720         if (err < 0)
1721                 return err;
1722
1723         asoc = sctp_association_new(ep, sk, scope, GFP_KERNEL);
1724         if (!asoc)
1725                 return -ENOMEM;
1726
1727         if (sctp_assoc_set_bind_addr_from_ep(asoc, scope, GFP_KERNEL) < 0) {
1728                 err = -ENOMEM;
1729                 goto free;
1730         }
1731
1732         if (cmsgs->init) {
1733                 struct sctp_initmsg *init = cmsgs->init;
1734
1735                 if (init->sinit_num_ostreams) {
1736                         __u16 outcnt = init->sinit_num_ostreams;
1737
1738                         asoc->c.sinit_num_ostreams = outcnt;
1739                         /* outcnt has been changed, need to re-init stream */
1740                         err = sctp_stream_init(&asoc->stream, outcnt, 0,
1741                                                GFP_KERNEL);
1742                         if (err)
1743                                 goto free;
1744                 }
1745
1746                 if (init->sinit_max_instreams)
1747                         asoc->c.sinit_max_instreams = init->sinit_max_instreams;
1748
1749                 if (init->sinit_max_attempts)
1750                         asoc->max_init_attempts = init->sinit_max_attempts;
1751
1752                 if (init->sinit_max_init_timeo)
1753                         asoc->max_init_timeo =
1754                                 msecs_to_jiffies(init->sinit_max_init_timeo);
1755         }
1756
1757         *tp = sctp_assoc_add_peer(asoc, daddr, GFP_KERNEL, SCTP_UNKNOWN);
1758         if (!*tp) {
1759                 err = -ENOMEM;
1760                 goto free;
1761         }
1762
1763         if (!cmsgs->addrs_msg)
1764                 return 0;
1765
1766         if (daddr->sa.sa_family == AF_INET6)
1767                 flowinfo = daddr->v6.sin6_flowinfo;
1768
1769         /* sendv addr list parse */
1770         for_each_cmsghdr(cmsg, cmsgs->addrs_msg) {
1771                 struct sctp_transport *transport;
1772                 struct sctp_association *old;
1773                 union sctp_addr _daddr;
1774                 int dlen;
1775
1776                 if (cmsg->cmsg_level != IPPROTO_SCTP ||
1777                     (cmsg->cmsg_type != SCTP_DSTADDRV4 &&
1778                      cmsg->cmsg_type != SCTP_DSTADDRV6))
1779                         continue;
1780
1781                 daddr = &_daddr;
1782                 memset(daddr, 0, sizeof(*daddr));
1783                 dlen = cmsg->cmsg_len - sizeof(struct cmsghdr);
1784                 if (cmsg->cmsg_type == SCTP_DSTADDRV4) {
1785                         if (dlen < sizeof(struct in_addr)) {
1786                                 err = -EINVAL;
1787                                 goto free;
1788                         }
1789
1790                         dlen = sizeof(struct in_addr);
1791                         daddr->v4.sin_family = AF_INET;
1792                         daddr->v4.sin_port = htons(asoc->peer.port);
1793                         memcpy(&daddr->v4.sin_addr, CMSG_DATA(cmsg), dlen);
1794                 } else {
1795                         if (dlen < sizeof(struct in6_addr)) {
1796                                 err = -EINVAL;
1797                                 goto free;
1798                         }
1799
1800                         dlen = sizeof(struct in6_addr);
1801                         daddr->v6.sin6_flowinfo = flowinfo;
1802                         daddr->v6.sin6_family = AF_INET6;
1803                         daddr->v6.sin6_port = htons(asoc->peer.port);
1804                         memcpy(&daddr->v6.sin6_addr, CMSG_DATA(cmsg), dlen);
1805                 }
1806                 err = sctp_verify_addr(sk, daddr, sizeof(*daddr));
1807                 if (err)
1808                         goto free;
1809
1810                 old = sctp_endpoint_lookup_assoc(ep, daddr, &transport);
1811                 if (old && old != asoc) {
1812                         if (old->state >= SCTP_STATE_ESTABLISHED)
1813                                 err = -EISCONN;
1814                         else
1815                                 err = -EALREADY;
1816                         goto free;
1817                 }
1818
1819                 if (sctp_endpoint_is_peeled_off(ep, daddr)) {
1820                         err = -EADDRNOTAVAIL;
1821                         goto free;
1822                 }
1823
1824                 transport = sctp_assoc_add_peer(asoc, daddr, GFP_KERNEL,
1825                                                 SCTP_UNKNOWN);
1826                 if (!transport) {
1827                         err = -ENOMEM;
1828                         goto free;
1829                 }
1830         }
1831
1832         return 0;
1833
1834 free:
1835         sctp_association_free(asoc);
1836         return err;
1837 }
1838
1839 static int sctp_sendmsg_check_sflags(struct sctp_association *asoc,
1840                                      __u16 sflags, struct msghdr *msg,
1841                                      size_t msg_len)
1842 {
1843         struct sock *sk = asoc->base.sk;
1844         struct net *net = sock_net(sk);
1845
1846         if (sctp_state(asoc, CLOSED) && sctp_style(sk, TCP))
1847                 return -EPIPE;
1848
1849         if ((sflags & SCTP_SENDALL) && sctp_style(sk, UDP) &&
1850             !sctp_state(asoc, ESTABLISHED))
1851                 return 0;
1852
1853         if (sflags & SCTP_EOF) {
1854                 pr_debug("%s: shutting down association:%p\n", __func__, asoc);
1855                 sctp_primitive_SHUTDOWN(net, asoc, NULL);
1856
1857                 return 0;
1858         }
1859
1860         if (sflags & SCTP_ABORT) {
1861                 struct sctp_chunk *chunk;
1862
1863                 chunk = sctp_make_abort_user(asoc, msg, msg_len);
1864                 if (!chunk)
1865                         return -ENOMEM;
1866
1867                 pr_debug("%s: aborting association:%p\n", __func__, asoc);
1868                 sctp_primitive_ABORT(net, asoc, chunk);
1869                 iov_iter_revert(&msg->msg_iter, msg_len);
1870
1871                 return 0;
1872         }
1873
1874         return 1;
1875 }
1876
1877 static int sctp_sendmsg_to_asoc(struct sctp_association *asoc,
1878                                 struct msghdr *msg, size_t msg_len,
1879                                 struct sctp_transport *transport,
1880                                 struct sctp_sndrcvinfo *sinfo)
1881 {
1882         struct sock *sk = asoc->base.sk;
1883         struct sctp_sock *sp = sctp_sk(sk);
1884         struct net *net = sock_net(sk);
1885         struct sctp_datamsg *datamsg;
1886         bool wait_connect = false;
1887         struct sctp_chunk *chunk;
1888         long timeo;
1889         int err;
1890
1891         if (sinfo->sinfo_stream >= asoc->stream.outcnt) {
1892                 err = -EINVAL;
1893                 goto err;
1894         }
1895
1896         if (unlikely(!SCTP_SO(&asoc->stream, sinfo->sinfo_stream)->ext)) {
1897                 err = sctp_stream_init_ext(&asoc->stream, sinfo->sinfo_stream);
1898                 if (err)
1899                         goto err;
1900         }
1901
1902         if (sp->disable_fragments && msg_len > asoc->frag_point) {
1903                 err = -EMSGSIZE;
1904                 goto err;
1905         }
1906
1907         if (asoc->pmtu_pending) {
1908                 if (sp->param_flags & SPP_PMTUD_ENABLE)
1909                         sctp_assoc_sync_pmtu(asoc);
1910                 asoc->pmtu_pending = 0;
1911         }
1912
1913         if (sctp_wspace(asoc) < (int)msg_len)
1914                 sctp_prsctp_prune(asoc, sinfo, msg_len - sctp_wspace(asoc));
1915
1916         if (sk_under_memory_pressure(sk))
1917                 sk_mem_reclaim(sk);
1918
1919         if (sctp_wspace(asoc) <= 0 || !sk_wmem_schedule(sk, msg_len)) {
1920                 timeo = sock_sndtimeo(sk, msg->msg_flags & MSG_DONTWAIT);
1921                 err = sctp_wait_for_sndbuf(asoc, &timeo, msg_len);
1922                 if (err)
1923                         goto err;
1924         }
1925
1926         if (sctp_state(asoc, CLOSED)) {
1927                 err = sctp_primitive_ASSOCIATE(net, asoc, NULL);
1928                 if (err)
1929                         goto err;
1930
1931                 if (sp->strm_interleave) {
1932                         timeo = sock_sndtimeo(sk, 0);
1933                         err = sctp_wait_for_connect(asoc, &timeo);
1934                         if (err) {
1935                                 err = -ESRCH;
1936                                 goto err;
1937                         }
1938                 } else {
1939                         wait_connect = true;
1940                 }
1941
1942                 pr_debug("%s: we associated primitively\n", __func__);
1943         }
1944
1945         datamsg = sctp_datamsg_from_user(asoc, sinfo, &msg->msg_iter);
1946         if (IS_ERR(datamsg)) {
1947                 err = PTR_ERR(datamsg);
1948                 goto err;
1949         }
1950
1951         asoc->force_delay = !!(msg->msg_flags & MSG_MORE);
1952
1953         list_for_each_entry(chunk, &datamsg->chunks, frag_list) {
1954                 sctp_chunk_hold(chunk);
1955                 sctp_set_owner_w(chunk);
1956                 chunk->transport = transport;
1957         }
1958
1959         err = sctp_primitive_SEND(net, asoc, datamsg);
1960         if (err) {
1961                 sctp_datamsg_free(datamsg);
1962                 goto err;
1963         }
1964
1965         pr_debug("%s: we sent primitively\n", __func__);
1966
1967         sctp_datamsg_put(datamsg);
1968
1969         if (unlikely(wait_connect)) {
1970                 timeo = sock_sndtimeo(sk, msg->msg_flags & MSG_DONTWAIT);
1971                 sctp_wait_for_connect(asoc, &timeo);
1972         }
1973
1974         err = msg_len;
1975
1976 err:
1977         return err;
1978 }
1979
1980 static union sctp_addr *sctp_sendmsg_get_daddr(struct sock *sk,
1981                                                const struct msghdr *msg,
1982                                                struct sctp_cmsgs *cmsgs)
1983 {
1984         union sctp_addr *daddr = NULL;
1985         int err;
1986
1987         if (!sctp_style(sk, UDP_HIGH_BANDWIDTH) && msg->msg_name) {
1988                 int len = msg->msg_namelen;
1989
1990                 if (len > sizeof(*daddr))
1991                         len = sizeof(*daddr);
1992
1993                 daddr = (union sctp_addr *)msg->msg_name;
1994
1995                 err = sctp_verify_addr(sk, daddr, len);
1996                 if (err)
1997                         return ERR_PTR(err);
1998         }
1999
2000         return daddr;
2001 }
2002
2003 static void sctp_sendmsg_update_sinfo(struct sctp_association *asoc,
2004                                       struct sctp_sndrcvinfo *sinfo,
2005                                       struct sctp_cmsgs *cmsgs)
2006 {
2007         if (!cmsgs->srinfo && !cmsgs->sinfo) {
2008                 sinfo->sinfo_stream = asoc->default_stream;
2009                 sinfo->sinfo_ppid = asoc->default_ppid;
2010                 sinfo->sinfo_context = asoc->default_context;
2011                 sinfo->sinfo_assoc_id = sctp_assoc2id(asoc);
2012
2013                 if (!cmsgs->prinfo)
2014                         sinfo->sinfo_flags = asoc->default_flags;
2015         }
2016
2017         if (!cmsgs->srinfo && !cmsgs->prinfo)
2018                 sinfo->sinfo_timetolive = asoc->default_timetolive;
2019
2020         if (cmsgs->authinfo) {
2021                 /* Reuse sinfo_tsn to indicate that authinfo was set and
2022                  * sinfo_ssn to save the keyid on tx path.
2023                  */
2024                 sinfo->sinfo_tsn = 1;
2025                 sinfo->sinfo_ssn = cmsgs->authinfo->auth_keynumber;
2026         }
2027 }
2028
2029 static int sctp_sendmsg(struct sock *sk, struct msghdr *msg, size_t msg_len)
2030 {
2031         struct sctp_endpoint *ep = sctp_sk(sk)->ep;
2032         struct sctp_transport *transport = NULL;
2033         struct sctp_sndrcvinfo _sinfo, *sinfo;
2034         struct sctp_association *asoc, *tmp;
2035         struct sctp_cmsgs cmsgs;
2036         union sctp_addr *daddr;
2037         bool new = false;
2038         __u16 sflags;
2039         int err;
2040
2041         /* Parse and get snd_info */
2042         err = sctp_sendmsg_parse(sk, &cmsgs, &_sinfo, msg, msg_len);
2043         if (err)
2044                 goto out;
2045
2046         sinfo  = &_sinfo;
2047         sflags = sinfo->sinfo_flags;
2048
2049         /* Get daddr from msg */
2050         daddr = sctp_sendmsg_get_daddr(sk, msg, &cmsgs);
2051         if (IS_ERR(daddr)) {
2052                 err = PTR_ERR(daddr);
2053                 goto out;
2054         }
2055
2056         lock_sock(sk);
2057
2058         /* SCTP_SENDALL process */
2059         if ((sflags & SCTP_SENDALL) && sctp_style(sk, UDP)) {
2060                 list_for_each_entry_safe(asoc, tmp, &ep->asocs, asocs) {
2061                         err = sctp_sendmsg_check_sflags(asoc, sflags, msg,
2062                                                         msg_len);
2063                         if (err == 0)
2064                                 continue;
2065                         if (err < 0)
2066                                 goto out_unlock;
2067
2068                         sctp_sendmsg_update_sinfo(asoc, sinfo, &cmsgs);
2069
2070                         err = sctp_sendmsg_to_asoc(asoc, msg, msg_len,
2071                                                    NULL, sinfo);
2072                         if (err < 0)
2073                                 goto out_unlock;
2074
2075                         iov_iter_revert(&msg->msg_iter, err);
2076                 }
2077
2078                 goto out_unlock;
2079         }
2080
2081         /* Get and check or create asoc */
2082         if (daddr) {
2083                 asoc = sctp_endpoint_lookup_assoc(ep, daddr, &transport);
2084                 if (asoc) {
2085                         err = sctp_sendmsg_check_sflags(asoc, sflags, msg,
2086                                                         msg_len);
2087                         if (err <= 0)
2088                                 goto out_unlock;
2089                 } else {
2090                         err = sctp_sendmsg_new_asoc(sk, sflags, &cmsgs, daddr,
2091                                                     &transport);
2092                         if (err)
2093                                 goto out_unlock;
2094
2095                         asoc = transport->asoc;
2096                         new = true;
2097                 }
2098
2099                 if (!sctp_style(sk, TCP) && !(sflags & SCTP_ADDR_OVER))
2100                         transport = NULL;
2101         } else {
2102                 asoc = sctp_id2assoc(sk, sinfo->sinfo_assoc_id);
2103                 if (!asoc) {
2104                         err = -EPIPE;
2105                         goto out_unlock;
2106                 }
2107
2108                 err = sctp_sendmsg_check_sflags(asoc, sflags, msg, msg_len);
2109                 if (err <= 0)
2110                         goto out_unlock;
2111         }
2112
2113         /* Update snd_info with the asoc */
2114         sctp_sendmsg_update_sinfo(asoc, sinfo, &cmsgs);
2115
2116         /* Send msg to the asoc */
2117         err = sctp_sendmsg_to_asoc(asoc, msg, msg_len, transport, sinfo);
2118         if (err < 0 && err != -ESRCH && new)
2119                 sctp_association_free(asoc);
2120
2121 out_unlock:
2122         release_sock(sk);
2123 out:
2124         return sctp_error(sk, msg->msg_flags, err);
2125 }
2126
2127 /* This is an extended version of skb_pull() that removes the data from the
2128  * start of a skb even when data is spread across the list of skb's in the
2129  * frag_list. len specifies the total amount of data that needs to be removed.
2130  * when 'len' bytes could be removed from the skb, it returns 0.
2131  * If 'len' exceeds the total skb length,  it returns the no. of bytes that
2132  * could not be removed.
2133  */
2134 static int sctp_skb_pull(struct sk_buff *skb, int len)
2135 {
2136         struct sk_buff *list;
2137         int skb_len = skb_headlen(skb);
2138         int rlen;
2139
2140         if (len <= skb_len) {
2141                 __skb_pull(skb, len);
2142                 return 0;
2143         }
2144         len -= skb_len;
2145         __skb_pull(skb, skb_len);
2146
2147         skb_walk_frags(skb, list) {
2148                 rlen = sctp_skb_pull(list, len);
2149                 skb->len -= (len-rlen);
2150                 skb->data_len -= (len-rlen);
2151
2152                 if (!rlen)
2153                         return 0;
2154
2155                 len = rlen;
2156         }
2157
2158         return len;
2159 }
2160
2161 /* API 3.1.3  recvmsg() - UDP Style Syntax
2162  *
2163  *  ssize_t recvmsg(int socket, struct msghdr *message,
2164  *                    int flags);
2165  *
2166  *  socket  - the socket descriptor of the endpoint.
2167  *  message - pointer to the msghdr structure which contains a single
2168  *            user message and possibly some ancillary data.
2169  *
2170  *            See Section 5 for complete description of the data
2171  *            structures.
2172  *
2173  *  flags   - flags sent or received with the user message, see Section
2174  *            5 for complete description of the flags.
2175  */
2176 static int sctp_recvmsg(struct sock *sk, struct msghdr *msg, size_t len,
2177                         int noblock, int flags, int *addr_len)
2178 {
2179         struct sctp_ulpevent *event = NULL;
2180         struct sctp_sock *sp = sctp_sk(sk);
2181         struct sk_buff *skb, *head_skb;
2182         int copied;
2183         int err = 0;
2184         int skb_len;
2185
2186         pr_debug("%s: sk:%p, msghdr:%p, len:%zd, noblock:%d, flags:0x%x, "
2187                  "addr_len:%p)\n", __func__, sk, msg, len, noblock, flags,
2188                  addr_len);
2189
2190         lock_sock(sk);
2191
2192         if (sctp_style(sk, TCP) && !sctp_sstate(sk, ESTABLISHED) &&
2193             !sctp_sstate(sk, CLOSING) && !sctp_sstate(sk, CLOSED)) {
2194                 err = -ENOTCONN;
2195                 goto out;
2196         }
2197
2198         skb = sctp_skb_recv_datagram(sk, flags, noblock, &err);
2199         if (!skb)
2200                 goto out;
2201
2202         /* Get the total length of the skb including any skb's in the
2203          * frag_list.
2204          */
2205         skb_len = skb->len;
2206
2207         copied = skb_len;
2208         if (copied > len)
2209                 copied = len;
2210
2211         err = skb_copy_datagram_msg(skb, 0, msg, copied);
2212
2213         event = sctp_skb2event(skb);
2214
2215         if (err)
2216                 goto out_free;
2217
2218         if (event->chunk && event->chunk->head_skb)
2219                 head_skb = event->chunk->head_skb;
2220         else
2221                 head_skb = skb;
2222         sock_recv_ts_and_drops(msg, sk, head_skb);
2223         if (sctp_ulpevent_is_notification(event)) {
2224                 msg->msg_flags |= MSG_NOTIFICATION;
2225                 sp->pf->event_msgname(event, msg->msg_name, addr_len);
2226         } else {
2227                 sp->pf->skb_msgname(head_skb, msg->msg_name, addr_len);
2228         }
2229
2230         /* Check if we allow SCTP_NXTINFO. */
2231         if (sp->recvnxtinfo)
2232                 sctp_ulpevent_read_nxtinfo(event, msg, sk);
2233         /* Check if we allow SCTP_RCVINFO. */
2234         if (sp->recvrcvinfo)
2235                 sctp_ulpevent_read_rcvinfo(event, msg);
2236         /* Check if we allow SCTP_SNDRCVINFO. */
2237         if (sctp_ulpevent_type_enabled(sp->subscribe, SCTP_DATA_IO_EVENT))
2238                 sctp_ulpevent_read_sndrcvinfo(event, msg);
2239
2240         err = copied;
2241
2242         /* If skb's length exceeds the user's buffer, update the skb and
2243          * push it back to the receive_queue so that the next call to
2244          * recvmsg() will return the remaining data. Don't set MSG_EOR.
2245          */
2246         if (skb_len > copied) {
2247                 msg->msg_flags &= ~MSG_EOR;
2248                 if (flags & MSG_PEEK)
2249                         goto out_free;
2250                 sctp_skb_pull(skb, copied);
2251                 skb_queue_head(&sk->sk_receive_queue, skb);
2252
2253                 /* When only partial message is copied to the user, increase
2254                  * rwnd by that amount. If all the data in the skb is read,
2255                  * rwnd is updated when the event is freed.
2256                  */
2257                 if (!sctp_ulpevent_is_notification(event))
2258                         sctp_assoc_rwnd_increase(event->asoc, copied);
2259                 goto out;
2260         } else if ((event->msg_flags & MSG_NOTIFICATION) ||
2261                    (event->msg_flags & MSG_EOR))
2262                 msg->msg_flags |= MSG_EOR;
2263         else
2264                 msg->msg_flags &= ~MSG_EOR;
2265
2266 out_free:
2267         if (flags & MSG_PEEK) {
2268                 /* Release the skb reference acquired after peeking the skb in
2269                  * sctp_skb_recv_datagram().
2270                  */
2271                 kfree_skb(skb);
2272         } else {
2273                 /* Free the event which includes releasing the reference to
2274                  * the owner of the skb, freeing the skb and updating the
2275                  * rwnd.
2276                  */
2277                 sctp_ulpevent_free(event);
2278         }
2279 out:
2280         release_sock(sk);
2281         return err;
2282 }
2283
2284 /* 7.1.12 Enable/Disable message fragmentation (SCTP_DISABLE_FRAGMENTS)
2285  *
2286  * This option is a on/off flag.  If enabled no SCTP message
2287  * fragmentation will be performed.  Instead if a message being sent
2288  * exceeds the current PMTU size, the message will NOT be sent and
2289  * instead a error will be indicated to the user.
2290  */
2291 static int sctp_setsockopt_disable_fragments(struct sock *sk,
2292                                              char __user *optval,
2293                                              unsigned int optlen)
2294 {
2295         int val;
2296
2297         if (optlen < sizeof(int))
2298                 return -EINVAL;
2299
2300         if (get_user(val, (int __user *)optval))
2301                 return -EFAULT;
2302
2303         sctp_sk(sk)->disable_fragments = (val == 0) ? 0 : 1;
2304
2305         return 0;
2306 }
2307
2308 static int sctp_setsockopt_events(struct sock *sk, char __user *optval,
2309                                   unsigned int optlen)
2310 {
2311         struct sctp_event_subscribe subscribe;
2312         __u8 *sn_type = (__u8 *)&subscribe;
2313         struct sctp_sock *sp = sctp_sk(sk);
2314         struct sctp_association *asoc;
2315         int i;
2316
2317         if (optlen > sizeof(struct sctp_event_subscribe))
2318                 return -EINVAL;
2319
2320         if (copy_from_user(&subscribe, optval, optlen))
2321                 return -EFAULT;
2322
2323         for (i = 0; i < optlen; i++)
2324                 sctp_ulpevent_type_set(&sp->subscribe, SCTP_SN_TYPE_BASE + i,
2325                                        sn_type[i]);
2326
2327         list_for_each_entry(asoc, &sp->ep->asocs, asocs)
2328                 asoc->subscribe = sctp_sk(sk)->subscribe;
2329
2330         /* At the time when a user app subscribes to SCTP_SENDER_DRY_EVENT,
2331          * if there is no data to be sent or retransmit, the stack will
2332          * immediately send up this notification.
2333          */
2334         if (sctp_ulpevent_type_enabled(sp->subscribe, SCTP_SENDER_DRY_EVENT)) {
2335                 struct sctp_ulpevent *event;
2336
2337                 asoc = sctp_id2assoc(sk, 0);
2338                 if (asoc && sctp_outq_is_empty(&asoc->outqueue)) {
2339                         event = sctp_ulpevent_make_sender_dry_event(asoc,
2340                                         GFP_USER | __GFP_NOWARN);
2341                         if (!event)
2342                                 return -ENOMEM;
2343
2344                         asoc->stream.si->enqueue_event(&asoc->ulpq, event);
2345                 }
2346         }
2347
2348         return 0;
2349 }
2350
2351 /* 7.1.8 Automatic Close of associations (SCTP_AUTOCLOSE)
2352  *
2353  * This socket option is applicable to the UDP-style socket only.  When
2354  * set it will cause associations that are idle for more than the
2355  * specified number of seconds to automatically close.  An association
2356  * being idle is defined an association that has NOT sent or received
2357  * user data.  The special value of '0' indicates that no automatic
2358  * close of any associations should be performed.  The option expects an
2359  * integer defining the number of seconds of idle time before an
2360  * association is closed.
2361  */
2362 static int sctp_setsockopt_autoclose(struct sock *sk, char __user *optval,
2363                                      unsigned int optlen)
2364 {
2365         struct sctp_sock *sp = sctp_sk(sk);
2366         struct net *net = sock_net(sk);
2367
2368         /* Applicable to UDP-style socket only */
2369         if (sctp_style(sk, TCP))
2370                 return -EOPNOTSUPP;
2371         if (optlen != sizeof(int))
2372                 return -EINVAL;
2373         if (copy_from_user(&sp->autoclose, optval, optlen))
2374                 return -EFAULT;
2375
2376         if (sp->autoclose > net->sctp.max_autoclose)
2377                 sp->autoclose = net->sctp.max_autoclose;
2378
2379         return 0;
2380 }
2381
2382 /* 7.1.13 Peer Address Parameters (SCTP_PEER_ADDR_PARAMS)
2383  *
2384  * Applications can enable or disable heartbeats for any peer address of
2385  * an association, modify an address's heartbeat interval, force a
2386  * heartbeat to be sent immediately, and adjust the address's maximum
2387  * number of retransmissions sent before an address is considered
2388  * unreachable.  The following structure is used to access and modify an
2389  * address's parameters:
2390  *
2391  *  struct sctp_paddrparams {
2392  *     sctp_assoc_t            spp_assoc_id;
2393  *     struct sockaddr_storage spp_address;
2394  *     uint32_t                spp_hbinterval;
2395  *     uint16_t                spp_pathmaxrxt;
2396  *     uint32_t                spp_pathmtu;
2397  *     uint32_t                spp_sackdelay;
2398  *     uint32_t                spp_flags;
2399  *     uint32_t                spp_ipv6_flowlabel;
2400  *     uint8_t                 spp_dscp;
2401  * };
2402  *
2403  *   spp_assoc_id    - (one-to-many style socket) This is filled in the
2404  *                     application, and identifies the association for
2405  *                     this query.
2406  *   spp_address     - This specifies which address is of interest.
2407  *   spp_hbinterval  - This contains the value of the heartbeat interval,
2408  *                     in milliseconds.  If a  value of zero
2409  *                     is present in this field then no changes are to
2410  *                     be made to this parameter.
2411  *   spp_pathmaxrxt  - This contains the maximum number of
2412  *                     retransmissions before this address shall be
2413  *                     considered unreachable. If a  value of zero
2414  *                     is present in this field then no changes are to
2415  *                     be made to this parameter.
2416  *   spp_pathmtu     - When Path MTU discovery is disabled the value
2417  *                     specified here will be the "fixed" path mtu.
2418  *                     Note that if the spp_address field is empty
2419  *                     then all associations on this address will
2420  *                     have this fixed path mtu set upon them.
2421  *
2422  *   spp_sackdelay   - When delayed sack is enabled, this value specifies
2423  *                     the number of milliseconds that sacks will be delayed
2424  *                     for. This value will apply to all addresses of an
2425  *                     association if the spp_address field is empty. Note
2426  *                     also, that if delayed sack is enabled and this
2427  *                     value is set to 0, no change is made to the last
2428  *                     recorded delayed sack timer value.
2429  *
2430  *   spp_flags       - These flags are used to control various features
2431  *                     on an association. The flag field may contain
2432  *                     zero or more of the following options.
2433  *
2434  *                     SPP_HB_ENABLE  - Enable heartbeats on the
2435  *                     specified address. Note that if the address
2436  *                     field is empty all addresses for the association
2437  *                     have heartbeats enabled upon them.
2438  *
2439  *                     SPP_HB_DISABLE - Disable heartbeats on the
2440  *                     speicifed address. Note that if the address
2441  *                     field is empty all addresses for the association
2442  *                     will have their heartbeats disabled. Note also
2443  *                     that SPP_HB_ENABLE and SPP_HB_DISABLE are
2444  *                     mutually exclusive, only one of these two should
2445  *                     be specified. Enabling both fields will have
2446  *                     undetermined results.
2447  *
2448  *                     SPP_HB_DEMAND - Request a user initiated heartbeat
2449  *                     to be made immediately.
2450  *
2451  *                     SPP_HB_TIME_IS_ZERO - Specify's that the time for
2452  *                     heartbeat delayis to be set to the value of 0
2453  *                     milliseconds.
2454  *
2455  *                     SPP_PMTUD_ENABLE - This field will enable PMTU
2456  *                     discovery upon the specified address. Note that
2457  *                     if the address feild is empty then all addresses
2458  *                     on the association are effected.
2459  *
2460  *                     SPP_PMTUD_DISABLE - This field will disable PMTU
2461  *                     discovery upon the specified address. Note that
2462  *                     if the address feild is empty then all addresses
2463  *                     on the association are effected. Not also that
2464  *                     SPP_PMTUD_ENABLE and SPP_PMTUD_DISABLE are mutually
2465  *                     exclusive. Enabling both will have undetermined
2466  *                     results.
2467  *
2468  *                     SPP_SACKDELAY_ENABLE - Setting this flag turns
2469  *                     on delayed sack. The time specified in spp_sackdelay
2470  *                     is used to specify the sack delay for this address. Note
2471  *                     that if spp_address is empty then all addresses will
2472  *                     enable delayed sack and take on the sack delay
2473  *                     value specified in spp_sackdelay.
2474  *                     SPP_SACKDELAY_DISABLE - Setting this flag turns
2475  *                     off delayed sack. If the spp_address field is blank then
2476  *                     delayed sack is disabled for the entire association. Note
2477  *                     also that this field is mutually exclusive to
2478  *                     SPP_SACKDELAY_ENABLE, setting both will have undefined
2479  *                     results.
2480  *
2481  *                     SPP_IPV6_FLOWLABEL:  Setting this flag enables the
2482  *                     setting of the IPV6 flow label value.  The value is
2483  *                     contained in the spp_ipv6_flowlabel field.
2484  *                     Upon retrieval, this flag will be set to indicate that
2485  *                     the spp_ipv6_flowlabel field has a valid value returned.
2486  *                     If a specific destination address is set (in the
2487  *                     spp_address field), then the value returned is that of
2488  *                     the address.  If just an association is specified (and
2489  *                     no address), then the association's default flow label
2490  *                     is returned.  If neither an association nor a destination
2491  *                     is specified, then the socket's default flow label is
2492  *                     returned.  For non-IPv6 sockets, this flag will be left
2493  *                     cleared.
2494  *
2495  *                     SPP_DSCP:  Setting this flag enables the setting of the
2496  *                     Differentiated Services Code Point (DSCP) value
2497  *                     associated with either the association or a specific
2498  *                     address.  The value is obtained in the spp_dscp field.
2499  *                     Upon retrieval, this flag will be set to indicate that
2500  *                     the spp_dscp field has a valid value returned.  If a
2501  *                     specific destination address is set when called (in the
2502  *                     spp_address field), then that specific destination
2503  *                     address's DSCP value is returned.  If just an association
2504  *                     is specified, then the association's default DSCP is
2505  *                     returned.  If neither an association nor a destination is
2506  *                     specified, then the socket's default DSCP is returned.
2507  *
2508  *   spp_ipv6_flowlabel
2509  *                   - This field is used in conjunction with the
2510  *                     SPP_IPV6_FLOWLABEL flag and contains the IPv6 flow label.
2511  *                     The 20 least significant bits are used for the flow
2512  *                     label.  This setting has precedence over any IPv6-layer
2513  *                     setting.
2514  *
2515  *   spp_dscp        - This field is used in conjunction with the SPP_DSCP flag
2516  *                     and contains the DSCP.  The 6 most significant bits are
2517  *                     used for the DSCP.  This setting has precedence over any
2518  *                     IPv4- or IPv6- layer setting.
2519  */
2520 static int sctp_apply_peer_addr_params(struct sctp_paddrparams *params,
2521                                        struct sctp_transport   *trans,
2522                                        struct sctp_association *asoc,
2523                                        struct sctp_sock        *sp,
2524                                        int                      hb_change,
2525                                        int                      pmtud_change,
2526                                        int                      sackdelay_change)
2527 {
2528         int error;
2529
2530         if (params->spp_flags & SPP_HB_DEMAND && trans) {
2531                 struct net *net = sock_net(trans->asoc->base.sk);
2532
2533                 error = sctp_primitive_REQUESTHEARTBEAT(net, trans->asoc, trans);
2534                 if (error)
2535                         return error;
2536         }
2537
2538         /* Note that unless the spp_flag is set to SPP_HB_ENABLE the value of
2539          * this field is ignored.  Note also that a value of zero indicates
2540          * the current setting should be left unchanged.
2541          */
2542         if (params->spp_flags & SPP_HB_ENABLE) {
2543
2544                 /* Re-zero the interval if the SPP_HB_TIME_IS_ZERO is
2545                  * set.  This lets us use 0 value when this flag
2546                  * is set.
2547                  */
2548                 if (params->spp_flags & SPP_HB_TIME_IS_ZERO)
2549                         params->spp_hbinterval = 0;
2550
2551                 if (params->spp_hbinterval ||
2552                     (params->spp_flags & SPP_HB_TIME_IS_ZERO)) {
2553                         if (trans) {
2554                                 trans->hbinterval =
2555                                     msecs_to_jiffies(params->spp_hbinterval);
2556                         } else if (asoc) {
2557                                 asoc->hbinterval =
2558                                     msecs_to_jiffies(params->spp_hbinterval);
2559                         } else {
2560                                 sp->hbinterval = params->spp_hbinterval;
2561                         }
2562                 }
2563         }
2564
2565         if (hb_change) {
2566                 if (trans) {
2567                         trans->param_flags =
2568                                 (trans->param_flags & ~SPP_HB) | hb_change;
2569                 } else if (asoc) {
2570                         asoc->param_flags =
2571                                 (asoc->param_flags & ~SPP_HB) | hb_change;
2572                 } else {
2573                         sp->param_flags =
2574                                 (sp->param_flags & ~SPP_HB) | hb_change;
2575                 }
2576         }
2577
2578         /* When Path MTU discovery is disabled the value specified here will
2579          * be the "fixed" path mtu (i.e. the value of the spp_flags field must
2580          * include the flag SPP_PMTUD_DISABLE for this field to have any
2581          * effect).
2582          */
2583         if ((params->spp_flags & SPP_PMTUD_DISABLE) && params->spp_pathmtu) {
2584                 if (trans) {
2585                         trans->pathmtu = params->spp_pathmtu;
2586                         sctp_assoc_sync_pmtu(asoc);
2587                 } else if (asoc) {
2588                         sctp_assoc_set_pmtu(asoc, params->spp_pathmtu);
2589                 } else {
2590                         sp->pathmtu = params->spp_pathmtu;
2591                 }
2592         }
2593
2594         if (pmtud_change) {
2595                 if (trans) {
2596                         int update = (trans->param_flags & SPP_PMTUD_DISABLE) &&
2597                                 (params->spp_flags & SPP_PMTUD_ENABLE);
2598                         trans->param_flags =
2599                                 (trans->param_flags & ~SPP_PMTUD) | pmtud_change;
2600                         if (update) {
2601                                 sctp_transport_pmtu(trans, sctp_opt2sk(sp));
2602                                 sctp_assoc_sync_pmtu(asoc);
2603                         }
2604                 } else if (asoc) {
2605                         asoc->param_flags =
2606                                 (asoc->param_flags & ~SPP_PMTUD) | pmtud_change;
2607                 } else {
2608                         sp->param_flags =
2609                                 (sp->param_flags & ~SPP_PMTUD) | pmtud_change;
2610                 }
2611         }
2612
2613         /* Note that unless the spp_flag is set to SPP_SACKDELAY_ENABLE the
2614          * value of this field is ignored.  Note also that a value of zero
2615          * indicates the current setting should be left unchanged.
2616          */
2617         if ((params->spp_flags & SPP_SACKDELAY_ENABLE) && params->spp_sackdelay) {
2618                 if (trans) {
2619                         trans->sackdelay =
2620                                 msecs_to_jiffies(params->spp_sackdelay);
2621                 } else if (asoc) {
2622                         asoc->sackdelay =
2623                                 msecs_to_jiffies(params->spp_sackdelay);
2624                 } else {
2625                         sp->sackdelay = params->spp_sackdelay;
2626                 }
2627         }
2628
2629         if (sackdelay_change) {
2630                 if (trans) {
2631                         trans->param_flags =
2632                                 (trans->param_flags & ~SPP_SACKDELAY) |
2633                                 sackdelay_change;
2634                 } else if (asoc) {
2635                         asoc->param_flags =
2636                                 (asoc->param_flags & ~SPP_SACKDELAY) |
2637                                 sackdelay_change;
2638                 } else {
2639                         sp->param_flags =
2640                                 (sp->param_flags & ~SPP_SACKDELAY) |
2641                                 sackdelay_change;
2642                 }
2643         }
2644
2645         /* Note that a value of zero indicates the current setting should be
2646            left unchanged.
2647          */
2648         if (params->spp_pathmaxrxt) {
2649                 if (trans) {
2650                         trans->pathmaxrxt = params->spp_pathmaxrxt;
2651                 } else if (asoc) {
2652                         asoc->pathmaxrxt = params->spp_pathmaxrxt;
2653                 } else {
2654                         sp->pathmaxrxt = params->spp_pathmaxrxt;
2655                 }
2656         }
2657
2658         if (params->spp_flags & SPP_IPV6_FLOWLABEL) {
2659                 if (trans) {
2660                         if (trans->ipaddr.sa.sa_family == AF_INET6) {
2661                                 trans->flowlabel = params->spp_ipv6_flowlabel &
2662                                                    SCTP_FLOWLABEL_VAL_MASK;
2663                                 trans->flowlabel |= SCTP_FLOWLABEL_SET_MASK;
2664                         }
2665                 } else if (asoc) {
2666                         struct sctp_transport *t;
2667
2668                         list_for_each_entry(t, &asoc->peer.transport_addr_list,
2669                                             transports) {
2670                                 if (t->ipaddr.sa.sa_family != AF_INET6)
2671                                         continue;
2672                                 t->flowlabel = params->spp_ipv6_flowlabel &
2673                                                SCTP_FLOWLABEL_VAL_MASK;
2674                                 t->flowlabel |= SCTP_FLOWLABEL_SET_MASK;
2675                         }
2676                         asoc->flowlabel = params->spp_ipv6_flowlabel &
2677                                           SCTP_FLOWLABEL_VAL_MASK;
2678                         asoc->flowlabel |= SCTP_FLOWLABEL_SET_MASK;
2679                 } else if (sctp_opt2sk(sp)->sk_family == AF_INET6) {
2680                         sp->flowlabel = params->spp_ipv6_flowlabel &
2681                                         SCTP_FLOWLABEL_VAL_MASK;
2682                         sp->flowlabel |= SCTP_FLOWLABEL_SET_MASK;
2683                 }
2684         }
2685
2686         if (params->spp_flags & SPP_DSCP) {
2687                 if (trans) {
2688                         trans->dscp = params->spp_dscp & SCTP_DSCP_VAL_MASK;
2689                         trans->dscp |= SCTP_DSCP_SET_MASK;
2690                 } else if (asoc) {
2691                         struct sctp_transport *t;
2692
2693                         list_for_each_entry(t, &asoc->peer.transport_addr_list,
2694                                             transports) {
2695                                 t->dscp = params->spp_dscp &
2696                                           SCTP_DSCP_VAL_MASK;
2697                                 t->dscp |= SCTP_DSCP_SET_MASK;
2698                         }
2699                         asoc->dscp = params->spp_dscp & SCTP_DSCP_VAL_MASK;
2700                         asoc->dscp |= SCTP_DSCP_SET_MASK;
2701                 } else {
2702                         sp->dscp = params->spp_dscp & SCTP_DSCP_VAL_MASK;
2703                         sp->dscp |= SCTP_DSCP_SET_MASK;
2704                 }
2705         }
2706
2707         return 0;
2708 }
2709
2710 static int sctp_setsockopt_peer_addr_params(struct sock *sk,
2711                                             char __user *optval,
2712                                             unsigned int optlen)
2713 {
2714         struct sctp_paddrparams  params;
2715         struct sctp_transport   *trans = NULL;
2716         struct sctp_association *asoc = NULL;
2717         struct sctp_sock        *sp = sctp_sk(sk);
2718         int error;
2719         int hb_change, pmtud_change, sackdelay_change;
2720
2721         if (optlen == sizeof(params)) {
2722                 if (copy_from_user(&params, optval, optlen))
2723                         return -EFAULT;
2724         } else if (optlen == ALIGN(offsetof(struct sctp_paddrparams,
2725                                             spp_ipv6_flowlabel), 4)) {
2726                 if (copy_from_user(&params, optval, optlen))
2727                         return -EFAULT;
2728                 if (params.spp_flags & (SPP_DSCP | SPP_IPV6_FLOWLABEL))
2729                         return -EINVAL;
2730         } else {
2731                 return -EINVAL;
2732         }
2733
2734         /* Validate flags and value parameters. */
2735         hb_change        = params.spp_flags & SPP_HB;
2736         pmtud_change     = params.spp_flags & SPP_PMTUD;
2737         sackdelay_change = params.spp_flags & SPP_SACKDELAY;
2738
2739         if (hb_change        == SPP_HB ||
2740             pmtud_change     == SPP_PMTUD ||
2741             sackdelay_change == SPP_SACKDELAY ||
2742             params.spp_sackdelay > 500 ||
2743             (params.spp_pathmtu &&
2744              params.spp_pathmtu < SCTP_DEFAULT_MINSEGMENT))
2745                 return -EINVAL;
2746
2747         /* If an address other than INADDR_ANY is specified, and
2748          * no transport is found, then the request is invalid.
2749          */
2750         if (!sctp_is_any(sk, (union sctp_addr *)&params.spp_address)) {
2751                 trans = sctp_addr_id2transport(sk, &params.spp_address,
2752                                                params.spp_assoc_id);
2753                 if (!trans)
2754                         return -EINVAL;
2755         }
2756
2757         /* Get association, if assoc_id != SCTP_FUTURE_ASSOC and the
2758          * socket is a one to many style socket, and an association
2759          * was not found, then the id was invalid.
2760          */
2761         asoc = sctp_id2assoc(sk, params.spp_assoc_id);
2762         if (!asoc && params.spp_assoc_id != SCTP_FUTURE_ASSOC &&
2763             sctp_style(sk, UDP))
2764                 return -EINVAL;
2765
2766         /* Heartbeat demand can only be sent on a transport or
2767          * association, but not a socket.
2768          */
2769         if (params.spp_flags & SPP_HB_DEMAND && !trans && !asoc)
2770                 return -EINVAL;
2771
2772         /* Process parameters. */
2773         error = sctp_apply_peer_addr_params(&params, trans, asoc, sp,
2774                                             hb_change, pmtud_change,
2775                                             sackdelay_change);
2776
2777         if (error)
2778                 return error;
2779
2780         /* If changes are for association, also apply parameters to each
2781          * transport.
2782          */
2783         if (!trans && asoc) {
2784                 list_for_each_entry(trans, &asoc->peer.transport_addr_list,
2785                                 transports) {
2786                         sctp_apply_peer_addr_params(&params, trans, asoc, sp,
2787                                                     hb_change, pmtud_change,
2788                                                     sackdelay_change);
2789                 }
2790         }
2791
2792         return 0;
2793 }
2794
2795 static inline __u32 sctp_spp_sackdelay_enable(__u32 param_flags)
2796 {
2797         return (param_flags & ~SPP_SACKDELAY) | SPP_SACKDELAY_ENABLE;
2798 }
2799
2800 static inline __u32 sctp_spp_sackdelay_disable(__u32 param_flags)
2801 {
2802         return (param_flags & ~SPP_SACKDELAY) | SPP_SACKDELAY_DISABLE;
2803 }
2804
2805 static void sctp_apply_asoc_delayed_ack(struct sctp_sack_info *params,
2806                                         struct sctp_association *asoc)
2807 {
2808         struct sctp_transport *trans;
2809
2810         if (params->sack_delay) {
2811                 asoc->sackdelay = msecs_to_jiffies(params->sack_delay);
2812                 asoc->param_flags =
2813                         sctp_spp_sackdelay_enable(asoc->param_flags);
2814         }
2815         if (params->sack_freq == 1) {
2816                 asoc->param_flags =
2817                         sctp_spp_sackdelay_disable(asoc->param_flags);
2818         } else if (params->sack_freq > 1) {
2819                 asoc->sackfreq = params->sack_freq;
2820                 asoc->param_flags =
2821                         sctp_spp_sackdelay_enable(asoc->param_flags);
2822         }
2823
2824         list_for_each_entry(trans, &asoc->peer.transport_addr_list,
2825                             transports) {
2826                 if (params->sack_delay) {
2827                         trans->sackdelay = msecs_to_jiffies(params->sack_delay);
2828                         trans->param_flags =
2829                                 sctp_spp_sackdelay_enable(trans->param_flags);
2830                 }
2831                 if (params->sack_freq == 1) {
2832                         trans->param_flags =
2833                                 sctp_spp_sackdelay_disable(trans->param_flags);
2834                 } else if (params->sack_freq > 1) {
2835                         trans->sackfreq = params->sack_freq;
2836                         trans->param_flags =
2837                                 sctp_spp_sackdelay_enable(trans->param_flags);
2838                 }
2839         }
2840 }
2841
2842 /*
2843  * 7.1.23.  Get or set delayed ack timer (SCTP_DELAYED_SACK)
2844  *
2845  * This option will effect the way delayed acks are performed.  This
2846  * option allows you to get or set the delayed ack time, in
2847  * milliseconds.  It also allows changing the delayed ack frequency.
2848  * Changing the frequency to 1 disables the delayed sack algorithm.  If
2849  * the assoc_id is 0, then this sets or gets the endpoints default
2850  * values.  If the assoc_id field is non-zero, then the set or get
2851  * effects the specified association for the one to many model (the
2852  * assoc_id field is ignored by the one to one model).  Note that if
2853  * sack_delay or sack_freq are 0 when setting this option, then the
2854  * current values will remain unchanged.
2855  *
2856  * struct sctp_sack_info {
2857  *     sctp_assoc_t            sack_assoc_id;
2858  *     uint32_t                sack_delay;
2859  *     uint32_t                sack_freq;
2860  * };
2861  *
2862  * sack_assoc_id -  This parameter, indicates which association the user
2863  *    is performing an action upon.  Note that if this field's value is
2864  *    zero then the endpoints default value is changed (effecting future
2865  *    associations only).
2866  *
2867  * sack_delay -  This parameter contains the number of milliseconds that
2868  *    the user is requesting the delayed ACK timer be set to.  Note that
2869  *    this value is defined in the standard to be between 200 and 500
2870  *    milliseconds.
2871  *
2872  * sack_freq -  This parameter contains the number of packets that must
2873  *    be received before a sack is sent without waiting for the delay
2874  *    timer to expire.  The default value for this is 2, setting this
2875  *    value to 1 will disable the delayed sack algorithm.
2876  */
2877
2878 static int sctp_setsockopt_delayed_ack(struct sock *sk,
2879                                        char __user *optval, unsigned int optlen)
2880 {
2881         struct sctp_sock *sp = sctp_sk(sk);
2882         struct sctp_association *asoc;
2883         struct sctp_sack_info params;
2884
2885         if (optlen == sizeof(struct sctp_sack_info)) {
2886                 if (copy_from_user(&params, optval, optlen))
2887                         return -EFAULT;
2888
2889                 if (params.sack_delay == 0 && params.sack_freq == 0)
2890                         return 0;
2891         } else if (optlen == sizeof(struct sctp_assoc_value)) {
2892                 pr_warn_ratelimited(DEPRECATED
2893                                     "%s (pid %d) "
2894                                     "Use of struct sctp_assoc_value in delayed_ack socket option.\n"
2895                                     "Use struct sctp_sack_info instead\n",
2896                                     current->comm, task_pid_nr(current));
2897                 if (copy_from_user(&params, optval, optlen))
2898                         return -EFAULT;
2899
2900                 if (params.sack_delay == 0)
2901                         params.sack_freq = 1;
2902                 else
2903                         params.sack_freq = 0;
2904         } else
2905                 return -EINVAL;
2906
2907         /* Validate value parameter. */
2908         if (params.sack_delay > 500)
2909                 return -EINVAL;
2910
2911         /* Get association, if sack_assoc_id != SCTP_FUTURE_ASSOC and the
2912          * socket is a one to many style socket, and an association
2913          * was not found, then the id was invalid.
2914          */
2915         asoc = sctp_id2assoc(sk, params.sack_assoc_id);
2916         if (!asoc && params.sack_assoc_id > SCTP_ALL_ASSOC &&
2917             sctp_style(sk, UDP))
2918                 return -EINVAL;
2919
2920         if (asoc) {
2921                 sctp_apply_asoc_delayed_ack(&params, asoc);
2922
2923                 return 0;
2924         }
2925
2926         if (sctp_style(sk, TCP))
2927                 params.sack_assoc_id = SCTP_FUTURE_ASSOC;
2928
2929         if (params.sack_assoc_id == SCTP_FUTURE_ASSOC ||
2930             params.sack_assoc_id == SCTP_ALL_ASSOC) {
2931                 if (params.sack_delay) {
2932                         sp->sackdelay = params.sack_delay;
2933                         sp->param_flags =
2934                                 sctp_spp_sackdelay_enable(sp->param_flags);
2935                 }
2936                 if (params.sack_freq == 1) {
2937                         sp->param_flags =
2938                                 sctp_spp_sackdelay_disable(sp->param_flags);
2939                 } else if (params.sack_freq > 1) {
2940                         sp->sackfreq = params.sack_freq;
2941                         sp->param_flags =
2942                                 sctp_spp_sackdelay_enable(sp->param_flags);
2943                 }
2944         }
2945
2946         if (params.sack_assoc_id == SCTP_CURRENT_ASSOC ||
2947             params.sack_assoc_id == SCTP_ALL_ASSOC)
2948                 list_for_each_entry(asoc, &sp->ep->asocs, asocs)
2949                         sctp_apply_asoc_delayed_ack(&params, asoc);
2950
2951         return 0;
2952 }
2953
2954 /* 7.1.3 Initialization Parameters (SCTP_INITMSG)
2955  *
2956  * Applications can specify protocol parameters for the default association
2957  * initialization.  The option name argument to setsockopt() and getsockopt()
2958  * is SCTP_INITMSG.
2959  *
2960  * Setting initialization parameters is effective only on an unconnected
2961  * socket (for UDP-style sockets only future associations are effected
2962  * by the change).  With TCP-style sockets, this option is inherited by
2963  * sockets derived from a listener socket.
2964  */
2965 static int sctp_setsockopt_initmsg(struct sock *sk, char __user *optval, unsigned int optlen)
2966 {
2967         struct sctp_initmsg sinit;
2968         struct sctp_sock *sp = sctp_sk(sk);
2969
2970         if (optlen != sizeof(struct sctp_initmsg))
2971                 return -EINVAL;
2972         if (copy_from_user(&sinit, optval, optlen))
2973                 return -EFAULT;
2974
2975         if (sinit.sinit_num_ostreams)
2976                 sp->initmsg.sinit_num_ostreams = sinit.sinit_num_ostreams;
2977         if (sinit.sinit_max_instreams)
2978                 sp->initmsg.sinit_max_instreams = sinit.sinit_max_instreams;
2979         if (sinit.sinit_max_attempts)
2980                 sp->initmsg.sinit_max_attempts = sinit.sinit_max_attempts;
2981         if (sinit.sinit_max_init_timeo)
2982                 sp->initmsg.sinit_max_init_timeo = sinit.sinit_max_init_timeo;
2983
2984         return 0;
2985 }
2986
2987 /*
2988  * 7.1.14 Set default send parameters (SCTP_DEFAULT_SEND_PARAM)
2989  *
2990  *   Applications that wish to use the sendto() system call may wish to
2991  *   specify a default set of parameters that would normally be supplied
2992  *   through the inclusion of ancillary data.  This socket option allows
2993  *   such an application to set the default sctp_sndrcvinfo structure.
2994  *   The application that wishes to use this socket option simply passes
2995  *   in to this call the sctp_sndrcvinfo structure defined in Section
2996  *   5.2.2) The input parameters accepted by this call include
2997  *   sinfo_stream, sinfo_flags, sinfo_ppid, sinfo_context,
2998  *   sinfo_timetolive.  The user must provide the sinfo_assoc_id field in
2999  *   to this call if the caller is using the UDP model.
3000  */
3001 static int sctp_setsockopt_default_send_param(struct sock *sk,
3002                                               char __user *optval,
3003                                               unsigned int optlen)
3004 {
3005         struct sctp_sock *sp = sctp_sk(sk);
3006         struct sctp_association *asoc;
3007         struct sctp_sndrcvinfo info;
3008
3009         if (optlen != sizeof(info))
3010                 return -EINVAL;
3011         if (copy_from_user(&info, optval, optlen))
3012                 return -EFAULT;
3013         if (info.sinfo_flags &
3014             ~(SCTP_UNORDERED | SCTP_ADDR_OVER |
3015               SCTP_ABORT | SCTP_EOF))
3016                 return -EINVAL;
3017
3018         asoc = sctp_id2assoc(sk, info.sinfo_assoc_id);
3019         if (!asoc && info.sinfo_assoc_id > SCTP_ALL_ASSOC &&
3020             sctp_style(sk, UDP))
3021                 return -EINVAL;
3022
3023         if (asoc) {
3024                 asoc->default_stream = info.sinfo_stream;
3025                 asoc->default_flags = info.sinfo_flags;
3026                 asoc->default_ppid = info.sinfo_ppid;
3027                 asoc->default_context = info.sinfo_context;
3028                 asoc->default_timetolive = info.sinfo_timetolive;
3029
3030                 return 0;
3031         }
3032
3033         if (sctp_style(sk, TCP))
3034                 info.sinfo_assoc_id = SCTP_FUTURE_ASSOC;
3035
3036         if (info.sinfo_assoc_id == SCTP_FUTURE_ASSOC ||
3037             info.sinfo_assoc_id == SCTP_ALL_ASSOC) {
3038                 sp->default_stream = info.sinfo_stream;
3039                 sp->default_flags = info.sinfo_flags;
3040                 sp->default_ppid = info.sinfo_ppid;
3041                 sp->default_context = info.sinfo_context;
3042                 sp->default_timetolive = info.sinfo_timetolive;
3043         }
3044
3045         if (info.sinfo_assoc_id == SCTP_CURRENT_ASSOC ||
3046             info.sinfo_assoc_id == SCTP_ALL_ASSOC) {
3047                 list_for_each_entry(asoc, &sp->ep->asocs, asocs) {
3048                         asoc->default_stream = info.sinfo_stream;
3049                         asoc->default_flags = info.sinfo_flags;
3050                         asoc->default_ppid = info.sinfo_ppid;
3051                         asoc->default_context = info.sinfo_context;
3052                         asoc->default_timetolive = info.sinfo_timetolive;
3053                 }
3054         }
3055
3056         return 0;
3057 }
3058
3059 /* RFC6458, Section 8.1.31. Set/get Default Send Parameters
3060  * (SCTP_DEFAULT_SNDINFO)
3061  */
3062 static int sctp_setsockopt_default_sndinfo(struct sock *sk,
3063                                            char __user *optval,
3064                                            unsigned int optlen)
3065 {
3066         struct sctp_sock *sp = sctp_sk(sk);
3067         struct sctp_association *asoc;
3068         struct sctp_sndinfo info;
3069
3070         if (optlen != sizeof(info))
3071                 return -EINVAL;
3072         if (copy_from_user(&info, optval, optlen))
3073                 return -EFAULT;
3074         if (info.snd_flags &
3075             ~(SCTP_UNORDERED | SCTP_ADDR_OVER |
3076               SCTP_ABORT | SCTP_EOF))
3077                 return -EINVAL;
3078
3079         asoc = sctp_id2assoc(sk, info.snd_assoc_id);
3080         if (!asoc && info.snd_assoc_id > SCTP_ALL_ASSOC &&
3081             sctp_style(sk, UDP))
3082                 return -EINVAL;
3083
3084         if (asoc) {
3085                 asoc->default_stream = info.snd_sid;
3086                 asoc->default_flags = info.snd_flags;
3087                 asoc->default_ppid = info.snd_ppid;
3088                 asoc->default_context = info.snd_context;
3089
3090                 return 0;
3091         }
3092
3093         if (sctp_style(sk, TCP))
3094                 info.snd_assoc_id = SCTP_FUTURE_ASSOC;
3095
3096         if (info.snd_assoc_id == SCTP_FUTURE_ASSOC ||
3097             info.snd_assoc_id == SCTP_ALL_ASSOC) {
3098                 sp->default_stream = info.snd_sid;
3099                 sp->default_flags = info.snd_flags;
3100                 sp->default_ppid = info.snd_ppid;
3101                 sp->default_context = info.snd_context;
3102         }
3103
3104         if (info.snd_assoc_id == SCTP_CURRENT_ASSOC ||
3105             info.snd_assoc_id == SCTP_ALL_ASSOC) {
3106                 list_for_each_entry(asoc, &sp->ep->asocs, asocs) {
3107                         asoc->default_stream = info.snd_sid;
3108                         asoc->default_flags = info.snd_flags;
3109                         asoc->default_ppid = info.snd_ppid;
3110                         asoc->default_context = info.snd_context;
3111                 }
3112         }
3113
3114         return 0;
3115 }
3116
3117 /* 7.1.10 Set Primary Address (SCTP_PRIMARY_ADDR)
3118  *
3119  * Requests that the local SCTP stack use the enclosed peer address as
3120  * the association primary.  The enclosed address must be one of the
3121  * association peer's addresses.
3122  */
3123 static int sctp_setsockopt_primary_addr(struct sock *sk, char __user *optval,
3124                                         unsigned int optlen)
3125 {
3126         struct sctp_prim prim;
3127         struct sctp_transport *trans;
3128         struct sctp_af *af;
3129         int err;
3130
3131         if (optlen != sizeof(struct sctp_prim))
3132                 return -EINVAL;
3133
3134         if (copy_from_user(&prim, optval, sizeof(struct sctp_prim)))
3135                 return -EFAULT;
3136
3137         /* Allow security module to validate address but need address len. */
3138         af = sctp_get_af_specific(prim.ssp_addr.ss_family);
3139         if (!af)
3140                 return -EINVAL;
3141
3142         err = security_sctp_bind_connect(sk, SCTP_PRIMARY_ADDR,
3143                                          (struct sockaddr *)&prim.ssp_addr,
3144                                          af->sockaddr_len);
3145         if (err)
3146                 return err;
3147
3148         trans = sctp_addr_id2transport(sk, &prim.ssp_addr, prim.ssp_assoc_id);
3149         if (!trans)
3150                 return -EINVAL;
3151
3152         sctp_assoc_set_primary(trans->asoc, trans);
3153
3154         return 0;
3155 }
3156
3157 /*
3158  * 7.1.5 SCTP_NODELAY
3159  *
3160  * Turn on/off any Nagle-like algorithm.  This means that packets are
3161  * generally sent as soon as possible and no unnecessary delays are
3162  * introduced, at the cost of more packets in the network.  Expects an
3163  *  integer boolean flag.
3164  */
3165 static int sctp_setsockopt_nodelay(struct sock *sk, char __user *optval,
3166                                    unsigned int optlen)
3167 {
3168         int val;
3169
3170         if (optlen < sizeof(int))
3171                 return -EINVAL;
3172         if (get_user(val, (int __user *)optval))
3173                 return -EFAULT;
3174
3175         sctp_sk(sk)->nodelay = (val == 0) ? 0 : 1;
3176         return 0;
3177 }
3178
3179 /*
3180  *
3181  * 7.1.1 SCTP_RTOINFO
3182  *
3183  * The protocol parameters used to initialize and bound retransmission
3184  * timeout (RTO) are tunable. sctp_rtoinfo structure is used to access
3185  * and modify these parameters.
3186  * All parameters are time values, in milliseconds.  A value of 0, when
3187  * modifying the parameters, indicates that the current value should not
3188  * be changed.
3189  *
3190  */
3191 static int sctp_setsockopt_rtoinfo(struct sock *sk, char __user *optval, unsigned int optlen)
3192 {
3193         struct sctp_rtoinfo rtoinfo;
3194         struct sctp_association *asoc;
3195         unsigned long rto_min, rto_max;
3196         struct sctp_sock *sp = sctp_sk(sk);
3197
3198         if (optlen != sizeof (struct sctp_rtoinfo))
3199                 return -EINVAL;
3200
3201         if (copy_from_user(&rtoinfo, optval, optlen))
3202                 return -EFAULT;
3203
3204         asoc = sctp_id2assoc(sk, rtoinfo.srto_assoc_id);
3205
3206         /* Set the values to the specific association */
3207         if (!asoc && rtoinfo.srto_assoc_id != SCTP_FUTURE_ASSOC &&
3208             sctp_style(sk, UDP))
3209                 return -EINVAL;
3210
3211         rto_max = rtoinfo.srto_max;
3212         rto_min = rtoinfo.srto_min;
3213
3214         if (rto_max)
3215                 rto_max = asoc ? msecs_to_jiffies(rto_max) : rto_max;
3216         else
3217                 rto_max = asoc ? asoc->rto_max : sp->rtoinfo.srto_max;
3218
3219         if (rto_min)
3220                 rto_min = asoc ? msecs_to_jiffies(rto_min) : rto_min;
3221         else
3222                 rto_min = asoc ? asoc->rto_min : sp->rtoinfo.srto_min;
3223
3224         if (rto_min > rto_max)
3225                 return -EINVAL;
3226
3227         if (asoc) {
3228                 if (rtoinfo.srto_initial != 0)
3229                         asoc->rto_initial =
3230                                 msecs_to_jiffies(rtoinfo.srto_initial);
3231                 asoc->rto_max = rto_max;
3232                 asoc->rto_min = rto_min;
3233         } else {
3234                 /* If there is no association or the association-id = 0
3235                  * set the values to the endpoint.
3236                  */
3237                 if (rtoinfo.srto_initial != 0)
3238                         sp->rtoinfo.srto_initial = rtoinfo.srto_initial;
3239                 sp->rtoinfo.srto_max = rto_max;
3240                 sp->rtoinfo.srto_min = rto_min;
3241         }
3242
3243         return 0;
3244 }
3245
3246 /*
3247  *
3248  * 7.1.2 SCTP_ASSOCINFO
3249  *
3250  * This option is used to tune the maximum retransmission attempts
3251  * of the association.
3252  * Returns an error if the new association retransmission value is
3253  * greater than the sum of the retransmission value  of the peer.
3254  * See [SCTP] for more information.
3255  *
3256  */
3257 static int sctp_setsockopt_associnfo(struct sock *sk, char __user *optval, unsigned int optlen)
3258 {
3259
3260         struct sctp_assocparams assocparams;
3261         struct sctp_association *asoc;
3262
3263         if (optlen != sizeof(struct sctp_assocparams))
3264                 return -EINVAL;
3265         if (copy_from_user(&assocparams, optval, optlen))
3266                 return -EFAULT;
3267
3268         asoc = sctp_id2assoc(sk, assocparams.sasoc_assoc_id);
3269
3270         if (!asoc && assocparams.sasoc_assoc_id != SCTP_FUTURE_ASSOC &&
3271             sctp_style(sk, UDP))
3272                 return -EINVAL;
3273
3274         /* Set the values to the specific association */
3275         if (asoc) {
3276                 if (assocparams.sasoc_asocmaxrxt != 0) {
3277                         __u32 path_sum = 0;
3278                         int   paths = 0;
3279                         struct sctp_transport *peer_addr;
3280
3281                         list_for_each_entry(peer_addr, &asoc->peer.transport_addr_list,
3282                                         transports) {
3283                                 path_sum += peer_addr->pathmaxrxt;
3284                                 paths++;
3285                         }
3286
3287                         /* Only validate asocmaxrxt if we have more than
3288                          * one path/transport.  We do this because path
3289                          * retransmissions are only counted when we have more
3290                          * then one path.
3291                          */
3292                         if (paths > 1 &&
3293                             assocparams.sasoc_asocmaxrxt > path_sum)
3294                                 return -EINVAL;
3295
3296                         asoc->max_retrans = assocparams.sasoc_asocmaxrxt;
3297                 }
3298
3299                 if (assocparams.sasoc_cookie_life != 0)
3300                         asoc->cookie_life = ms_to_ktime(assocparams.sasoc_cookie_life);
3301         } else {
3302                 /* Set the values to the endpoint */
3303                 struct sctp_sock *sp = sctp_sk(sk);
3304
3305                 if (assocparams.sasoc_asocmaxrxt != 0)
3306                         sp->assocparams.sasoc_asocmaxrxt =
3307                                                 assocparams.sasoc_asocmaxrxt;
3308                 if (assocparams.sasoc_cookie_life != 0)
3309                         sp->assocparams.sasoc_cookie_life =
3310                                                 assocparams.sasoc_cookie_life;
3311         }
3312         return 0;
3313 }
3314
3315 /*
3316  * 7.1.16 Set/clear IPv4 mapped addresses (SCTP_I_WANT_MAPPED_V4_ADDR)
3317  *
3318  * This socket option is a boolean flag which turns on or off mapped V4
3319  * addresses.  If this option is turned on and the socket is type
3320  * PF_INET6, then IPv4 addresses will be mapped to V6 representation.
3321  * If this option is turned off, then no mapping will be done of V4
3322  * addresses and a user will receive both PF_INET6 and PF_INET type
3323  * addresses on the socket.
3324  */
3325 static int sctp_setsockopt_mappedv4(struct sock *sk, char __user *optval, unsigned int optlen)
3326 {
3327         int val;
3328         struct sctp_sock *sp = sctp_sk(sk);
3329
3330         if (optlen < sizeof(int))
3331                 return -EINVAL;
3332         if (get_user(val, (int __user *)optval))
3333                 return -EFAULT;
3334         if (val)
3335                 sp->v4mapped = 1;
3336         else
3337                 sp->v4mapped = 0;
3338
3339         return 0;
3340 }
3341
3342 /*
3343  * 8.1.16.  Get or Set the Maximum Fragmentation Size (SCTP_MAXSEG)
3344  * This option will get or set the maximum size to put in any outgoing
3345  * SCTP DATA chunk.  If a message is larger than this size it will be
3346  * fragmented by SCTP into the specified size.  Note that the underlying
3347  * SCTP implementation may fragment into smaller sized chunks when the
3348  * PMTU of the underlying association is smaller than the value set by
3349  * the user.  The default value for this option is '0' which indicates
3350  * the user is NOT limiting fragmentation and only the PMTU will effect
3351  * SCTP's choice of DATA chunk size.  Note also that values set larger
3352  * than the maximum size of an IP datagram will effectively let SCTP
3353  * control fragmentation (i.e. the same as setting this option to 0).
3354  *
3355  * The following structure is used to access and modify this parameter:
3356  *
3357  * struct sctp_assoc_value {
3358  *   sctp_assoc_t assoc_id;
3359  *   uint32_t assoc_value;
3360  * };
3361  *
3362  * assoc_id:  This parameter is ignored for one-to-one style sockets.
3363  *    For one-to-many style sockets this parameter indicates which
3364  *    association the user is performing an action upon.  Note that if
3365  *    this field's value is zero then the endpoints default value is
3366  *    changed (effecting future associations only).
3367  * assoc_value:  This parameter specifies the maximum size in bytes.
3368  */
3369 static int sctp_setsockopt_maxseg(struct sock *sk, char __user *optval, unsigned int optlen)
3370 {
3371         struct sctp_sock *sp = sctp_sk(sk);
3372         struct sctp_assoc_value params;
3373         struct sctp_association *asoc;
3374         int val;
3375
3376         if (optlen == sizeof(int)) {
3377                 pr_warn_ratelimited(DEPRECATED
3378                                     "%s (pid %d) "
3379                                     "Use of int in maxseg socket option.\n"
3380                                     "Use struct sctp_assoc_value instead\n",
3381                                     current->comm, task_pid_nr(current));
3382                 if (copy_from_user(&val, optval, optlen))
3383                         return -EFAULT;
3384                 params.assoc_id = SCTP_FUTURE_ASSOC;
3385         } else if (optlen == sizeof(struct sctp_assoc_value)) {
3386                 if (copy_from_user(&params, optval, optlen))
3387                         return -EFAULT;
3388                 val = params.assoc_value;
3389         } else {
3390                 return -EINVAL;
3391         }
3392
3393         asoc = sctp_id2assoc(sk, params.assoc_id);
3394         if (!asoc && params.assoc_id != SCTP_FUTURE_ASSOC &&
3395             sctp_style(sk, UDP))
3396                 return -EINVAL;
3397
3398         if (val) {
3399                 int min_len, max_len;
3400                 __u16 datasize = asoc ? sctp_datachk_len(&asoc->stream) :
3401                                  sizeof(struct sctp_data_chunk);
3402
3403                 min_len = sctp_min_frag_point(sp, datasize);
3404                 max_len = SCTP_MAX_CHUNK_LEN - datasize;
3405
3406                 if (val < min_len || val > max_len)
3407                         return -EINVAL;
3408         }
3409
3410         if (asoc) {
3411                 asoc->user_frag = val;
3412                 sctp_assoc_update_frag_point(asoc);
3413         } else {
3414                 sp->user_frag = val;
3415         }
3416
3417         return 0;
3418 }
3419
3420
3421 /*
3422  *  7.1.9 Set Peer Primary Address (SCTP_SET_PEER_PRIMARY_ADDR)
3423  *
3424  *   Requests that the peer mark the enclosed address as the association
3425  *   primary. The enclosed address must be one of the association's
3426  *   locally bound addresses. The following structure is used to make a
3427  *   set primary request:
3428  */
3429 static int sctp_setsockopt_peer_primary_addr(struct sock *sk, char __user *optval,
3430                                              unsigned int optlen)
3431 {
3432         struct net *net = sock_net(sk);
3433         struct sctp_sock        *sp;
3434         struct sctp_association *asoc = NULL;
3435         struct sctp_setpeerprim prim;
3436         struct sctp_chunk       *chunk;
3437         struct sctp_af          *af;
3438         int                     err;
3439
3440         sp = sctp_sk(sk);
3441
3442         if (!net->sctp.addip_enable)
3443                 return -EPERM;
3444
3445         if (optlen != sizeof(struct sctp_setpeerprim))
3446                 return -EINVAL;
3447
3448         if (copy_from_user(&prim, optval, optlen))
3449                 return -EFAULT;
3450
3451         asoc = sctp_id2assoc(sk, prim.sspp_assoc_id);
3452         if (!asoc)
3453                 return -EINVAL;
3454
3455         if (!asoc->peer.asconf_capable)
3456                 return -EPERM;
3457
3458         if (asoc->peer.addip_disabled_mask & SCTP_PARAM_SET_PRIMARY)
3459                 return -EPERM;
3460
3461         if (!sctp_state(asoc, ESTABLISHED))
3462                 return -ENOTCONN;
3463
3464         af = sctp_get_af_specific(prim.sspp_addr.ss_family);
3465         if (!af)
3466                 return -EINVAL;
3467
3468         if (!af->addr_valid((union sctp_addr *)&prim.sspp_addr, sp, NULL))
3469                 return -EADDRNOTAVAIL;
3470
3471         if (!sctp_assoc_lookup_laddr(asoc, (union sctp_addr *)&prim.sspp_addr))
3472                 return -EADDRNOTAVAIL;
3473
3474         /* Allow security module to validate address. */
3475         err = security_sctp_bind_connect(sk, SCTP_SET_PEER_PRIMARY_ADDR,
3476                                          (struct sockaddr *)&prim.sspp_addr,
3477                                          af->sockaddr_len);
3478         if (err)
3479                 return err;
3480
3481         /* Create an ASCONF chunk with SET_PRIMARY parameter    */
3482         chunk = sctp_make_asconf_set_prim(asoc,
3483                                           (union sctp_addr *)&prim.sspp_addr);
3484         if (!chunk)
3485                 return -ENOMEM;
3486
3487         err = sctp_send_asconf(asoc, chunk);
3488
3489         pr_debug("%s: we set peer primary addr primitively\n", __func__);
3490
3491         return err;
3492 }
3493
3494 static int sctp_setsockopt_adaptation_layer(struct sock *sk, char __user *optval,
3495                                             unsigned int optlen)
3496 {
3497         struct sctp_setadaptation adaptation;
3498
3499         if (optlen != sizeof(struct sctp_setadaptation))
3500                 return -EINVAL;
3501         if (copy_from_user(&adaptation, optval, optlen))
3502                 return -EFAULT;
3503
3504         sctp_sk(sk)->adaptation_ind = adaptation.ssb_adaptation_ind;
3505
3506         return 0;
3507 }
3508
3509 /*
3510  * 7.1.29.  Set or Get the default context (SCTP_CONTEXT)
3511  *
3512  * The context field in the sctp_sndrcvinfo structure is normally only
3513  * used when a failed message is retrieved holding the value that was
3514  * sent down on the actual send call.  This option allows the setting of
3515  * a default context on an association basis that will be received on
3516  * reading messages from the peer.  This is especially helpful in the
3517  * one-2-many model for an application to keep some reference to an
3518  * internal state machine that is processing messages on the
3519  * association.  Note that the setting of this value only effects
3520  * received messages from the peer and does not effect the value that is
3521  * saved with outbound messages.
3522  */
3523 static int sctp_setsockopt_context(struct sock *sk, char __user *optval,
3524                                    unsigned int optlen)
3525 {
3526         struct sctp_sock *sp = sctp_sk(sk);
3527         struct sctp_assoc_value params;
3528         struct sctp_association *asoc;
3529
3530         if (optlen != sizeof(struct sctp_assoc_value))
3531                 return -EINVAL;
3532         if (copy_from_user(&params, optval, optlen))
3533                 return -EFAULT;
3534
3535         asoc = sctp_id2assoc(sk, params.assoc_id);
3536         if (!asoc && params.assoc_id > SCTP_ALL_ASSOC &&
3537             sctp_style(sk, UDP))
3538                 return -EINVAL;
3539
3540         if (asoc) {
3541                 asoc->default_rcv_context = params.assoc_value;
3542
3543                 return 0;
3544         }
3545
3546         if (sctp_style(sk, TCP))
3547                 params.assoc_id = SCTP_FUTURE_ASSOC;
3548
3549         if (params.assoc_id == SCTP_FUTURE_ASSOC ||
3550             params.assoc_id == SCTP_ALL_ASSOC)
3551                 sp->default_rcv_context = params.assoc_value;
3552
3553         if (params.assoc_id == SCTP_CURRENT_ASSOC ||
3554             params.assoc_id == SCTP_ALL_ASSOC)
3555                 list_for_each_entry(asoc, &sp->ep->asocs, asocs)
3556                         asoc->default_rcv_context = params.assoc_value;
3557
3558         return 0;
3559 }
3560
3561 /*
3562  * 7.1.24.  Get or set fragmented interleave (SCTP_FRAGMENT_INTERLEAVE)
3563  *
3564  * This options will at a minimum specify if the implementation is doing
3565  * fragmented interleave.  Fragmented interleave, for a one to many
3566  * socket, is when subsequent calls to receive a message may return
3567  * parts of messages from different associations.  Some implementations
3568  * may allow you to turn this value on or off.  If so, when turned off,
3569  * no fragment interleave will occur (which will cause a head of line
3570  * blocking amongst multiple associations sharing the same one to many
3571  * socket).  When this option is turned on, then each receive call may
3572  * come from a different association (thus the user must receive data
3573  * with the extended calls (e.g. sctp_recvmsg) to keep track of which
3574  * association each receive belongs to.
3575  *
3576  * This option takes a boolean value.  A non-zero value indicates that
3577  * fragmented interleave is on.  A value of zero indicates that
3578  * fragmented interleave is off.
3579  *
3580  * Note that it is important that an implementation that allows this
3581  * option to be turned on, have it off by default.  Otherwise an unaware
3582  * application using the one to many model may become confused and act
3583  * incorrectly.
3584  */
3585 static int sctp_setsockopt_fragment_interleave(struct sock *sk,
3586                                                char __user *optval,
3587                                                unsigned int optlen)
3588 {
3589         int val;
3590
3591         if (optlen != sizeof(int))
3592                 return -EINVAL;
3593         if (get_user(val, (int __user *)optval))
3594                 return -EFAULT;
3595
3596         sctp_sk(sk)->frag_interleave = !!val;
3597
3598         if (!sctp_sk(sk)->frag_interleave)
3599                 sctp_sk(sk)->strm_interleave = 0;
3600
3601         return 0;
3602 }
3603
3604 /*
3605  * 8.1.21.  Set or Get the SCTP Partial Delivery Point
3606  *       (SCTP_PARTIAL_DELIVERY_POINT)
3607  *
3608  * This option will set or get the SCTP partial delivery point.  This
3609  * point is the size of a message where the partial delivery API will be
3610  * invoked to help free up rwnd space for the peer.  Setting this to a
3611  * lower value will cause partial deliveries to happen more often.  The
3612  * calls argument is an integer that sets or gets the partial delivery
3613  * point.  Note also that the call will fail if the user attempts to set
3614  * this value larger than the socket receive buffer size.
3615  *
3616  * Note that any single message having a length smaller than or equal to
3617  * the SCTP partial delivery point will be delivered in one single read
3618  * call as long as the user provided buffer is large enough to hold the
3619  * message.
3620  */
3621 static int sctp_setsockopt_partial_delivery_point(struct sock *sk,
3622                                                   char __user *optval,
3623                                                   unsigned int optlen)
3624 {
3625         u32 val;
3626
3627         if (optlen != sizeof(u32))
3628                 return -EINVAL;
3629         if (get_user(val, (int __user *)optval))
3630                 return -EFAULT;
3631
3632         /* Note: We double the receive buffer from what the user sets
3633          * it to be, also initial rwnd