739f3e50120ddf61c508cc677b46e0239054131c
[sfrench/cifs-2.6.git] / net / sctp / socket.c
1 /* SCTP kernel implementation
2  * (C) Copyright IBM Corp. 2001, 2004
3  * Copyright (c) 1999-2000 Cisco, Inc.
4  * Copyright (c) 1999-2001 Motorola, Inc.
5  * Copyright (c) 2001-2003 Intel Corp.
6  * Copyright (c) 2001-2002 Nokia, Inc.
7  * Copyright (c) 2001 La Monte H.P. Yarroll
8  *
9  * This file is part of the SCTP kernel implementation
10  *
11  * These functions interface with the sockets layer to implement the
12  * SCTP Extensions for the Sockets API.
13  *
14  * Note that the descriptions from the specification are USER level
15  * functions--this file is the functions which populate the struct proto
16  * for SCTP which is the BOTTOM of the sockets interface.
17  *
18  * This SCTP implementation is free software;
19  * you can redistribute it and/or modify it under the terms of
20  * the GNU General Public License as published by
21  * the Free Software Foundation; either version 2, or (at your option)
22  * any later version.
23  *
24  * This SCTP implementation is distributed in the hope that it
25  * will be useful, but WITHOUT ANY WARRANTY; without even the implied
26  *                 ************************
27  * warranty of MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.
28  * See the GNU General Public License for more details.
29  *
30  * You should have received a copy of the GNU General Public License
31  * along with GNU CC; see the file COPYING.  If not, see
32  * <http://www.gnu.org/licenses/>.
33  *
34  * Please send any bug reports or fixes you make to the
35  * email address(es):
36  *    lksctp developers <linux-sctp@vger.kernel.org>
37  *
38  * Written or modified by:
39  *    La Monte H.P. Yarroll <piggy@acm.org>
40  *    Narasimha Budihal     <narsi@refcode.org>
41  *    Karl Knutson          <karl@athena.chicago.il.us>
42  *    Jon Grimm             <jgrimm@us.ibm.com>
43  *    Xingang Guo           <xingang.guo@intel.com>
44  *    Daisy Chang           <daisyc@us.ibm.com>
45  *    Sridhar Samudrala     <samudrala@us.ibm.com>
46  *    Inaky Perez-Gonzalez  <inaky.gonzalez@intel.com>
47  *    Ardelle Fan           <ardelle.fan@intel.com>
48  *    Ryan Layer            <rmlayer@us.ibm.com>
49  *    Anup Pemmaiah         <pemmaiah@cc.usu.edu>
50  *    Kevin Gao             <kevin.gao@intel.com>
51  */
52
53 #define pr_fmt(fmt) KBUILD_MODNAME ": " fmt
54
55 #include <crypto/hash.h>
56 #include <linux/types.h>
57 #include <linux/kernel.h>
58 #include <linux/wait.h>
59 #include <linux/time.h>
60 #include <linux/sched/signal.h>
61 #include <linux/ip.h>
62 #include <linux/capability.h>
63 #include <linux/fcntl.h>
64 #include <linux/poll.h>
65 #include <linux/init.h>
66 #include <linux/slab.h>
67 #include <linux/file.h>
68 #include <linux/compat.h>
69 #include <linux/rhashtable.h>
70
71 #include <net/ip.h>
72 #include <net/icmp.h>
73 #include <net/route.h>
74 #include <net/ipv6.h>
75 #include <net/inet_common.h>
76 #include <net/busy_poll.h>
77
78 #include <linux/socket.h> /* for sa_family_t */
79 #include <linux/export.h>
80 #include <net/sock.h>
81 #include <net/sctp/sctp.h>
82 #include <net/sctp/sm.h>
83 #include <net/sctp/stream_sched.h>
84
85 /* Forward declarations for internal helper functions. */
86 static bool sctp_writeable(struct sock *sk);
87 static void sctp_wfree(struct sk_buff *skb);
88 static int sctp_wait_for_sndbuf(struct sctp_association *asoc, long *timeo_p,
89                                 size_t msg_len);
90 static int sctp_wait_for_packet(struct sock *sk, int *err, long *timeo_p);
91 static int sctp_wait_for_connect(struct sctp_association *, long *timeo_p);
92 static int sctp_wait_for_accept(struct sock *sk, long timeo);
93 static void sctp_wait_for_close(struct sock *sk, long timeo);
94 static void sctp_destruct_sock(struct sock *sk);
95 static struct sctp_af *sctp_sockaddr_af(struct sctp_sock *opt,
96                                         union sctp_addr *addr, int len);
97 static int sctp_bindx_add(struct sock *, struct sockaddr *, int);
98 static int sctp_bindx_rem(struct sock *, struct sockaddr *, int);
99 static int sctp_send_asconf_add_ip(struct sock *, struct sockaddr *, int);
100 static int sctp_send_asconf_del_ip(struct sock *, struct sockaddr *, int);
101 static int sctp_send_asconf(struct sctp_association *asoc,
102                             struct sctp_chunk *chunk);
103 static int sctp_do_bind(struct sock *, union sctp_addr *, int);
104 static int sctp_autobind(struct sock *sk);
105 static void sctp_sock_migrate(struct sock *oldsk, struct sock *newsk,
106                               struct sctp_association *assoc,
107                               enum sctp_socket_type type);
108
109 static unsigned long sctp_memory_pressure;
110 static atomic_long_t sctp_memory_allocated;
111 struct percpu_counter sctp_sockets_allocated;
112
113 static void sctp_enter_memory_pressure(struct sock *sk)
114 {
115         sctp_memory_pressure = 1;
116 }
117
118
119 /* Get the sndbuf space available at the time on the association.  */
120 static inline int sctp_wspace(struct sctp_association *asoc)
121 {
122         struct sock *sk = asoc->base.sk;
123
124         return asoc->ep->sndbuf_policy ? sk->sk_sndbuf - asoc->sndbuf_used
125                                        : sk_stream_wspace(sk);
126 }
127
128 /* Increment the used sndbuf space count of the corresponding association by
129  * the size of the outgoing data chunk.
130  * Also, set the skb destructor for sndbuf accounting later.
131  *
132  * Since it is always 1-1 between chunk and skb, and also a new skb is always
133  * allocated for chunk bundling in sctp_packet_transmit(), we can use the
134  * destructor in the data chunk skb for the purpose of the sndbuf space
135  * tracking.
136  */
137 static inline void sctp_set_owner_w(struct sctp_chunk *chunk)
138 {
139         struct sctp_association *asoc = chunk->asoc;
140         struct sock *sk = asoc->base.sk;
141
142         /* The sndbuf space is tracked per association.  */
143         sctp_association_hold(asoc);
144
145         if (chunk->shkey)
146                 sctp_auth_shkey_hold(chunk->shkey);
147
148         skb_set_owner_w(chunk->skb, sk);
149
150         chunk->skb->destructor = sctp_wfree;
151         /* Save the chunk pointer in skb for sctp_wfree to use later.  */
152         skb_shinfo(chunk->skb)->destructor_arg = chunk;
153
154         refcount_add(sizeof(struct sctp_chunk), &sk->sk_wmem_alloc);
155         asoc->sndbuf_used += chunk->skb->truesize + sizeof(struct sctp_chunk);
156         sk->sk_wmem_queued += chunk->skb->truesize + sizeof(struct sctp_chunk);
157         sk_mem_charge(sk, chunk->skb->truesize);
158 }
159
160 static void sctp_clear_owner_w(struct sctp_chunk *chunk)
161 {
162         skb_orphan(chunk->skb);
163 }
164
165 static void sctp_for_each_tx_datachunk(struct sctp_association *asoc,
166                                        void (*cb)(struct sctp_chunk *))
167
168 {
169         struct sctp_outq *q = &asoc->outqueue;
170         struct sctp_transport *t;
171         struct sctp_chunk *chunk;
172
173         list_for_each_entry(t, &asoc->peer.transport_addr_list, transports)
174                 list_for_each_entry(chunk, &t->transmitted, transmitted_list)
175                         cb(chunk);
176
177         list_for_each_entry(chunk, &q->retransmit, transmitted_list)
178                 cb(chunk);
179
180         list_for_each_entry(chunk, &q->sacked, transmitted_list)
181                 cb(chunk);
182
183         list_for_each_entry(chunk, &q->abandoned, transmitted_list)
184                 cb(chunk);
185
186         list_for_each_entry(chunk, &q->out_chunk_list, list)
187                 cb(chunk);
188 }
189
190 static void sctp_for_each_rx_skb(struct sctp_association *asoc, struct sock *sk,
191                                  void (*cb)(struct sk_buff *, struct sock *))
192
193 {
194         struct sk_buff *skb, *tmp;
195
196         sctp_skb_for_each(skb, &asoc->ulpq.lobby, tmp)
197                 cb(skb, sk);
198
199         sctp_skb_for_each(skb, &asoc->ulpq.reasm, tmp)
200                 cb(skb, sk);
201
202         sctp_skb_for_each(skb, &asoc->ulpq.reasm_uo, tmp)
203                 cb(skb, sk);
204 }
205
206 /* Verify that this is a valid address. */
207 static inline int sctp_verify_addr(struct sock *sk, union sctp_addr *addr,
208                                    int len)
209 {
210         struct sctp_af *af;
211
212         /* Verify basic sockaddr. */
213         af = sctp_sockaddr_af(sctp_sk(sk), addr, len);
214         if (!af)
215                 return -EINVAL;
216
217         /* Is this a valid SCTP address?  */
218         if (!af->addr_valid(addr, sctp_sk(sk), NULL))
219                 return -EINVAL;
220
221         if (!sctp_sk(sk)->pf->send_verify(sctp_sk(sk), (addr)))
222                 return -EINVAL;
223
224         return 0;
225 }
226
227 /* Look up the association by its id.  If this is not a UDP-style
228  * socket, the ID field is always ignored.
229  */
230 struct sctp_association *sctp_id2assoc(struct sock *sk, sctp_assoc_t id)
231 {
232         struct sctp_association *asoc = NULL;
233
234         /* If this is not a UDP-style socket, assoc id should be ignored. */
235         if (!sctp_style(sk, UDP)) {
236                 /* Return NULL if the socket state is not ESTABLISHED. It
237                  * could be a TCP-style listening socket or a socket which
238                  * hasn't yet called connect() to establish an association.
239                  */
240                 if (!sctp_sstate(sk, ESTABLISHED) && !sctp_sstate(sk, CLOSING))
241                         return NULL;
242
243                 /* Get the first and the only association from the list. */
244                 if (!list_empty(&sctp_sk(sk)->ep->asocs))
245                         asoc = list_entry(sctp_sk(sk)->ep->asocs.next,
246                                           struct sctp_association, asocs);
247                 return asoc;
248         }
249
250         /* Otherwise this is a UDP-style socket. */
251         if (!id || (id == (sctp_assoc_t)-1))
252                 return NULL;
253
254         spin_lock_bh(&sctp_assocs_id_lock);
255         asoc = (struct sctp_association *)idr_find(&sctp_assocs_id, (int)id);
256         if (asoc && (asoc->base.sk != sk || asoc->base.dead))
257                 asoc = NULL;
258         spin_unlock_bh(&sctp_assocs_id_lock);
259
260         return asoc;
261 }
262
263 /* Look up the transport from an address and an assoc id. If both address and
264  * id are specified, the associations matching the address and the id should be
265  * the same.
266  */
267 static struct sctp_transport *sctp_addr_id2transport(struct sock *sk,
268                                               struct sockaddr_storage *addr,
269                                               sctp_assoc_t id)
270 {
271         struct sctp_association *addr_asoc = NULL, *id_asoc = NULL;
272         struct sctp_af *af = sctp_get_af_specific(addr->ss_family);
273         union sctp_addr *laddr = (union sctp_addr *)addr;
274         struct sctp_transport *transport;
275
276         if (!af || sctp_verify_addr(sk, laddr, af->sockaddr_len))
277                 return NULL;
278
279         addr_asoc = sctp_endpoint_lookup_assoc(sctp_sk(sk)->ep,
280                                                laddr,
281                                                &transport);
282
283         if (!addr_asoc)
284                 return NULL;
285
286         id_asoc = sctp_id2assoc(sk, id);
287         if (id_asoc && (id_asoc != addr_asoc))
288                 return NULL;
289
290         sctp_get_pf_specific(sk->sk_family)->addr_to_user(sctp_sk(sk),
291                                                 (union sctp_addr *)addr);
292
293         return transport;
294 }
295
296 /* API 3.1.2 bind() - UDP Style Syntax
297  * The syntax of bind() is,
298  *
299  *   ret = bind(int sd, struct sockaddr *addr, int addrlen);
300  *
301  *   sd      - the socket descriptor returned by socket().
302  *   addr    - the address structure (struct sockaddr_in or struct
303  *             sockaddr_in6 [RFC 2553]),
304  *   addr_len - the size of the address structure.
305  */
306 static int sctp_bind(struct sock *sk, struct sockaddr *addr, int addr_len)
307 {
308         int retval = 0;
309
310         lock_sock(sk);
311
312         pr_debug("%s: sk:%p, addr:%p, addr_len:%d\n", __func__, sk,
313                  addr, addr_len);
314
315         /* Disallow binding twice. */
316         if (!sctp_sk(sk)->ep->base.bind_addr.port)
317                 retval = sctp_do_bind(sk, (union sctp_addr *)addr,
318                                       addr_len);
319         else
320                 retval = -EINVAL;
321
322         release_sock(sk);
323
324         return retval;
325 }
326
327 static long sctp_get_port_local(struct sock *, union sctp_addr *);
328
329 /* Verify this is a valid sockaddr. */
330 static struct sctp_af *sctp_sockaddr_af(struct sctp_sock *opt,
331                                         union sctp_addr *addr, int len)
332 {
333         struct sctp_af *af;
334
335         /* Check minimum size.  */
336         if (len < sizeof (struct sockaddr))
337                 return NULL;
338
339         if (!opt->pf->af_supported(addr->sa.sa_family, opt))
340                 return NULL;
341
342         if (addr->sa.sa_family == AF_INET6) {
343                 if (len < SIN6_LEN_RFC2133)
344                         return NULL;
345                 /* V4 mapped address are really of AF_INET family */
346                 if (ipv6_addr_v4mapped(&addr->v6.sin6_addr) &&
347                     !opt->pf->af_supported(AF_INET, opt))
348                         return NULL;
349         }
350
351         /* If we get this far, af is valid. */
352         af = sctp_get_af_specific(addr->sa.sa_family);
353
354         if (len < af->sockaddr_len)
355                 return NULL;
356
357         return af;
358 }
359
360 /* Bind a local address either to an endpoint or to an association.  */
361 static int sctp_do_bind(struct sock *sk, union sctp_addr *addr, int len)
362 {
363         struct net *net = sock_net(sk);
364         struct sctp_sock *sp = sctp_sk(sk);
365         struct sctp_endpoint *ep = sp->ep;
366         struct sctp_bind_addr *bp = &ep->base.bind_addr;
367         struct sctp_af *af;
368         unsigned short snum;
369         int ret = 0;
370
371         /* Common sockaddr verification. */
372         af = sctp_sockaddr_af(sp, addr, len);
373         if (!af) {
374                 pr_debug("%s: sk:%p, newaddr:%p, len:%d EINVAL\n",
375                          __func__, sk, addr, len);
376                 return -EINVAL;
377         }
378
379         snum = ntohs(addr->v4.sin_port);
380
381         pr_debug("%s: sk:%p, new addr:%pISc, port:%d, new port:%d, len:%d\n",
382                  __func__, sk, &addr->sa, bp->port, snum, len);
383
384         /* PF specific bind() address verification. */
385         if (!sp->pf->bind_verify(sp, addr))
386                 return -EADDRNOTAVAIL;
387
388         /* We must either be unbound, or bind to the same port.
389          * It's OK to allow 0 ports if we are already bound.
390          * We'll just inhert an already bound port in this case
391          */
392         if (bp->port) {
393                 if (!snum)
394                         snum = bp->port;
395                 else if (snum != bp->port) {
396                         pr_debug("%s: new port %d doesn't match existing port "
397                                  "%d\n", __func__, snum, bp->port);
398                         return -EINVAL;
399                 }
400         }
401
402         if (snum && snum < inet_prot_sock(net) &&
403             !ns_capable(net->user_ns, CAP_NET_BIND_SERVICE))
404                 return -EACCES;
405
406         /* See if the address matches any of the addresses we may have
407          * already bound before checking against other endpoints.
408          */
409         if (sctp_bind_addr_match(bp, addr, sp))
410                 return -EINVAL;
411
412         /* Make sure we are allowed to bind here.
413          * The function sctp_get_port_local() does duplicate address
414          * detection.
415          */
416         addr->v4.sin_port = htons(snum);
417         if ((ret = sctp_get_port_local(sk, addr))) {
418                 return -EADDRINUSE;
419         }
420
421         /* Refresh ephemeral port.  */
422         if (!bp->port)
423                 bp->port = inet_sk(sk)->inet_num;
424
425         /* Add the address to the bind address list.
426          * Use GFP_ATOMIC since BHs will be disabled.
427          */
428         ret = sctp_add_bind_addr(bp, addr, af->sockaddr_len,
429                                  SCTP_ADDR_SRC, GFP_ATOMIC);
430
431         /* Copy back into socket for getsockname() use. */
432         if (!ret) {
433                 inet_sk(sk)->inet_sport = htons(inet_sk(sk)->inet_num);
434                 sp->pf->to_sk_saddr(addr, sk);
435         }
436
437         return ret;
438 }
439
440  /* ADDIP Section 4.1.1 Congestion Control of ASCONF Chunks
441  *
442  * R1) One and only one ASCONF Chunk MAY be in transit and unacknowledged
443  * at any one time.  If a sender, after sending an ASCONF chunk, decides
444  * it needs to transfer another ASCONF Chunk, it MUST wait until the
445  * ASCONF-ACK Chunk returns from the previous ASCONF Chunk before sending a
446  * subsequent ASCONF. Note this restriction binds each side, so at any
447  * time two ASCONF may be in-transit on any given association (one sent
448  * from each endpoint).
449  */
450 static int sctp_send_asconf(struct sctp_association *asoc,
451                             struct sctp_chunk *chunk)
452 {
453         struct net      *net = sock_net(asoc->base.sk);
454         int             retval = 0;
455
456         /* If there is an outstanding ASCONF chunk, queue it for later
457          * transmission.
458          */
459         if (asoc->addip_last_asconf) {
460                 list_add_tail(&chunk->list, &asoc->addip_chunk_list);
461                 goto out;
462         }
463
464         /* Hold the chunk until an ASCONF_ACK is received. */
465         sctp_chunk_hold(chunk);
466         retval = sctp_primitive_ASCONF(net, asoc, chunk);
467         if (retval)
468                 sctp_chunk_free(chunk);
469         else
470                 asoc->addip_last_asconf = chunk;
471
472 out:
473         return retval;
474 }
475
476 /* Add a list of addresses as bind addresses to local endpoint or
477  * association.
478  *
479  * Basically run through each address specified in the addrs/addrcnt
480  * array/length pair, determine if it is IPv6 or IPv4 and call
481  * sctp_do_bind() on it.
482  *
483  * If any of them fails, then the operation will be reversed and the
484  * ones that were added will be removed.
485  *
486  * Only sctp_setsockopt_bindx() is supposed to call this function.
487  */
488 static int sctp_bindx_add(struct sock *sk, struct sockaddr *addrs, int addrcnt)
489 {
490         int cnt;
491         int retval = 0;
492         void *addr_buf;
493         struct sockaddr *sa_addr;
494         struct sctp_af *af;
495
496         pr_debug("%s: sk:%p, addrs:%p, addrcnt:%d\n", __func__, sk,
497                  addrs, addrcnt);
498
499         addr_buf = addrs;
500         for (cnt = 0; cnt < addrcnt; cnt++) {
501                 /* The list may contain either IPv4 or IPv6 address;
502                  * determine the address length for walking thru the list.
503                  */
504                 sa_addr = addr_buf;
505                 af = sctp_get_af_specific(sa_addr->sa_family);
506                 if (!af) {
507                         retval = -EINVAL;
508                         goto err_bindx_add;
509                 }
510
511                 retval = sctp_do_bind(sk, (union sctp_addr *)sa_addr,
512                                       af->sockaddr_len);
513
514                 addr_buf += af->sockaddr_len;
515
516 err_bindx_add:
517                 if (retval < 0) {
518                         /* Failed. Cleanup the ones that have been added */
519                         if (cnt > 0)
520                                 sctp_bindx_rem(sk, addrs, cnt);
521                         return retval;
522                 }
523         }
524
525         return retval;
526 }
527
528 /* Send an ASCONF chunk with Add IP address parameters to all the peers of the
529  * associations that are part of the endpoint indicating that a list of local
530  * addresses are added to the endpoint.
531  *
532  * If any of the addresses is already in the bind address list of the
533  * association, we do not send the chunk for that association.  But it will not
534  * affect other associations.
535  *
536  * Only sctp_setsockopt_bindx() is supposed to call this function.
537  */
538 static int sctp_send_asconf_add_ip(struct sock          *sk,
539                                    struct sockaddr      *addrs,
540                                    int                  addrcnt)
541 {
542         struct net *net = sock_net(sk);
543         struct sctp_sock                *sp;
544         struct sctp_endpoint            *ep;
545         struct sctp_association         *asoc;
546         struct sctp_bind_addr           *bp;
547         struct sctp_chunk               *chunk;
548         struct sctp_sockaddr_entry      *laddr;
549         union sctp_addr                 *addr;
550         union sctp_addr                 saveaddr;
551         void                            *addr_buf;
552         struct sctp_af                  *af;
553         struct list_head                *p;
554         int                             i;
555         int                             retval = 0;
556
557         if (!net->sctp.addip_enable)
558                 return retval;
559
560         sp = sctp_sk(sk);
561         ep = sp->ep;
562
563         pr_debug("%s: sk:%p, addrs:%p, addrcnt:%d\n",
564                  __func__, sk, addrs, addrcnt);
565
566         list_for_each_entry(asoc, &ep->asocs, asocs) {
567                 if (!asoc->peer.asconf_capable)
568                         continue;
569
570                 if (asoc->peer.addip_disabled_mask & SCTP_PARAM_ADD_IP)
571                         continue;
572
573                 if (!sctp_state(asoc, ESTABLISHED))
574                         continue;
575
576                 /* Check if any address in the packed array of addresses is
577                  * in the bind address list of the association. If so,
578                  * do not send the asconf chunk to its peer, but continue with
579                  * other associations.
580                  */
581                 addr_buf = addrs;
582                 for (i = 0; i < addrcnt; i++) {
583                         addr = addr_buf;
584                         af = sctp_get_af_specific(addr->v4.sin_family);
585                         if (!af) {
586                                 retval = -EINVAL;
587                                 goto out;
588                         }
589
590                         if (sctp_assoc_lookup_laddr(asoc, addr))
591                                 break;
592
593                         addr_buf += af->sockaddr_len;
594                 }
595                 if (i < addrcnt)
596                         continue;
597
598                 /* Use the first valid address in bind addr list of
599                  * association as Address Parameter of ASCONF CHUNK.
600                  */
601                 bp = &asoc->base.bind_addr;
602                 p = bp->address_list.next;
603                 laddr = list_entry(p, struct sctp_sockaddr_entry, list);
604                 chunk = sctp_make_asconf_update_ip(asoc, &laddr->a, addrs,
605                                                    addrcnt, SCTP_PARAM_ADD_IP);
606                 if (!chunk) {
607                         retval = -ENOMEM;
608                         goto out;
609                 }
610
611                 /* Add the new addresses to the bind address list with
612                  * use_as_src set to 0.
613                  */
614                 addr_buf = addrs;
615                 for (i = 0; i < addrcnt; i++) {
616                         addr = addr_buf;
617                         af = sctp_get_af_specific(addr->v4.sin_family);
618                         memcpy(&saveaddr, addr, af->sockaddr_len);
619                         retval = sctp_add_bind_addr(bp, &saveaddr,
620                                                     sizeof(saveaddr),
621                                                     SCTP_ADDR_NEW, GFP_ATOMIC);
622                         addr_buf += af->sockaddr_len;
623                 }
624                 if (asoc->src_out_of_asoc_ok) {
625                         struct sctp_transport *trans;
626
627                         list_for_each_entry(trans,
628                             &asoc->peer.transport_addr_list, transports) {
629                                 trans->cwnd = min(4*asoc->pathmtu, max_t(__u32,
630                                     2*asoc->pathmtu, 4380));
631                                 trans->ssthresh = asoc->peer.i.a_rwnd;
632                                 trans->rto = asoc->rto_initial;
633                                 sctp_max_rto(asoc, trans);
634                                 trans->rtt = trans->srtt = trans->rttvar = 0;
635                                 /* Clear the source and route cache */
636                                 sctp_transport_route(trans, NULL,
637                                                      sctp_sk(asoc->base.sk));
638                         }
639                 }
640                 retval = sctp_send_asconf(asoc, chunk);
641         }
642
643 out:
644         return retval;
645 }
646
647 /* Remove a list of addresses from bind addresses list.  Do not remove the
648  * last address.
649  *
650  * Basically run through each address specified in the addrs/addrcnt
651  * array/length pair, determine if it is IPv6 or IPv4 and call
652  * sctp_del_bind() on it.
653  *
654  * If any of them fails, then the operation will be reversed and the
655  * ones that were removed will be added back.
656  *
657  * At least one address has to be left; if only one address is
658  * available, the operation will return -EBUSY.
659  *
660  * Only sctp_setsockopt_bindx() is supposed to call this function.
661  */
662 static int sctp_bindx_rem(struct sock *sk, struct sockaddr *addrs, int addrcnt)
663 {
664         struct sctp_sock *sp = sctp_sk(sk);
665         struct sctp_endpoint *ep = sp->ep;
666         int cnt;
667         struct sctp_bind_addr *bp = &ep->base.bind_addr;
668         int retval = 0;
669         void *addr_buf;
670         union sctp_addr *sa_addr;
671         struct sctp_af *af;
672
673         pr_debug("%s: sk:%p, addrs:%p, addrcnt:%d\n",
674                  __func__, sk, addrs, addrcnt);
675
676         addr_buf = addrs;
677         for (cnt = 0; cnt < addrcnt; cnt++) {
678                 /* If the bind address list is empty or if there is only one
679                  * bind address, there is nothing more to be removed (we need
680                  * at least one address here).
681                  */
682                 if (list_empty(&bp->address_list) ||
683                     (sctp_list_single_entry(&bp->address_list))) {
684                         retval = -EBUSY;
685                         goto err_bindx_rem;
686                 }
687
688                 sa_addr = addr_buf;
689                 af = sctp_get_af_specific(sa_addr->sa.sa_family);
690                 if (!af) {
691                         retval = -EINVAL;
692                         goto err_bindx_rem;
693                 }
694
695                 if (!af->addr_valid(sa_addr, sp, NULL)) {
696                         retval = -EADDRNOTAVAIL;
697                         goto err_bindx_rem;
698                 }
699
700                 if (sa_addr->v4.sin_port &&
701                     sa_addr->v4.sin_port != htons(bp->port)) {
702                         retval = -EINVAL;
703                         goto err_bindx_rem;
704                 }
705
706                 if (!sa_addr->v4.sin_port)
707                         sa_addr->v4.sin_port = htons(bp->port);
708
709                 /* FIXME - There is probably a need to check if sk->sk_saddr and
710                  * sk->sk_rcv_addr are currently set to one of the addresses to
711                  * be removed. This is something which needs to be looked into
712                  * when we are fixing the outstanding issues with multi-homing
713                  * socket routing and failover schemes. Refer to comments in
714                  * sctp_do_bind(). -daisy
715                  */
716                 retval = sctp_del_bind_addr(bp, sa_addr);
717
718                 addr_buf += af->sockaddr_len;
719 err_bindx_rem:
720                 if (retval < 0) {
721                         /* Failed. Add the ones that has been removed back */
722                         if (cnt > 0)
723                                 sctp_bindx_add(sk, addrs, cnt);
724                         return retval;
725                 }
726         }
727
728         return retval;
729 }
730
731 /* Send an ASCONF chunk with Delete IP address parameters to all the peers of
732  * the associations that are part of the endpoint indicating that a list of
733  * local addresses are removed from the endpoint.
734  *
735  * If any of the addresses is already in the bind address list of the
736  * association, we do not send the chunk for that association.  But it will not
737  * affect other associations.
738  *
739  * Only sctp_setsockopt_bindx() is supposed to call this function.
740  */
741 static int sctp_send_asconf_del_ip(struct sock          *sk,
742                                    struct sockaddr      *addrs,
743                                    int                  addrcnt)
744 {
745         struct net *net = sock_net(sk);
746         struct sctp_sock        *sp;
747         struct sctp_endpoint    *ep;
748         struct sctp_association *asoc;
749         struct sctp_transport   *transport;
750         struct sctp_bind_addr   *bp;
751         struct sctp_chunk       *chunk;
752         union sctp_addr         *laddr;
753         void                    *addr_buf;
754         struct sctp_af          *af;
755         struct sctp_sockaddr_entry *saddr;
756         int                     i;
757         int                     retval = 0;
758         int                     stored = 0;
759
760         chunk = NULL;
761         if (!net->sctp.addip_enable)
762                 return retval;
763
764         sp = sctp_sk(sk);
765         ep = sp->ep;
766
767         pr_debug("%s: sk:%p, addrs:%p, addrcnt:%d\n",
768                  __func__, sk, addrs, addrcnt);
769
770         list_for_each_entry(asoc, &ep->asocs, asocs) {
771
772                 if (!asoc->peer.asconf_capable)
773                         continue;
774
775                 if (asoc->peer.addip_disabled_mask & SCTP_PARAM_DEL_IP)
776                         continue;
777
778                 if (!sctp_state(asoc, ESTABLISHED))
779                         continue;
780
781                 /* Check if any address in the packed array of addresses is
782                  * not present in the bind address list of the association.
783                  * If so, do not send the asconf chunk to its peer, but
784                  * continue with other associations.
785                  */
786                 addr_buf = addrs;
787                 for (i = 0; i < addrcnt; i++) {
788                         laddr = addr_buf;
789                         af = sctp_get_af_specific(laddr->v4.sin_family);
790                         if (!af) {
791                                 retval = -EINVAL;
792                                 goto out;
793                         }
794
795                         if (!sctp_assoc_lookup_laddr(asoc, laddr))
796                                 break;
797
798                         addr_buf += af->sockaddr_len;
799                 }
800                 if (i < addrcnt)
801                         continue;
802
803                 /* Find one address in the association's bind address list
804                  * that is not in the packed array of addresses. This is to
805                  * make sure that we do not delete all the addresses in the
806                  * association.
807                  */
808                 bp = &asoc->base.bind_addr;
809                 laddr = sctp_find_unmatch_addr(bp, (union sctp_addr *)addrs,
810                                                addrcnt, sp);
811                 if ((laddr == NULL) && (addrcnt == 1)) {
812                         if (asoc->asconf_addr_del_pending)
813                                 continue;
814                         asoc->asconf_addr_del_pending =
815                             kzalloc(sizeof(union sctp_addr), GFP_ATOMIC);
816                         if (asoc->asconf_addr_del_pending == NULL) {
817                                 retval = -ENOMEM;
818                                 goto out;
819                         }
820                         asoc->asconf_addr_del_pending->sa.sa_family =
821                                     addrs->sa_family;
822                         asoc->asconf_addr_del_pending->v4.sin_port =
823                                     htons(bp->port);
824                         if (addrs->sa_family == AF_INET) {
825                                 struct sockaddr_in *sin;
826
827                                 sin = (struct sockaddr_in *)addrs;
828                                 asoc->asconf_addr_del_pending->v4.sin_addr.s_addr = sin->sin_addr.s_addr;
829                         } else if (addrs->sa_family == AF_INET6) {
830                                 struct sockaddr_in6 *sin6;
831
832                                 sin6 = (struct sockaddr_in6 *)addrs;
833                                 asoc->asconf_addr_del_pending->v6.sin6_addr = sin6->sin6_addr;
834                         }
835
836                         pr_debug("%s: keep the last address asoc:%p %pISc at %p\n",
837                                  __func__, asoc, &asoc->asconf_addr_del_pending->sa,
838                                  asoc->asconf_addr_del_pending);
839
840                         asoc->src_out_of_asoc_ok = 1;
841                         stored = 1;
842                         goto skip_mkasconf;
843                 }
844
845                 if (laddr == NULL)
846                         return -EINVAL;
847
848                 /* We do not need RCU protection throughout this loop
849                  * because this is done under a socket lock from the
850                  * setsockopt call.
851                  */
852                 chunk = sctp_make_asconf_update_ip(asoc, laddr, addrs, addrcnt,
853                                                    SCTP_PARAM_DEL_IP);
854                 if (!chunk) {
855                         retval = -ENOMEM;
856                         goto out;
857                 }
858
859 skip_mkasconf:
860                 /* Reset use_as_src flag for the addresses in the bind address
861                  * list that are to be deleted.
862                  */
863                 addr_buf = addrs;
864                 for (i = 0; i < addrcnt; i++) {
865                         laddr = addr_buf;
866                         af = sctp_get_af_specific(laddr->v4.sin_family);
867                         list_for_each_entry(saddr, &bp->address_list, list) {
868                                 if (sctp_cmp_addr_exact(&saddr->a, laddr))
869                                         saddr->state = SCTP_ADDR_DEL;
870                         }
871                         addr_buf += af->sockaddr_len;
872                 }
873
874                 /* Update the route and saddr entries for all the transports
875                  * as some of the addresses in the bind address list are
876                  * about to be deleted and cannot be used as source addresses.
877                  */
878                 list_for_each_entry(transport, &asoc->peer.transport_addr_list,
879                                         transports) {
880                         sctp_transport_route(transport, NULL,
881                                              sctp_sk(asoc->base.sk));
882                 }
883
884                 if (stored)
885                         /* We don't need to transmit ASCONF */
886                         continue;
887                 retval = sctp_send_asconf(asoc, chunk);
888         }
889 out:
890         return retval;
891 }
892
893 /* set addr events to assocs in the endpoint.  ep and addr_wq must be locked */
894 int sctp_asconf_mgmt(struct sctp_sock *sp, struct sctp_sockaddr_entry *addrw)
895 {
896         struct sock *sk = sctp_opt2sk(sp);
897         union sctp_addr *addr;
898         struct sctp_af *af;
899
900         /* It is safe to write port space in caller. */
901         addr = &addrw->a;
902         addr->v4.sin_port = htons(sp->ep->base.bind_addr.port);
903         af = sctp_get_af_specific(addr->sa.sa_family);
904         if (!af)
905                 return -EINVAL;
906         if (sctp_verify_addr(sk, addr, af->sockaddr_len))
907                 return -EINVAL;
908
909         if (addrw->state == SCTP_ADDR_NEW)
910                 return sctp_send_asconf_add_ip(sk, (struct sockaddr *)addr, 1);
911         else
912                 return sctp_send_asconf_del_ip(sk, (struct sockaddr *)addr, 1);
913 }
914
915 /* Helper for tunneling sctp_bindx() requests through sctp_setsockopt()
916  *
917  * API 8.1
918  * int sctp_bindx(int sd, struct sockaddr *addrs, int addrcnt,
919  *                int flags);
920  *
921  * If sd is an IPv4 socket, the addresses passed must be IPv4 addresses.
922  * If the sd is an IPv6 socket, the addresses passed can either be IPv4
923  * or IPv6 addresses.
924  *
925  * A single address may be specified as INADDR_ANY or IN6ADDR_ANY, see
926  * Section 3.1.2 for this usage.
927  *
928  * addrs is a pointer to an array of one or more socket addresses. Each
929  * address is contained in its appropriate structure (i.e. struct
930  * sockaddr_in or struct sockaddr_in6) the family of the address type
931  * must be used to distinguish the address length (note that this
932  * representation is termed a "packed array" of addresses). The caller
933  * specifies the number of addresses in the array with addrcnt.
934  *
935  * On success, sctp_bindx() returns 0. On failure, sctp_bindx() returns
936  * -1, and sets errno to the appropriate error code.
937  *
938  * For SCTP, the port given in each socket address must be the same, or
939  * sctp_bindx() will fail, setting errno to EINVAL.
940  *
941  * The flags parameter is formed from the bitwise OR of zero or more of
942  * the following currently defined flags:
943  *
944  * SCTP_BINDX_ADD_ADDR
945  *
946  * SCTP_BINDX_REM_ADDR
947  *
948  * SCTP_BINDX_ADD_ADDR directs SCTP to add the given addresses to the
949  * association, and SCTP_BINDX_REM_ADDR directs SCTP to remove the given
950  * addresses from the association. The two flags are mutually exclusive;
951  * if both are given, sctp_bindx() will fail with EINVAL. A caller may
952  * not remove all addresses from an association; sctp_bindx() will
953  * reject such an attempt with EINVAL.
954  *
955  * An application can use sctp_bindx(SCTP_BINDX_ADD_ADDR) to associate
956  * additional addresses with an endpoint after calling bind().  Or use
957  * sctp_bindx(SCTP_BINDX_REM_ADDR) to remove some addresses a listening
958  * socket is associated with so that no new association accepted will be
959  * associated with those addresses. If the endpoint supports dynamic
960  * address a SCTP_BINDX_REM_ADDR or SCTP_BINDX_ADD_ADDR may cause a
961  * endpoint to send the appropriate message to the peer to change the
962  * peers address lists.
963  *
964  * Adding and removing addresses from a connected association is
965  * optional functionality. Implementations that do not support this
966  * functionality should return EOPNOTSUPP.
967  *
968  * Basically do nothing but copying the addresses from user to kernel
969  * land and invoking either sctp_bindx_add() or sctp_bindx_rem() on the sk.
970  * This is used for tunneling the sctp_bindx() request through sctp_setsockopt()
971  * from userspace.
972  *
973  * On exit there is no need to do sockfd_put(), sys_setsockopt() does
974  * it.
975  *
976  * sk        The sk of the socket
977  * addrs     The pointer to the addresses in user land
978  * addrssize Size of the addrs buffer
979  * op        Operation to perform (add or remove, see the flags of
980  *           sctp_bindx)
981  *
982  * Returns 0 if ok, <0 errno code on error.
983  */
984 static int sctp_setsockopt_bindx(struct sock *sk,
985                                  struct sockaddr __user *addrs,
986                                  int addrs_size, int op)
987 {
988         struct sockaddr *kaddrs;
989         int err;
990         int addrcnt = 0;
991         int walk_size = 0;
992         struct sockaddr *sa_addr;
993         void *addr_buf;
994         struct sctp_af *af;
995
996         pr_debug("%s: sk:%p addrs:%p addrs_size:%d opt:%d\n",
997                  __func__, sk, addrs, addrs_size, op);
998
999         if (unlikely(addrs_size <= 0))
1000                 return -EINVAL;
1001
1002         kaddrs = vmemdup_user(addrs, addrs_size);
1003         if (unlikely(IS_ERR(kaddrs)))
1004                 return PTR_ERR(kaddrs);
1005
1006         /* Walk through the addrs buffer and count the number of addresses. */
1007         addr_buf = kaddrs;
1008         while (walk_size < addrs_size) {
1009                 if (walk_size + sizeof(sa_family_t) > addrs_size) {
1010                         kvfree(kaddrs);
1011                         return -EINVAL;
1012                 }
1013
1014                 sa_addr = addr_buf;
1015                 af = sctp_get_af_specific(sa_addr->sa_family);
1016
1017                 /* If the address family is not supported or if this address
1018                  * causes the address buffer to overflow return EINVAL.
1019                  */
1020                 if (!af || (walk_size + af->sockaddr_len) > addrs_size) {
1021                         kvfree(kaddrs);
1022                         return -EINVAL;
1023                 }
1024                 addrcnt++;
1025                 addr_buf += af->sockaddr_len;
1026                 walk_size += af->sockaddr_len;
1027         }
1028
1029         /* Do the work. */
1030         switch (op) {
1031         case SCTP_BINDX_ADD_ADDR:
1032                 /* Allow security module to validate bindx addresses. */
1033                 err = security_sctp_bind_connect(sk, SCTP_SOCKOPT_BINDX_ADD,
1034                                                  (struct sockaddr *)kaddrs,
1035                                                  addrs_size);
1036                 if (err)
1037                         goto out;
1038                 err = sctp_bindx_add(sk, kaddrs, addrcnt);
1039                 if (err)
1040                         goto out;
1041                 err = sctp_send_asconf_add_ip(sk, kaddrs, addrcnt);
1042                 break;
1043
1044         case SCTP_BINDX_REM_ADDR:
1045                 err = sctp_bindx_rem(sk, kaddrs, addrcnt);
1046                 if (err)
1047                         goto out;
1048                 err = sctp_send_asconf_del_ip(sk, kaddrs, addrcnt);
1049                 break;
1050
1051         default:
1052                 err = -EINVAL;
1053                 break;
1054         }
1055
1056 out:
1057         kvfree(kaddrs);
1058
1059         return err;
1060 }
1061
1062 /* __sctp_connect(struct sock* sk, struct sockaddr *kaddrs, int addrs_size)
1063  *
1064  * Common routine for handling connect() and sctp_connectx().
1065  * Connect will come in with just a single address.
1066  */
1067 static int __sctp_connect(struct sock *sk,
1068                           struct sockaddr *kaddrs,
1069                           int addrs_size, int flags,
1070                           sctp_assoc_t *assoc_id)
1071 {
1072         struct net *net = sock_net(sk);
1073         struct sctp_sock *sp;
1074         struct sctp_endpoint *ep;
1075         struct sctp_association *asoc = NULL;
1076         struct sctp_association *asoc2;
1077         struct sctp_transport *transport;
1078         union sctp_addr to;
1079         enum sctp_scope scope;
1080         long timeo;
1081         int err = 0;
1082         int addrcnt = 0;
1083         int walk_size = 0;
1084         union sctp_addr *sa_addr = NULL;
1085         void *addr_buf;
1086         unsigned short port;
1087
1088         sp = sctp_sk(sk);
1089         ep = sp->ep;
1090
1091         /* connect() cannot be done on a socket that is already in ESTABLISHED
1092          * state - UDP-style peeled off socket or a TCP-style socket that
1093          * is already connected.
1094          * It cannot be done even on a TCP-style listening socket.
1095          */
1096         if (sctp_sstate(sk, ESTABLISHED) || sctp_sstate(sk, CLOSING) ||
1097             (sctp_style(sk, TCP) && sctp_sstate(sk, LISTENING))) {
1098                 err = -EISCONN;
1099                 goto out_free;
1100         }
1101
1102         /* Walk through the addrs buffer and count the number of addresses. */
1103         addr_buf = kaddrs;
1104         while (walk_size < addrs_size) {
1105                 struct sctp_af *af;
1106
1107                 if (walk_size + sizeof(sa_family_t) > addrs_size) {
1108                         err = -EINVAL;
1109                         goto out_free;
1110                 }
1111
1112                 sa_addr = addr_buf;
1113                 af = sctp_get_af_specific(sa_addr->sa.sa_family);
1114
1115                 /* If the address family is not supported or if this address
1116                  * causes the address buffer to overflow return EINVAL.
1117                  */
1118                 if (!af || (walk_size + af->sockaddr_len) > addrs_size) {
1119                         err = -EINVAL;
1120                         goto out_free;
1121                 }
1122
1123                 port = ntohs(sa_addr->v4.sin_port);
1124
1125                 /* Save current address so we can work with it */
1126                 memcpy(&to, sa_addr, af->sockaddr_len);
1127
1128                 err = sctp_verify_addr(sk, &to, af->sockaddr_len);
1129                 if (err)
1130                         goto out_free;
1131
1132                 /* Make sure the destination port is correctly set
1133                  * in all addresses.
1134                  */
1135                 if (asoc && asoc->peer.port && asoc->peer.port != port) {
1136                         err = -EINVAL;
1137                         goto out_free;
1138                 }
1139
1140                 /* Check if there already is a matching association on the
1141                  * endpoint (other than the one created here).
1142                  */
1143                 asoc2 = sctp_endpoint_lookup_assoc(ep, &to, &transport);
1144                 if (asoc2 && asoc2 != asoc) {
1145                         if (asoc2->state >= SCTP_STATE_ESTABLISHED)
1146                                 err = -EISCONN;
1147                         else
1148                                 err = -EALREADY;
1149                         goto out_free;
1150                 }
1151
1152                 /* If we could not find a matching association on the endpoint,
1153                  * make sure that there is no peeled-off association matching
1154                  * the peer address even on another socket.
1155                  */
1156                 if (sctp_endpoint_is_peeled_off(ep, &to)) {
1157                         err = -EADDRNOTAVAIL;
1158                         goto out_free;
1159                 }
1160
1161                 if (!asoc) {
1162                         /* If a bind() or sctp_bindx() is not called prior to
1163                          * an sctp_connectx() call, the system picks an
1164                          * ephemeral port and will choose an address set
1165                          * equivalent to binding with a wildcard address.
1166                          */
1167                         if (!ep->base.bind_addr.port) {
1168                                 if (sctp_autobind(sk)) {
1169                                         err = -EAGAIN;
1170                                         goto out_free;
1171                                 }
1172                         } else {
1173                                 /*
1174                                  * If an unprivileged user inherits a 1-many
1175                                  * style socket with open associations on a
1176                                  * privileged port, it MAY be permitted to
1177                                  * accept new associations, but it SHOULD NOT
1178                                  * be permitted to open new associations.
1179                                  */
1180                                 if (ep->base.bind_addr.port <
1181                                     inet_prot_sock(net) &&
1182                                     !ns_capable(net->user_ns,
1183                                     CAP_NET_BIND_SERVICE)) {
1184                                         err = -EACCES;
1185                                         goto out_free;
1186                                 }
1187                         }
1188
1189                         scope = sctp_scope(&to);
1190                         asoc = sctp_association_new(ep, sk, scope, GFP_KERNEL);
1191                         if (!asoc) {
1192                                 err = -ENOMEM;
1193                                 goto out_free;
1194                         }
1195
1196                         err = sctp_assoc_set_bind_addr_from_ep(asoc, scope,
1197                                                               GFP_KERNEL);
1198                         if (err < 0) {
1199                                 goto out_free;
1200                         }
1201
1202                 }
1203
1204                 /* Prime the peer's transport structures.  */
1205                 transport = sctp_assoc_add_peer(asoc, &to, GFP_KERNEL,
1206                                                 SCTP_UNKNOWN);
1207                 if (!transport) {
1208                         err = -ENOMEM;
1209                         goto out_free;
1210                 }
1211
1212                 addrcnt++;
1213                 addr_buf += af->sockaddr_len;
1214                 walk_size += af->sockaddr_len;
1215         }
1216
1217         /* In case the user of sctp_connectx() wants an association
1218          * id back, assign one now.
1219          */
1220         if (assoc_id) {
1221                 err = sctp_assoc_set_id(asoc, GFP_KERNEL);
1222                 if (err < 0)
1223                         goto out_free;
1224         }
1225
1226         err = sctp_primitive_ASSOCIATE(net, asoc, NULL);
1227         if (err < 0) {
1228                 goto out_free;
1229         }
1230
1231         /* Initialize sk's dport and daddr for getpeername() */
1232         inet_sk(sk)->inet_dport = htons(asoc->peer.port);
1233         sp->pf->to_sk_daddr(sa_addr, sk);
1234         sk->sk_err = 0;
1235
1236         timeo = sock_sndtimeo(sk, flags & O_NONBLOCK);
1237
1238         if (assoc_id)
1239                 *assoc_id = asoc->assoc_id;
1240
1241         err = sctp_wait_for_connect(asoc, &timeo);
1242         /* Note: the asoc may be freed after the return of
1243          * sctp_wait_for_connect.
1244          */
1245
1246         /* Don't free association on exit. */
1247         asoc = NULL;
1248
1249 out_free:
1250         pr_debug("%s: took out_free path with asoc:%p kaddrs:%p err:%d\n",
1251                  __func__, asoc, kaddrs, err);
1252
1253         if (asoc) {
1254                 /* sctp_primitive_ASSOCIATE may have added this association
1255                  * To the hash table, try to unhash it, just in case, its a noop
1256                  * if it wasn't hashed so we're safe
1257                  */
1258                 sctp_association_free(asoc);
1259         }
1260         return err;
1261 }
1262
1263 /* Helper for tunneling sctp_connectx() requests through sctp_setsockopt()
1264  *
1265  * API 8.9
1266  * int sctp_connectx(int sd, struct sockaddr *addrs, int addrcnt,
1267  *                      sctp_assoc_t *asoc);
1268  *
1269  * If sd is an IPv4 socket, the addresses passed must be IPv4 addresses.
1270  * If the sd is an IPv6 socket, the addresses passed can either be IPv4
1271  * or IPv6 addresses.
1272  *
1273  * A single address may be specified as INADDR_ANY or IN6ADDR_ANY, see
1274  * Section 3.1.2 for this usage.
1275  *
1276  * addrs is a pointer to an array of one or more socket addresses. Each
1277  * address is contained in its appropriate structure (i.e. struct
1278  * sockaddr_in or struct sockaddr_in6) the family of the address type
1279  * must be used to distengish the address length (note that this
1280  * representation is termed a "packed array" of addresses). The caller
1281  * specifies the number of addresses in the array with addrcnt.
1282  *
1283  * On success, sctp_connectx() returns 0. It also sets the assoc_id to
1284  * the association id of the new association.  On failure, sctp_connectx()
1285  * returns -1, and sets errno to the appropriate error code.  The assoc_id
1286  * is not touched by the kernel.
1287  *
1288  * For SCTP, the port given in each socket address must be the same, or
1289  * sctp_connectx() will fail, setting errno to EINVAL.
1290  *
1291  * An application can use sctp_connectx to initiate an association with
1292  * an endpoint that is multi-homed.  Much like sctp_bindx() this call
1293  * allows a caller to specify multiple addresses at which a peer can be
1294  * reached.  The way the SCTP stack uses the list of addresses to set up
1295  * the association is implementation dependent.  This function only
1296  * specifies that the stack will try to make use of all the addresses in
1297  * the list when needed.
1298  *
1299  * Note that the list of addresses passed in is only used for setting up
1300  * the association.  It does not necessarily equal the set of addresses
1301  * the peer uses for the resulting association.  If the caller wants to
1302  * find out the set of peer addresses, it must use sctp_getpaddrs() to
1303  * retrieve them after the association has been set up.
1304  *
1305  * Basically do nothing but copying the addresses from user to kernel
1306  * land and invoking either sctp_connectx(). This is used for tunneling
1307  * the sctp_connectx() request through sctp_setsockopt() from userspace.
1308  *
1309  * On exit there is no need to do sockfd_put(), sys_setsockopt() does
1310  * it.
1311  *
1312  * sk        The sk of the socket
1313  * addrs     The pointer to the addresses in user land
1314  * addrssize Size of the addrs buffer
1315  *
1316  * Returns >=0 if ok, <0 errno code on error.
1317  */
1318 static int __sctp_setsockopt_connectx(struct sock *sk,
1319                                       struct sockaddr __user *addrs,
1320                                       int addrs_size,
1321                                       sctp_assoc_t *assoc_id)
1322 {
1323         struct sockaddr *kaddrs;
1324         int err = 0, flags = 0;
1325
1326         pr_debug("%s: sk:%p addrs:%p addrs_size:%d\n",
1327                  __func__, sk, addrs, addrs_size);
1328
1329         if (unlikely(addrs_size <= 0))
1330                 return -EINVAL;
1331
1332         kaddrs = vmemdup_user(addrs, addrs_size);
1333         if (unlikely(IS_ERR(kaddrs)))
1334                 return PTR_ERR(kaddrs);
1335
1336         /* Allow security module to validate connectx addresses. */
1337         err = security_sctp_bind_connect(sk, SCTP_SOCKOPT_CONNECTX,
1338                                          (struct sockaddr *)kaddrs,
1339                                           addrs_size);
1340         if (err)
1341                 goto out_free;
1342
1343         /* in-kernel sockets don't generally have a file allocated to them
1344          * if all they do is call sock_create_kern().
1345          */
1346         if (sk->sk_socket->file)
1347                 flags = sk->sk_socket->file->f_flags;
1348
1349         err = __sctp_connect(sk, kaddrs, addrs_size, flags, assoc_id);
1350
1351 out_free:
1352         kvfree(kaddrs);
1353
1354         return err;
1355 }
1356
1357 /*
1358  * This is an older interface.  It's kept for backward compatibility
1359  * to the option that doesn't provide association id.
1360  */
1361 static int sctp_setsockopt_connectx_old(struct sock *sk,
1362                                         struct sockaddr __user *addrs,
1363                                         int addrs_size)
1364 {
1365         return __sctp_setsockopt_connectx(sk, addrs, addrs_size, NULL);
1366 }
1367
1368 /*
1369  * New interface for the API.  The since the API is done with a socket
1370  * option, to make it simple we feed back the association id is as a return
1371  * indication to the call.  Error is always negative and association id is
1372  * always positive.
1373  */
1374 static int sctp_setsockopt_connectx(struct sock *sk,
1375                                     struct sockaddr __user *addrs,
1376                                     int addrs_size)
1377 {
1378         sctp_assoc_t assoc_id = 0;
1379         int err = 0;
1380
1381         err = __sctp_setsockopt_connectx(sk, addrs, addrs_size, &assoc_id);
1382
1383         if (err)
1384                 return err;
1385         else
1386                 return assoc_id;
1387 }
1388
1389 /*
1390  * New (hopefully final) interface for the API.
1391  * We use the sctp_getaddrs_old structure so that use-space library
1392  * can avoid any unnecessary allocations. The only different part
1393  * is that we store the actual length of the address buffer into the
1394  * addrs_num structure member. That way we can re-use the existing
1395  * code.
1396  */
1397 #ifdef CONFIG_COMPAT
1398 struct compat_sctp_getaddrs_old {
1399         sctp_assoc_t    assoc_id;
1400         s32             addr_num;
1401         compat_uptr_t   addrs;          /* struct sockaddr * */
1402 };
1403 #endif
1404
1405 static int sctp_getsockopt_connectx3(struct sock *sk, int len,
1406                                      char __user *optval,
1407                                      int __user *optlen)
1408 {
1409         struct sctp_getaddrs_old param;
1410         sctp_assoc_t assoc_id = 0;
1411         int err = 0;
1412
1413 #ifdef CONFIG_COMPAT
1414         if (in_compat_syscall()) {
1415                 struct compat_sctp_getaddrs_old param32;
1416
1417                 if (len < sizeof(param32))
1418                         return -EINVAL;
1419                 if (copy_from_user(&param32, optval, sizeof(param32)))
1420                         return -EFAULT;
1421
1422                 param.assoc_id = param32.assoc_id;
1423                 param.addr_num = param32.addr_num;
1424                 param.addrs = compat_ptr(param32.addrs);
1425         } else
1426 #endif
1427         {
1428                 if (len < sizeof(param))
1429                         return -EINVAL;
1430                 if (copy_from_user(&param, optval, sizeof(param)))
1431                         return -EFAULT;
1432         }
1433
1434         err = __sctp_setsockopt_connectx(sk, (struct sockaddr __user *)
1435                                          param.addrs, param.addr_num,
1436                                          &assoc_id);
1437         if (err == 0 || err == -EINPROGRESS) {
1438                 if (copy_to_user(optval, &assoc_id, sizeof(assoc_id)))
1439                         return -EFAULT;
1440                 if (put_user(sizeof(assoc_id), optlen))
1441                         return -EFAULT;
1442         }
1443
1444         return err;
1445 }
1446
1447 /* API 3.1.4 close() - UDP Style Syntax
1448  * Applications use close() to perform graceful shutdown (as described in
1449  * Section 10.1 of [SCTP]) on ALL the associations currently represented
1450  * by a UDP-style socket.
1451  *
1452  * The syntax is
1453  *
1454  *   ret = close(int sd);
1455  *
1456  *   sd      - the socket descriptor of the associations to be closed.
1457  *
1458  * To gracefully shutdown a specific association represented by the
1459  * UDP-style socket, an application should use the sendmsg() call,
1460  * passing no user data, but including the appropriate flag in the
1461  * ancillary data (see Section xxxx).
1462  *
1463  * If sd in the close() call is a branched-off socket representing only
1464  * one association, the shutdown is performed on that association only.
1465  *
1466  * 4.1.6 close() - TCP Style Syntax
1467  *
1468  * Applications use close() to gracefully close down an association.
1469  *
1470  * The syntax is:
1471  *
1472  *    int close(int sd);
1473  *
1474  *      sd      - the socket descriptor of the association to be closed.
1475  *
1476  * After an application calls close() on a socket descriptor, no further
1477  * socket operations will succeed on that descriptor.
1478  *
1479  * API 7.1.4 SO_LINGER
1480  *
1481  * An application using the TCP-style socket can use this option to
1482  * perform the SCTP ABORT primitive.  The linger option structure is:
1483  *
1484  *  struct  linger {
1485  *     int     l_onoff;                // option on/off
1486  *     int     l_linger;               // linger time
1487  * };
1488  *
1489  * To enable the option, set l_onoff to 1.  If the l_linger value is set
1490  * to 0, calling close() is the same as the ABORT primitive.  If the
1491  * value is set to a negative value, the setsockopt() call will return
1492  * an error.  If the value is set to a positive value linger_time, the
1493  * close() can be blocked for at most linger_time ms.  If the graceful
1494  * shutdown phase does not finish during this period, close() will
1495  * return but the graceful shutdown phase continues in the system.
1496  */
1497 static void sctp_close(struct sock *sk, long timeout)
1498 {
1499         struct net *net = sock_net(sk);
1500         struct sctp_endpoint *ep;
1501         struct sctp_association *asoc;
1502         struct list_head *pos, *temp;
1503         unsigned int data_was_unread;
1504
1505         pr_debug("%s: sk:%p, timeout:%ld\n", __func__, sk, timeout);
1506
1507         lock_sock_nested(sk, SINGLE_DEPTH_NESTING);
1508         sk->sk_shutdown = SHUTDOWN_MASK;
1509         inet_sk_set_state(sk, SCTP_SS_CLOSING);
1510
1511         ep = sctp_sk(sk)->ep;
1512
1513         /* Clean up any skbs sitting on the receive queue.  */
1514         data_was_unread = sctp_queue_purge_ulpevents(&sk->sk_receive_queue);
1515         data_was_unread += sctp_queue_purge_ulpevents(&sctp_sk(sk)->pd_lobby);
1516
1517         /* Walk all associations on an endpoint.  */
1518         list_for_each_safe(pos, temp, &ep->asocs) {
1519                 asoc = list_entry(pos, struct sctp_association, asocs);
1520
1521                 if (sctp_style(sk, TCP)) {
1522                         /* A closed association can still be in the list if
1523                          * it belongs to a TCP-style listening socket that is
1524                          * not yet accepted. If so, free it. If not, send an
1525                          * ABORT or SHUTDOWN based on the linger options.
1526                          */
1527                         if (sctp_state(asoc, CLOSED)) {
1528                                 sctp_association_free(asoc);
1529                                 continue;
1530                         }
1531                 }
1532
1533                 if (data_was_unread || !skb_queue_empty(&asoc->ulpq.lobby) ||
1534                     !skb_queue_empty(&asoc->ulpq.reasm) ||
1535                     !skb_queue_empty(&asoc->ulpq.reasm_uo) ||
1536                     (sock_flag(sk, SOCK_LINGER) && !sk->sk_lingertime)) {
1537                         struct sctp_chunk *chunk;
1538
1539                         chunk = sctp_make_abort_user(asoc, NULL, 0);
1540                         sctp_primitive_ABORT(net, asoc, chunk);
1541                 } else
1542                         sctp_primitive_SHUTDOWN(net, asoc, NULL);
1543         }
1544
1545         /* On a TCP-style socket, block for at most linger_time if set. */
1546         if (sctp_style(sk, TCP) && timeout)
1547                 sctp_wait_for_close(sk, timeout);
1548
1549         /* This will run the backlog queue.  */
1550         release_sock(sk);
1551
1552         /* Supposedly, no process has access to the socket, but
1553          * the net layers still may.
1554          * Also, sctp_destroy_sock() needs to be called with addr_wq_lock
1555          * held and that should be grabbed before socket lock.
1556          */
1557         spin_lock_bh(&net->sctp.addr_wq_lock);
1558         bh_lock_sock_nested(sk);
1559
1560         /* Hold the sock, since sk_common_release() will put sock_put()
1561          * and we have just a little more cleanup.
1562          */
1563         sock_hold(sk);
1564         sk_common_release(sk);
1565
1566         bh_unlock_sock(sk);
1567         spin_unlock_bh(&net->sctp.addr_wq_lock);
1568
1569         sock_put(sk);
1570
1571         SCTP_DBG_OBJCNT_DEC(sock);
1572 }
1573
1574 /* Handle EPIPE error. */
1575 static int sctp_error(struct sock *sk, int flags, int err)
1576 {
1577         if (err == -EPIPE)
1578                 err = sock_error(sk) ? : -EPIPE;
1579         if (err == -EPIPE && !(flags & MSG_NOSIGNAL))
1580                 send_sig(SIGPIPE, current, 0);
1581         return err;
1582 }
1583
1584 /* API 3.1.3 sendmsg() - UDP Style Syntax
1585  *
1586  * An application uses sendmsg() and recvmsg() calls to transmit data to
1587  * and receive data from its peer.
1588  *
1589  *  ssize_t sendmsg(int socket, const struct msghdr *message,
1590  *                  int flags);
1591  *
1592  *  socket  - the socket descriptor of the endpoint.
1593  *  message - pointer to the msghdr structure which contains a single
1594  *            user message and possibly some ancillary data.
1595  *
1596  *            See Section 5 for complete description of the data
1597  *            structures.
1598  *
1599  *  flags   - flags sent or received with the user message, see Section
1600  *            5 for complete description of the flags.
1601  *
1602  * Note:  This function could use a rewrite especially when explicit
1603  * connect support comes in.
1604  */
1605 /* BUG:  We do not implement the equivalent of sk_stream_wait_memory(). */
1606
1607 static int sctp_msghdr_parse(const struct msghdr *msg,
1608                              struct sctp_cmsgs *cmsgs);
1609
1610 static int sctp_sendmsg_parse(struct sock *sk, struct sctp_cmsgs *cmsgs,
1611                               struct sctp_sndrcvinfo *srinfo,
1612                               const struct msghdr *msg, size_t msg_len)
1613 {
1614         __u16 sflags;
1615         int err;
1616
1617         if (sctp_sstate(sk, LISTENING) && sctp_style(sk, TCP))
1618                 return -EPIPE;
1619
1620         if (msg_len > sk->sk_sndbuf)
1621                 return -EMSGSIZE;
1622
1623         memset(cmsgs, 0, sizeof(*cmsgs));
1624         err = sctp_msghdr_parse(msg, cmsgs);
1625         if (err) {
1626                 pr_debug("%s: msghdr parse err:%x\n", __func__, err);
1627                 return err;
1628         }
1629
1630         memset(srinfo, 0, sizeof(*srinfo));
1631         if (cmsgs->srinfo) {
1632                 srinfo->sinfo_stream = cmsgs->srinfo->sinfo_stream;
1633                 srinfo->sinfo_flags = cmsgs->srinfo->sinfo_flags;
1634                 srinfo->sinfo_ppid = cmsgs->srinfo->sinfo_ppid;
1635                 srinfo->sinfo_context = cmsgs->srinfo->sinfo_context;
1636                 srinfo->sinfo_assoc_id = cmsgs->srinfo->sinfo_assoc_id;
1637                 srinfo->sinfo_timetolive = cmsgs->srinfo->sinfo_timetolive;
1638         }
1639
1640         if (cmsgs->sinfo) {
1641                 srinfo->sinfo_stream = cmsgs->sinfo->snd_sid;
1642                 srinfo->sinfo_flags = cmsgs->sinfo->snd_flags;
1643                 srinfo->sinfo_ppid = cmsgs->sinfo->snd_ppid;
1644                 srinfo->sinfo_context = cmsgs->sinfo->snd_context;
1645                 srinfo->sinfo_assoc_id = cmsgs->sinfo->snd_assoc_id;
1646         }
1647
1648         if (cmsgs->prinfo) {
1649                 srinfo->sinfo_timetolive = cmsgs->prinfo->pr_value;
1650                 SCTP_PR_SET_POLICY(srinfo->sinfo_flags,
1651                                    cmsgs->prinfo->pr_policy);
1652         }
1653
1654         sflags = srinfo->sinfo_flags;
1655         if (!sflags && msg_len)
1656                 return 0;
1657
1658         if (sctp_style(sk, TCP) && (sflags & (SCTP_EOF | SCTP_ABORT)))
1659                 return -EINVAL;
1660
1661         if (((sflags & SCTP_EOF) && msg_len > 0) ||
1662             (!(sflags & (SCTP_EOF | SCTP_ABORT)) && msg_len == 0))
1663                 return -EINVAL;
1664
1665         if ((sflags & SCTP_ADDR_OVER) && !msg->msg_name)
1666                 return -EINVAL;
1667
1668         return 0;
1669 }
1670
1671 static int sctp_sendmsg_new_asoc(struct sock *sk, __u16 sflags,
1672                                  struct sctp_cmsgs *cmsgs,
1673                                  union sctp_addr *daddr,
1674                                  struct sctp_transport **tp)
1675 {
1676         struct sctp_endpoint *ep = sctp_sk(sk)->ep;
1677         struct net *net = sock_net(sk);
1678         struct sctp_association *asoc;
1679         enum sctp_scope scope;
1680         struct cmsghdr *cmsg;
1681         __be32 flowinfo = 0;
1682         struct sctp_af *af;
1683         int err;
1684
1685         *tp = NULL;
1686
1687         if (sflags & (SCTP_EOF | SCTP_ABORT))
1688                 return -EINVAL;
1689
1690         if (sctp_style(sk, TCP) && (sctp_sstate(sk, ESTABLISHED) ||
1691                                     sctp_sstate(sk, CLOSING)))
1692                 return -EADDRNOTAVAIL;
1693
1694         if (sctp_endpoint_is_peeled_off(ep, daddr))
1695                 return -EADDRNOTAVAIL;
1696
1697         if (!ep->base.bind_addr.port) {
1698                 if (sctp_autobind(sk))
1699                         return -EAGAIN;
1700         } else {
1701                 if (ep->base.bind_addr.port < inet_prot_sock(net) &&
1702                     !ns_capable(net->user_ns, CAP_NET_BIND_SERVICE))
1703                         return -EACCES;
1704         }
1705
1706         scope = sctp_scope(daddr);
1707
1708         /* Label connection socket for first association 1-to-many
1709          * style for client sequence socket()->sendmsg(). This
1710          * needs to be done before sctp_assoc_add_peer() as that will
1711          * set up the initial packet that needs to account for any
1712          * security ip options (CIPSO/CALIPSO) added to the packet.
1713          */
1714         af = sctp_get_af_specific(daddr->sa.sa_family);
1715         if (!af)
1716                 return -EINVAL;
1717         err = security_sctp_bind_connect(sk, SCTP_SENDMSG_CONNECT,
1718                                          (struct sockaddr *)daddr,
1719                                          af->sockaddr_len);
1720         if (err < 0)
1721                 return err;
1722
1723         asoc = sctp_association_new(ep, sk, scope, GFP_KERNEL);
1724         if (!asoc)
1725                 return -ENOMEM;
1726
1727         if (sctp_assoc_set_bind_addr_from_ep(asoc, scope, GFP_KERNEL) < 0) {
1728                 err = -ENOMEM;
1729                 goto free;
1730         }
1731
1732         if (cmsgs->init) {
1733                 struct sctp_initmsg *init = cmsgs->init;
1734
1735                 if (init->sinit_num_ostreams) {
1736                         __u16 outcnt = init->sinit_num_ostreams;
1737
1738                         asoc->c.sinit_num_ostreams = outcnt;
1739                         /* outcnt has been changed, need to re-init stream */
1740                         err = sctp_stream_init(&asoc->stream, outcnt, 0,
1741                                                GFP_KERNEL);
1742                         if (err)
1743                                 goto free;
1744                 }
1745
1746                 if (init->sinit_max_instreams)
1747                         asoc->c.sinit_max_instreams = init->sinit_max_instreams;
1748
1749                 if (init->sinit_max_attempts)
1750                         asoc->max_init_attempts = init->sinit_max_attempts;
1751
1752                 if (init->sinit_max_init_timeo)
1753                         asoc->max_init_timeo =
1754                                 msecs_to_jiffies(init->sinit_max_init_timeo);
1755         }
1756
1757         *tp = sctp_assoc_add_peer(asoc, daddr, GFP_KERNEL, SCTP_UNKNOWN);
1758         if (!*tp) {
1759                 err = -ENOMEM;
1760                 goto free;
1761         }
1762
1763         if (!cmsgs->addrs_msg)
1764                 return 0;
1765
1766         if (daddr->sa.sa_family == AF_INET6)
1767                 flowinfo = daddr->v6.sin6_flowinfo;
1768
1769         /* sendv addr list parse */
1770         for_each_cmsghdr(cmsg, cmsgs->addrs_msg) {
1771                 struct sctp_transport *transport;
1772                 struct sctp_association *old;
1773                 union sctp_addr _daddr;
1774                 int dlen;
1775
1776                 if (cmsg->cmsg_level != IPPROTO_SCTP ||
1777                     (cmsg->cmsg_type != SCTP_DSTADDRV4 &&
1778                      cmsg->cmsg_type != SCTP_DSTADDRV6))
1779                         continue;
1780
1781                 daddr = &_daddr;
1782                 memset(daddr, 0, sizeof(*daddr));
1783                 dlen = cmsg->cmsg_len - sizeof(struct cmsghdr);
1784                 if (cmsg->cmsg_type == SCTP_DSTADDRV4) {
1785                         if (dlen < sizeof(struct in_addr)) {
1786                                 err = -EINVAL;
1787                                 goto free;
1788                         }
1789
1790                         dlen = sizeof(struct in_addr);
1791                         daddr->v4.sin_family = AF_INET;
1792                         daddr->v4.sin_port = htons(asoc->peer.port);
1793                         memcpy(&daddr->v4.sin_addr, CMSG_DATA(cmsg), dlen);
1794                 } else {
1795                         if (dlen < sizeof(struct in6_addr)) {
1796                                 err = -EINVAL;
1797                                 goto free;
1798                         }
1799
1800                         dlen = sizeof(struct in6_addr);
1801                         daddr->v6.sin6_flowinfo = flowinfo;
1802                         daddr->v6.sin6_family = AF_INET6;
1803                         daddr->v6.sin6_port = htons(asoc->peer.port);
1804                         memcpy(&daddr->v6.sin6_addr, CMSG_DATA(cmsg), dlen);
1805                 }
1806                 err = sctp_verify_addr(sk, daddr, sizeof(*daddr));
1807                 if (err)
1808                         goto free;
1809
1810                 old = sctp_endpoint_lookup_assoc(ep, daddr, &transport);
1811                 if (old && old != asoc) {
1812                         if (old->state >= SCTP_STATE_ESTABLISHED)
1813                                 err = -EISCONN;
1814                         else
1815                                 err = -EALREADY;
1816                         goto free;
1817                 }
1818
1819                 if (sctp_endpoint_is_peeled_off(ep, daddr)) {
1820                         err = -EADDRNOTAVAIL;
1821                         goto free;
1822                 }
1823
1824                 transport = sctp_assoc_add_peer(asoc, daddr, GFP_KERNEL,
1825                                                 SCTP_UNKNOWN);
1826                 if (!transport) {
1827                         err = -ENOMEM;
1828                         goto free;
1829                 }
1830         }
1831
1832         return 0;
1833
1834 free:
1835         sctp_association_free(asoc);
1836         return err;
1837 }
1838
1839 static int sctp_sendmsg_check_sflags(struct sctp_association *asoc,
1840                                      __u16 sflags, struct msghdr *msg,
1841                                      size_t msg_len)
1842 {
1843         struct sock *sk = asoc->base.sk;
1844         struct net *net = sock_net(sk);
1845
1846         if (sctp_state(asoc, CLOSED) && sctp_style(sk, TCP))
1847                 return -EPIPE;
1848
1849         if ((sflags & SCTP_SENDALL) && sctp_style(sk, UDP) &&
1850             !sctp_state(asoc, ESTABLISHED))
1851                 return 0;
1852
1853         if (sflags & SCTP_EOF) {
1854                 pr_debug("%s: shutting down association:%p\n", __func__, asoc);
1855                 sctp_primitive_SHUTDOWN(net, asoc, NULL);
1856
1857                 return 0;
1858         }
1859
1860         if (sflags & SCTP_ABORT) {
1861                 struct sctp_chunk *chunk;
1862
1863                 chunk = sctp_make_abort_user(asoc, msg, msg_len);
1864                 if (!chunk)
1865                         return -ENOMEM;
1866
1867                 pr_debug("%s: aborting association:%p\n", __func__, asoc);
1868                 sctp_primitive_ABORT(net, asoc, chunk);
1869
1870                 return 0;
1871         }
1872
1873         return 1;
1874 }
1875
1876 static int sctp_sendmsg_to_asoc(struct sctp_association *asoc,
1877                                 struct msghdr *msg, size_t msg_len,
1878                                 struct sctp_transport *transport,
1879                                 struct sctp_sndrcvinfo *sinfo)
1880 {
1881         struct sock *sk = asoc->base.sk;
1882         struct sctp_sock *sp = sctp_sk(sk);
1883         struct net *net = sock_net(sk);
1884         struct sctp_datamsg *datamsg;
1885         bool wait_connect = false;
1886         struct sctp_chunk *chunk;
1887         long timeo;
1888         int err;
1889
1890         if (sinfo->sinfo_stream >= asoc->stream.outcnt) {
1891                 err = -EINVAL;
1892                 goto err;
1893         }
1894
1895         if (unlikely(!SCTP_SO(&asoc->stream, sinfo->sinfo_stream)->ext)) {
1896                 err = sctp_stream_init_ext(&asoc->stream, sinfo->sinfo_stream);
1897                 if (err)
1898                         goto err;
1899         }
1900
1901         if (sp->disable_fragments && msg_len > asoc->frag_point) {
1902                 err = -EMSGSIZE;
1903                 goto err;
1904         }
1905
1906         if (asoc->pmtu_pending) {
1907                 if (sp->param_flags & SPP_PMTUD_ENABLE)
1908                         sctp_assoc_sync_pmtu(asoc);
1909                 asoc->pmtu_pending = 0;
1910         }
1911
1912         if (sctp_wspace(asoc) < (int)msg_len)
1913                 sctp_prsctp_prune(asoc, sinfo, msg_len - sctp_wspace(asoc));
1914
1915         if (sctp_wspace(asoc) <= 0) {
1916                 timeo = sock_sndtimeo(sk, msg->msg_flags & MSG_DONTWAIT);
1917                 err = sctp_wait_for_sndbuf(asoc, &timeo, msg_len);
1918                 if (err)
1919                         goto err;
1920         }
1921
1922         if (sctp_state(asoc, CLOSED)) {
1923                 err = sctp_primitive_ASSOCIATE(net, asoc, NULL);
1924                 if (err)
1925                         goto err;
1926
1927                 if (sp->strm_interleave) {
1928                         timeo = sock_sndtimeo(sk, 0);
1929                         err = sctp_wait_for_connect(asoc, &timeo);
1930                         if (err) {
1931                                 err = -ESRCH;
1932                                 goto err;
1933                         }
1934                 } else {
1935                         wait_connect = true;
1936                 }
1937
1938                 pr_debug("%s: we associated primitively\n", __func__);
1939         }
1940
1941         datamsg = sctp_datamsg_from_user(asoc, sinfo, &msg->msg_iter);
1942         if (IS_ERR(datamsg)) {
1943                 err = PTR_ERR(datamsg);
1944                 goto err;
1945         }
1946
1947         asoc->force_delay = !!(msg->msg_flags & MSG_MORE);
1948
1949         list_for_each_entry(chunk, &datamsg->chunks, frag_list) {
1950                 sctp_chunk_hold(chunk);
1951                 sctp_set_owner_w(chunk);
1952                 chunk->transport = transport;
1953         }
1954
1955         err = sctp_primitive_SEND(net, asoc, datamsg);
1956         if (err) {
1957                 sctp_datamsg_free(datamsg);
1958                 goto err;
1959         }
1960
1961         pr_debug("%s: we sent primitively\n", __func__);
1962
1963         sctp_datamsg_put(datamsg);
1964
1965         if (unlikely(wait_connect)) {
1966                 timeo = sock_sndtimeo(sk, msg->msg_flags & MSG_DONTWAIT);
1967                 sctp_wait_for_connect(asoc, &timeo);
1968         }
1969
1970         err = msg_len;
1971
1972 err:
1973         return err;
1974 }
1975
1976 static union sctp_addr *sctp_sendmsg_get_daddr(struct sock *sk,
1977                                                const struct msghdr *msg,
1978                                                struct sctp_cmsgs *cmsgs)
1979 {
1980         union sctp_addr *daddr = NULL;
1981         int err;
1982
1983         if (!sctp_style(sk, UDP_HIGH_BANDWIDTH) && msg->msg_name) {
1984                 int len = msg->msg_namelen;
1985
1986                 if (len > sizeof(*daddr))
1987                         len = sizeof(*daddr);
1988
1989                 daddr = (union sctp_addr *)msg->msg_name;
1990
1991                 err = sctp_verify_addr(sk, daddr, len);
1992                 if (err)
1993                         return ERR_PTR(err);
1994         }
1995
1996         return daddr;
1997 }
1998
1999 static void sctp_sendmsg_update_sinfo(struct sctp_association *asoc,
2000                                       struct sctp_sndrcvinfo *sinfo,
2001                                       struct sctp_cmsgs *cmsgs)
2002 {
2003         if (!cmsgs->srinfo && !cmsgs->sinfo) {
2004                 sinfo->sinfo_stream = asoc->default_stream;
2005                 sinfo->sinfo_ppid = asoc->default_ppid;
2006                 sinfo->sinfo_context = asoc->default_context;
2007                 sinfo->sinfo_assoc_id = sctp_assoc2id(asoc);
2008
2009                 if (!cmsgs->prinfo)
2010                         sinfo->sinfo_flags = asoc->default_flags;
2011         }
2012
2013         if (!cmsgs->srinfo && !cmsgs->prinfo)
2014                 sinfo->sinfo_timetolive = asoc->default_timetolive;
2015
2016         if (cmsgs->authinfo) {
2017                 /* Reuse sinfo_tsn to indicate that authinfo was set and
2018                  * sinfo_ssn to save the keyid on tx path.
2019                  */
2020                 sinfo->sinfo_tsn = 1;
2021                 sinfo->sinfo_ssn = cmsgs->authinfo->auth_keynumber;
2022         }
2023 }
2024
2025 static int sctp_sendmsg(struct sock *sk, struct msghdr *msg, size_t msg_len)
2026 {
2027         struct sctp_endpoint *ep = sctp_sk(sk)->ep;
2028         struct sctp_transport *transport = NULL;
2029         struct sctp_sndrcvinfo _sinfo, *sinfo;
2030         struct sctp_association *asoc;
2031         struct sctp_cmsgs cmsgs;
2032         union sctp_addr *daddr;
2033         bool new = false;
2034         __u16 sflags;
2035         int err;
2036
2037         /* Parse and get snd_info */
2038         err = sctp_sendmsg_parse(sk, &cmsgs, &_sinfo, msg, msg_len);
2039         if (err)
2040                 goto out;
2041
2042         sinfo  = &_sinfo;
2043         sflags = sinfo->sinfo_flags;
2044
2045         /* Get daddr from msg */
2046         daddr = sctp_sendmsg_get_daddr(sk, msg, &cmsgs);
2047         if (IS_ERR(daddr)) {
2048                 err = PTR_ERR(daddr);
2049                 goto out;
2050         }
2051
2052         lock_sock(sk);
2053
2054         /* SCTP_SENDALL process */
2055         if ((sflags & SCTP_SENDALL) && sctp_style(sk, UDP)) {
2056                 list_for_each_entry(asoc, &ep->asocs, asocs) {
2057                         err = sctp_sendmsg_check_sflags(asoc, sflags, msg,
2058                                                         msg_len);
2059                         if (err == 0)
2060                                 continue;
2061                         if (err < 0)
2062                                 goto out_unlock;
2063
2064                         sctp_sendmsg_update_sinfo(asoc, sinfo, &cmsgs);
2065
2066                         err = sctp_sendmsg_to_asoc(asoc, msg, msg_len,
2067                                                    NULL, sinfo);
2068                         if (err < 0)
2069                                 goto out_unlock;
2070
2071                         iov_iter_revert(&msg->msg_iter, err);
2072                 }
2073
2074                 goto out_unlock;
2075         }
2076
2077         /* Get and check or create asoc */
2078         if (daddr) {
2079                 asoc = sctp_endpoint_lookup_assoc(ep, daddr, &transport);
2080                 if (asoc) {
2081                         err = sctp_sendmsg_check_sflags(asoc, sflags, msg,
2082                                                         msg_len);
2083                         if (err <= 0)
2084                                 goto out_unlock;
2085                 } else {
2086                         err = sctp_sendmsg_new_asoc(sk, sflags, &cmsgs, daddr,
2087                                                     &transport);
2088                         if (err)
2089                                 goto out_unlock;
2090
2091                         asoc = transport->asoc;
2092                         new = true;
2093                 }
2094
2095                 if (!sctp_style(sk, TCP) && !(sflags & SCTP_ADDR_OVER))
2096                         transport = NULL;
2097         } else {
2098                 asoc = sctp_id2assoc(sk, sinfo->sinfo_assoc_id);
2099                 if (!asoc) {
2100                         err = -EPIPE;
2101                         goto out_unlock;
2102                 }
2103
2104                 err = sctp_sendmsg_check_sflags(asoc, sflags, msg, msg_len);
2105                 if (err <= 0)
2106                         goto out_unlock;
2107         }
2108
2109         /* Update snd_info with the asoc */
2110         sctp_sendmsg_update_sinfo(asoc, sinfo, &cmsgs);
2111
2112         /* Send msg to the asoc */
2113         err = sctp_sendmsg_to_asoc(asoc, msg, msg_len, transport, sinfo);
2114         if (err < 0 && err != -ESRCH && new)
2115                 sctp_association_free(asoc);
2116
2117 out_unlock:
2118         release_sock(sk);
2119 out:
2120         return sctp_error(sk, msg->msg_flags, err);
2121 }
2122
2123 /* This is an extended version of skb_pull() that removes the data from the
2124  * start of a skb even when data is spread across the list of skb's in the
2125  * frag_list. len specifies the total amount of data that needs to be removed.
2126  * when 'len' bytes could be removed from the skb, it returns 0.
2127  * If 'len' exceeds the total skb length,  it returns the no. of bytes that
2128  * could not be removed.
2129  */
2130 static int sctp_skb_pull(struct sk_buff *skb, int len)
2131 {
2132         struct sk_buff *list;
2133         int skb_len = skb_headlen(skb);
2134         int rlen;
2135
2136         if (len <= skb_len) {
2137                 __skb_pull(skb, len);
2138                 return 0;
2139         }
2140         len -= skb_len;
2141         __skb_pull(skb, skb_len);
2142
2143         skb_walk_frags(skb, list) {
2144                 rlen = sctp_skb_pull(list, len);
2145                 skb->len -= (len-rlen);
2146                 skb->data_len -= (len-rlen);
2147
2148                 if (!rlen)
2149                         return 0;
2150
2151                 len = rlen;
2152         }
2153
2154         return len;
2155 }
2156
2157 /* API 3.1.3  recvmsg() - UDP Style Syntax
2158  *
2159  *  ssize_t recvmsg(int socket, struct msghdr *message,
2160  *                    int flags);
2161  *
2162  *  socket  - the socket descriptor of the endpoint.
2163  *  message - pointer to the msghdr structure which contains a single
2164  *            user message and possibly some ancillary data.
2165  *
2166  *            See Section 5 for complete description of the data
2167  *            structures.
2168  *
2169  *  flags   - flags sent or received with the user message, see Section
2170  *            5 for complete description of the flags.
2171  */
2172 static int sctp_recvmsg(struct sock *sk, struct msghdr *msg, size_t len,
2173                         int noblock, int flags, int *addr_len)
2174 {
2175         struct sctp_ulpevent *event = NULL;
2176         struct sctp_sock *sp = sctp_sk(sk);
2177         struct sk_buff *skb, *head_skb;
2178         int copied;
2179         int err = 0;
2180         int skb_len;
2181
2182         pr_debug("%s: sk:%p, msghdr:%p, len:%zd, noblock:%d, flags:0x%x, "
2183                  "addr_len:%p)\n", __func__, sk, msg, len, noblock, flags,
2184                  addr_len);
2185
2186         lock_sock(sk);
2187
2188         if (sctp_style(sk, TCP) && !sctp_sstate(sk, ESTABLISHED) &&
2189             !sctp_sstate(sk, CLOSING) && !sctp_sstate(sk, CLOSED)) {
2190                 err = -ENOTCONN;
2191                 goto out;
2192         }
2193
2194         skb = sctp_skb_recv_datagram(sk, flags, noblock, &err);
2195         if (!skb)
2196                 goto out;
2197
2198         /* Get the total length of the skb including any skb's in the
2199          * frag_list.
2200          */
2201         skb_len = skb->len;
2202
2203         copied = skb_len;
2204         if (copied > len)
2205                 copied = len;
2206
2207         err = skb_copy_datagram_msg(skb, 0, msg, copied);
2208
2209         event = sctp_skb2event(skb);
2210
2211         if (err)
2212                 goto out_free;
2213
2214         if (event->chunk && event->chunk->head_skb)
2215                 head_skb = event->chunk->head_skb;
2216         else
2217                 head_skb = skb;
2218         sock_recv_ts_and_drops(msg, sk, head_skb);
2219         if (sctp_ulpevent_is_notification(event)) {
2220                 msg->msg_flags |= MSG_NOTIFICATION;
2221                 sp->pf->event_msgname(event, msg->msg_name, addr_len);
2222         } else {
2223                 sp->pf->skb_msgname(head_skb, msg->msg_name, addr_len);
2224         }
2225
2226         /* Check if we allow SCTP_NXTINFO. */
2227         if (sp->recvnxtinfo)
2228                 sctp_ulpevent_read_nxtinfo(event, msg, sk);
2229         /* Check if we allow SCTP_RCVINFO. */
2230         if (sp->recvrcvinfo)
2231                 sctp_ulpevent_read_rcvinfo(event, msg);
2232         /* Check if we allow SCTP_SNDRCVINFO. */
2233         if (sp->subscribe.sctp_data_io_event)
2234                 sctp_ulpevent_read_sndrcvinfo(event, msg);
2235
2236         err = copied;
2237
2238         /* If skb's length exceeds the user's buffer, update the skb and
2239          * push it back to the receive_queue so that the next call to
2240          * recvmsg() will return the remaining data. Don't set MSG_EOR.
2241          */
2242         if (skb_len > copied) {
2243                 msg->msg_flags &= ~MSG_EOR;
2244                 if (flags & MSG_PEEK)
2245                         goto out_free;
2246                 sctp_skb_pull(skb, copied);
2247                 skb_queue_head(&sk->sk_receive_queue, skb);
2248
2249                 /* When only partial message is copied to the user, increase
2250                  * rwnd by that amount. If all the data in the skb is read,
2251                  * rwnd is updated when the event is freed.
2252                  */
2253                 if (!sctp_ulpevent_is_notification(event))
2254                         sctp_assoc_rwnd_increase(event->asoc, copied);
2255                 goto out;
2256         } else if ((event->msg_flags & MSG_NOTIFICATION) ||
2257                    (event->msg_flags & MSG_EOR))
2258                 msg->msg_flags |= MSG_EOR;
2259         else
2260                 msg->msg_flags &= ~MSG_EOR;
2261
2262 out_free:
2263         if (flags & MSG_PEEK) {
2264                 /* Release the skb reference acquired after peeking the skb in
2265                  * sctp_skb_recv_datagram().
2266                  */
2267                 kfree_skb(skb);
2268         } else {
2269                 /* Free the event which includes releasing the reference to
2270                  * the owner of the skb, freeing the skb and updating the
2271                  * rwnd.
2272                  */
2273                 sctp_ulpevent_free(event);
2274         }
2275 out:
2276         release_sock(sk);
2277         return err;
2278 }
2279
2280 /* 7.1.12 Enable/Disable message fragmentation (SCTP_DISABLE_FRAGMENTS)
2281  *
2282  * This option is a on/off flag.  If enabled no SCTP message
2283  * fragmentation will be performed.  Instead if a message being sent
2284  * exceeds the current PMTU size, the message will NOT be sent and
2285  * instead a error will be indicated to the user.
2286  */
2287 static int sctp_setsockopt_disable_fragments(struct sock *sk,
2288                                              char __user *optval,
2289                                              unsigned int optlen)
2290 {
2291         int val;
2292
2293         if (optlen < sizeof(int))
2294                 return -EINVAL;
2295
2296         if (get_user(val, (int __user *)optval))
2297                 return -EFAULT;
2298
2299         sctp_sk(sk)->disable_fragments = (val == 0) ? 0 : 1;
2300
2301         return 0;
2302 }
2303
2304 static int sctp_setsockopt_events(struct sock *sk, char __user *optval,
2305                                   unsigned int optlen)
2306 {
2307         struct sctp_association *asoc;
2308         struct sctp_ulpevent *event;
2309
2310         if (optlen > sizeof(struct sctp_event_subscribe))
2311                 return -EINVAL;
2312         if (copy_from_user(&sctp_sk(sk)->subscribe, optval, optlen))
2313                 return -EFAULT;
2314
2315         /* At the time when a user app subscribes to SCTP_SENDER_DRY_EVENT,
2316          * if there is no data to be sent or retransmit, the stack will
2317          * immediately send up this notification.
2318          */
2319         if (sctp_ulpevent_type_enabled(SCTP_SENDER_DRY_EVENT,
2320                                        &sctp_sk(sk)->subscribe)) {
2321                 asoc = sctp_id2assoc(sk, 0);
2322
2323                 if (asoc && sctp_outq_is_empty(&asoc->outqueue)) {
2324                         event = sctp_ulpevent_make_sender_dry_event(asoc,
2325                                         GFP_USER | __GFP_NOWARN);
2326                         if (!event)
2327                                 return -ENOMEM;
2328
2329                         asoc->stream.si->enqueue_event(&asoc->ulpq, event);
2330                 }
2331         }
2332
2333         return 0;
2334 }
2335
2336 /* 7.1.8 Automatic Close of associations (SCTP_AUTOCLOSE)
2337  *
2338  * This socket option is applicable to the UDP-style socket only.  When
2339  * set it will cause associations that are idle for more than the
2340  * specified number of seconds to automatically close.  An association
2341  * being idle is defined an association that has NOT sent or received
2342  * user data.  The special value of '0' indicates that no automatic
2343  * close of any associations should be performed.  The option expects an
2344  * integer defining the number of seconds of idle time before an
2345  * association is closed.
2346  */
2347 static int sctp_setsockopt_autoclose(struct sock *sk, char __user *optval,
2348                                      unsigned int optlen)
2349 {
2350         struct sctp_sock *sp = sctp_sk(sk);
2351         struct net *net = sock_net(sk);
2352
2353         /* Applicable to UDP-style socket only */
2354         if (sctp_style(sk, TCP))
2355                 return -EOPNOTSUPP;
2356         if (optlen != sizeof(int))
2357                 return -EINVAL;
2358         if (copy_from_user(&sp->autoclose, optval, optlen))
2359                 return -EFAULT;
2360
2361         if (sp->autoclose > net->sctp.max_autoclose)
2362                 sp->autoclose = net->sctp.max_autoclose;
2363
2364         return 0;
2365 }
2366
2367 /* 7.1.13 Peer Address Parameters (SCTP_PEER_ADDR_PARAMS)
2368  *
2369  * Applications can enable or disable heartbeats for any peer address of
2370  * an association, modify an address's heartbeat interval, force a
2371  * heartbeat to be sent immediately, and adjust the address's maximum
2372  * number of retransmissions sent before an address is considered
2373  * unreachable.  The following structure is used to access and modify an
2374  * address's parameters:
2375  *
2376  *  struct sctp_paddrparams {
2377  *     sctp_assoc_t            spp_assoc_id;
2378  *     struct sockaddr_storage spp_address;
2379  *     uint32_t                spp_hbinterval;
2380  *     uint16_t                spp_pathmaxrxt;
2381  *     uint32_t                spp_pathmtu;
2382  *     uint32_t                spp_sackdelay;
2383  *     uint32_t                spp_flags;
2384  *     uint32_t                spp_ipv6_flowlabel;
2385  *     uint8_t                 spp_dscp;
2386  * };
2387  *
2388  *   spp_assoc_id    - (one-to-many style socket) This is filled in the
2389  *                     application, and identifies the association for
2390  *                     this query.
2391  *   spp_address     - This specifies which address is of interest.
2392  *   spp_hbinterval  - This contains the value of the heartbeat interval,
2393  *                     in milliseconds.  If a  value of zero
2394  *                     is present in this field then no changes are to
2395  *                     be made to this parameter.
2396  *   spp_pathmaxrxt  - This contains the maximum number of
2397  *                     retransmissions before this address shall be
2398  *                     considered unreachable. If a  value of zero
2399  *                     is present in this field then no changes are to
2400  *                     be made to this parameter.
2401  *   spp_pathmtu     - When Path MTU discovery is disabled the value
2402  *                     specified here will be the "fixed" path mtu.
2403  *                     Note that if the spp_address field is empty
2404  *                     then all associations on this address will
2405  *                     have this fixed path mtu set upon them.
2406  *
2407  *   spp_sackdelay   - When delayed sack is enabled, this value specifies
2408  *                     the number of milliseconds that sacks will be delayed
2409  *                     for. This value will apply to all addresses of an
2410  *                     association if the spp_address field is empty. Note
2411  *                     also, that if delayed sack is enabled and this
2412  *                     value is set to 0, no change is made to the last
2413  *                     recorded delayed sack timer value.
2414  *
2415  *   spp_flags       - These flags are used to control various features
2416  *                     on an association. The flag field may contain
2417  *                     zero or more of the following options.
2418  *
2419  *                     SPP_HB_ENABLE  - Enable heartbeats on the
2420  *                     specified address. Note that if the address
2421  *                     field is empty all addresses for the association
2422  *                     have heartbeats enabled upon them.
2423  *
2424  *                     SPP_HB_DISABLE - Disable heartbeats on the
2425  *                     speicifed address. Note that if the address
2426  *                     field is empty all addresses for the association
2427  *                     will have their heartbeats disabled. Note also
2428  *                     that SPP_HB_ENABLE and SPP_HB_DISABLE are
2429  *                     mutually exclusive, only one of these two should
2430  *                     be specified. Enabling both fields will have
2431  *                     undetermined results.
2432  *
2433  *                     SPP_HB_DEMAND - Request a user initiated heartbeat
2434  *                     to be made immediately.
2435  *
2436  *                     SPP_HB_TIME_IS_ZERO - Specify's that the time for
2437  *                     heartbeat delayis to be set to the value of 0
2438  *                     milliseconds.
2439  *
2440  *                     SPP_PMTUD_ENABLE - This field will enable PMTU
2441  *                     discovery upon the specified address. Note that
2442  *                     if the address feild is empty then all addresses
2443  *                     on the association are effected.
2444  *
2445  *                     SPP_PMTUD_DISABLE - This field will disable PMTU
2446  *                     discovery upon the specified address. Note that
2447  *                     if the address feild is empty then all addresses
2448  *                     on the association are effected. Not also that
2449  *                     SPP_PMTUD_ENABLE and SPP_PMTUD_DISABLE are mutually
2450  *                     exclusive. Enabling both will have undetermined
2451  *                     results.
2452  *
2453  *                     SPP_SACKDELAY_ENABLE - Setting this flag turns
2454  *                     on delayed sack. The time specified in spp_sackdelay
2455  *                     is used to specify the sack delay for this address. Note
2456  *                     that if spp_address is empty then all addresses will
2457  *                     enable delayed sack and take on the sack delay
2458  *                     value specified in spp_sackdelay.
2459  *                     SPP_SACKDELAY_DISABLE - Setting this flag turns
2460  *                     off delayed sack. If the spp_address field is blank then
2461  *                     delayed sack is disabled for the entire association. Note
2462  *                     also that this field is mutually exclusive to
2463  *                     SPP_SACKDELAY_ENABLE, setting both will have undefined
2464  *                     results.
2465  *
2466  *                     SPP_IPV6_FLOWLABEL:  Setting this flag enables the
2467  *                     setting of the IPV6 flow label value.  The value is
2468  *                     contained in the spp_ipv6_flowlabel field.
2469  *                     Upon retrieval, this flag will be set to indicate that
2470  *                     the spp_ipv6_flowlabel field has a valid value returned.
2471  *                     If a specific destination address is set (in the
2472  *                     spp_address field), then the value returned is that of
2473  *                     the address.  If just an association is specified (and
2474  *                     no address), then the association's default flow label
2475  *                     is returned.  If neither an association nor a destination
2476  *                     is specified, then the socket's default flow label is
2477  *                     returned.  For non-IPv6 sockets, this flag will be left
2478  *                     cleared.
2479  *
2480  *                     SPP_DSCP:  Setting this flag enables the setting of the
2481  *                     Differentiated Services Code Point (DSCP) value
2482  *                     associated with either the association or a specific
2483  *                     address.  The value is obtained in the spp_dscp field.
2484  *                     Upon retrieval, this flag will be set to indicate that
2485  *                     the spp_dscp field has a valid value returned.  If a
2486  *                     specific destination address is set when called (in the
2487  *                     spp_address field), then that specific destination
2488  *                     address's DSCP value is returned.  If just an association
2489  *                     is specified, then the association's default DSCP is
2490  *                     returned.  If neither an association nor a destination is
2491  *                     specified, then the socket's default DSCP is returned.
2492  *
2493  *   spp_ipv6_flowlabel
2494  *                   - This field is used in conjunction with the
2495  *                     SPP_IPV6_FLOWLABEL flag and contains the IPv6 flow label.
2496  *                     The 20 least significant bits are used for the flow
2497  *                     label.  This setting has precedence over any IPv6-layer
2498  *                     setting.
2499  *
2500  *   spp_dscp        - This field is used in conjunction with the SPP_DSCP flag
2501  *                     and contains the DSCP.  The 6 most significant bits are
2502  *                     used for the DSCP.  This setting has precedence over any
2503  *                     IPv4- or IPv6- layer setting.
2504  */
2505 static int sctp_apply_peer_addr_params(struct sctp_paddrparams *params,
2506                                        struct sctp_transport   *trans,
2507                                        struct sctp_association *asoc,
2508                                        struct sctp_sock        *sp,
2509                                        int                      hb_change,
2510                                        int                      pmtud_change,
2511                                        int                      sackdelay_change)
2512 {
2513         int error;
2514
2515         if (params->spp_flags & SPP_HB_DEMAND && trans) {
2516                 struct net *net = sock_net(trans->asoc->base.sk);
2517
2518                 error = sctp_primitive_REQUESTHEARTBEAT(net, trans->asoc, trans);
2519                 if (error)
2520                         return error;
2521         }
2522
2523         /* Note that unless the spp_flag is set to SPP_HB_ENABLE the value of
2524          * this field is ignored.  Note also that a value of zero indicates
2525          * the current setting should be left unchanged.
2526          */
2527         if (params->spp_flags & SPP_HB_ENABLE) {
2528
2529                 /* Re-zero the interval if the SPP_HB_TIME_IS_ZERO is
2530                  * set.  This lets us use 0 value when this flag
2531                  * is set.
2532                  */
2533                 if (params->spp_flags & SPP_HB_TIME_IS_ZERO)
2534                         params->spp_hbinterval = 0;
2535
2536                 if (params->spp_hbinterval ||
2537                     (params->spp_flags & SPP_HB_TIME_IS_ZERO)) {
2538                         if (trans) {
2539                                 trans->hbinterval =
2540                                     msecs_to_jiffies(params->spp_hbinterval);
2541                         } else if (asoc) {
2542                                 asoc->hbinterval =
2543                                     msecs_to_jiffies(params->spp_hbinterval);
2544                         } else {
2545                                 sp->hbinterval = params->spp_hbinterval;
2546                         }
2547                 }
2548         }
2549
2550         if (hb_change) {
2551                 if (trans) {
2552                         trans->param_flags =
2553                                 (trans->param_flags & ~SPP_HB) | hb_change;
2554                 } else if (asoc) {
2555                         asoc->param_flags =
2556                                 (asoc->param_flags & ~SPP_HB) | hb_change;
2557                 } else {
2558                         sp->param_flags =
2559                                 (sp->param_flags & ~SPP_HB) | hb_change;
2560                 }
2561         }
2562
2563         /* When Path MTU discovery is disabled the value specified here will
2564          * be the "fixed" path mtu (i.e. the value of the spp_flags field must
2565          * include the flag SPP_PMTUD_DISABLE for this field to have any
2566          * effect).
2567          */
2568         if ((params->spp_flags & SPP_PMTUD_DISABLE) && params->spp_pathmtu) {
2569                 if (trans) {
2570                         trans->pathmtu = params->spp_pathmtu;
2571                         sctp_assoc_sync_pmtu(asoc);
2572                 } else if (asoc) {
2573                         sctp_assoc_set_pmtu(asoc, params->spp_pathmtu);
2574                 } else {
2575                         sp->pathmtu = params->spp_pathmtu;
2576                 }
2577         }
2578
2579         if (pmtud_change) {
2580                 if (trans) {
2581                         int update = (trans->param_flags & SPP_PMTUD_DISABLE) &&
2582                                 (params->spp_flags & SPP_PMTUD_ENABLE);
2583                         trans->param_flags =
2584                                 (trans->param_flags & ~SPP_PMTUD) | pmtud_change;
2585                         if (update) {
2586                                 sctp_transport_pmtu(trans, sctp_opt2sk(sp));
2587                                 sctp_assoc_sync_pmtu(asoc);
2588                         }
2589                 } else if (asoc) {
2590                         asoc->param_flags =
2591                                 (asoc->param_flags & ~SPP_PMTUD) | pmtud_change;
2592                 } else {
2593                         sp->param_flags =
2594                                 (sp->param_flags & ~SPP_PMTUD) | pmtud_change;
2595                 }
2596         }
2597
2598         /* Note that unless the spp_flag is set to SPP_SACKDELAY_ENABLE the
2599          * value of this field is ignored.  Note also that a value of zero
2600          * indicates the current setting should be left unchanged.
2601          */
2602         if ((params->spp_flags & SPP_SACKDELAY_ENABLE) && params->spp_sackdelay) {
2603                 if (trans) {
2604                         trans->sackdelay =
2605                                 msecs_to_jiffies(params->spp_sackdelay);
2606                 } else if (asoc) {
2607                         asoc->sackdelay =
2608                                 msecs_to_jiffies(params->spp_sackdelay);
2609                 } else {
2610                         sp->sackdelay = params->spp_sackdelay;
2611                 }
2612         }
2613
2614         if (sackdelay_change) {
2615                 if (trans) {
2616                         trans->param_flags =
2617                                 (trans->param_flags & ~SPP_SACKDELAY) |
2618                                 sackdelay_change;
2619                 } else if (asoc) {
2620                         asoc->param_flags =
2621                                 (asoc->param_flags & ~SPP_SACKDELAY) |
2622                                 sackdelay_change;
2623                 } else {
2624                         sp->param_flags =
2625                                 (sp->param_flags & ~SPP_SACKDELAY) |
2626                                 sackdelay_change;
2627                 }
2628         }
2629
2630         /* Note that a value of zero indicates the current setting should be
2631            left unchanged.
2632          */
2633         if (params->spp_pathmaxrxt) {
2634                 if (trans) {
2635                         trans->pathmaxrxt = params->spp_pathmaxrxt;
2636                 } else if (asoc) {
2637                         asoc->pathmaxrxt = params->spp_pathmaxrxt;
2638                 } else {
2639                         sp->pathmaxrxt = params->spp_pathmaxrxt;
2640                 }
2641         }
2642
2643         if (params->spp_flags & SPP_IPV6_FLOWLABEL) {
2644                 if (trans) {
2645                         if (trans->ipaddr.sa.sa_family == AF_INET6) {
2646                                 trans->flowlabel = params->spp_ipv6_flowlabel &
2647                                                    SCTP_FLOWLABEL_VAL_MASK;
2648                                 trans->flowlabel |= SCTP_FLOWLABEL_SET_MASK;
2649                         }
2650                 } else if (asoc) {
2651                         struct sctp_transport *t;
2652
2653                         list_for_each_entry(t, &asoc->peer.transport_addr_list,
2654                                             transports) {
2655                                 if (t->ipaddr.sa.sa_family != AF_INET6)
2656                                         continue;
2657                                 t->flowlabel = params->spp_ipv6_flowlabel &
2658                                                SCTP_FLOWLABEL_VAL_MASK;
2659                                 t->flowlabel |= SCTP_FLOWLABEL_SET_MASK;
2660                         }
2661                         asoc->flowlabel = params->spp_ipv6_flowlabel &
2662                                           SCTP_FLOWLABEL_VAL_MASK;
2663                         asoc->flowlabel |= SCTP_FLOWLABEL_SET_MASK;
2664                 } else if (sctp_opt2sk(sp)->sk_family == AF_INET6) {
2665                         sp->flowlabel = params->spp_ipv6_flowlabel &
2666                                         SCTP_FLOWLABEL_VAL_MASK;
2667                         sp->flowlabel |= SCTP_FLOWLABEL_SET_MASK;
2668                 }
2669         }
2670
2671         if (params->spp_flags & SPP_DSCP) {
2672                 if (trans) {
2673                         trans->dscp = params->spp_dscp & SCTP_DSCP_VAL_MASK;
2674                         trans->dscp |= SCTP_DSCP_SET_MASK;
2675                 } else if (asoc) {
2676                         struct sctp_transport *t;
2677
2678                         list_for_each_entry(t, &asoc->peer.transport_addr_list,
2679                                             transports) {
2680                                 t->dscp = params->spp_dscp &
2681                                           SCTP_DSCP_VAL_MASK;
2682                                 t->dscp |= SCTP_DSCP_SET_MASK;
2683                         }
2684                         asoc->dscp = params->spp_dscp & SCTP_DSCP_VAL_MASK;
2685                         asoc->dscp |= SCTP_DSCP_SET_MASK;
2686                 } else {
2687                         sp->dscp = params->spp_dscp & SCTP_DSCP_VAL_MASK;
2688                         sp->dscp |= SCTP_DSCP_SET_MASK;
2689                 }
2690         }
2691
2692         return 0;
2693 }
2694
2695 static int sctp_setsockopt_peer_addr_params(struct sock *sk,
2696                                             char __user *optval,
2697                                             unsigned int optlen)
2698 {
2699         struct sctp_paddrparams  params;
2700         struct sctp_transport   *trans = NULL;
2701         struct sctp_association *asoc = NULL;
2702         struct sctp_sock        *sp = sctp_sk(sk);
2703         int error;
2704         int hb_change, pmtud_change, sackdelay_change;
2705
2706         if (optlen == sizeof(params)) {
2707                 if (copy_from_user(&params, optval, optlen))
2708                         return -EFAULT;
2709         } else if (optlen == ALIGN(offsetof(struct sctp_paddrparams,
2710                                             spp_ipv6_flowlabel), 4)) {
2711                 if (copy_from_user(&params, optval, optlen))
2712                         return -EFAULT;
2713                 if (params.spp_flags & (SPP_DSCP | SPP_IPV6_FLOWLABEL))
2714                         return -EINVAL;
2715         } else {
2716                 return -EINVAL;
2717         }
2718
2719         /* Validate flags and value parameters. */
2720         hb_change        = params.spp_flags & SPP_HB;
2721         pmtud_change     = params.spp_flags & SPP_PMTUD;
2722         sackdelay_change = params.spp_flags & SPP_SACKDELAY;
2723
2724         if (hb_change        == SPP_HB ||
2725             pmtud_change     == SPP_PMTUD ||
2726             sackdelay_change == SPP_SACKDELAY ||
2727             params.spp_sackdelay > 500 ||
2728             (params.spp_pathmtu &&
2729              params.spp_pathmtu < SCTP_DEFAULT_MINSEGMENT))
2730                 return -EINVAL;
2731
2732         /* If an address other than INADDR_ANY is specified, and
2733          * no transport is found, then the request is invalid.
2734          */
2735         if (!sctp_is_any(sk, (union sctp_addr *)&params.spp_address)) {
2736                 trans = sctp_addr_id2transport(sk, &params.spp_address,
2737                                                params.spp_assoc_id);
2738                 if (!trans)
2739                         return -EINVAL;
2740         }
2741
2742         /* Get association, if assoc_id != 0 and the socket is a one
2743          * to many style socket, and an association was not found, then
2744          * the id was invalid.
2745          */
2746         asoc = sctp_id2assoc(sk, params.spp_assoc_id);
2747         if (!asoc && params.spp_assoc_id && sctp_style(sk, UDP))
2748                 return -EINVAL;
2749
2750         /* Heartbeat demand can only be sent on a transport or
2751          * association, but not a socket.
2752          */
2753         if (params.spp_flags & SPP_HB_DEMAND && !trans && !asoc)
2754                 return -EINVAL;
2755
2756         /* Process parameters. */
2757         error = sctp_apply_peer_addr_params(&params, trans, asoc, sp,
2758                                             hb_change, pmtud_change,
2759                                             sackdelay_change);
2760
2761         if (error)
2762                 return error;
2763
2764         /* If changes are for association, also apply parameters to each
2765          * transport.
2766          */
2767         if (!trans && asoc) {
2768                 list_for_each_entry(trans, &asoc->peer.transport_addr_list,
2769                                 transports) {
2770                         sctp_apply_peer_addr_params(&params, trans, asoc, sp,
2771                                                     hb_change, pmtud_change,
2772                                                     sackdelay_change);
2773                 }
2774         }
2775
2776         return 0;
2777 }
2778
2779 static inline __u32 sctp_spp_sackdelay_enable(__u32 param_flags)
2780 {
2781         return (param_flags & ~SPP_SACKDELAY) | SPP_SACKDELAY_ENABLE;
2782 }
2783
2784 static inline __u32 sctp_spp_sackdelay_disable(__u32 param_flags)
2785 {
2786         return (param_flags & ~SPP_SACKDELAY) | SPP_SACKDELAY_DISABLE;
2787 }
2788
2789 /*
2790  * 7.1.23.  Get or set delayed ack timer (SCTP_DELAYED_SACK)
2791  *
2792  * This option will effect the way delayed acks are performed.  This
2793  * option allows you to get or set the delayed ack time, in
2794  * milliseconds.  It also allows changing the delayed ack frequency.
2795  * Changing the frequency to 1 disables the delayed sack algorithm.  If
2796  * the assoc_id is 0, then this sets or gets the endpoints default
2797  * values.  If the assoc_id field is non-zero, then the set or get
2798  * effects the specified association for the one to many model (the
2799  * assoc_id field is ignored by the one to one model).  Note that if
2800  * sack_delay or sack_freq are 0 when setting this option, then the
2801  * current values will remain unchanged.
2802  *
2803  * struct sctp_sack_info {
2804  *     sctp_assoc_t            sack_assoc_id;
2805  *     uint32_t                sack_delay;
2806  *     uint32_t                sack_freq;
2807  * };
2808  *
2809  * sack_assoc_id -  This parameter, indicates which association the user
2810  *    is performing an action upon.  Note that if this field's value is
2811  *    zero then the endpoints default value is changed (effecting future
2812  *    associations only).
2813  *
2814  * sack_delay -  This parameter contains the number of milliseconds that
2815  *    the user is requesting the delayed ACK timer be set to.  Note that
2816  *    this value is defined in the standard to be between 200 and 500
2817  *    milliseconds.
2818  *
2819  * sack_freq -  This parameter contains the number of packets that must
2820  *    be received before a sack is sent without waiting for the delay
2821  *    timer to expire.  The default value for this is 2, setting this
2822  *    value to 1 will disable the delayed sack algorithm.
2823  */
2824
2825 static int sctp_setsockopt_delayed_ack(struct sock *sk,
2826                                        char __user *optval, unsigned int optlen)
2827 {
2828         struct sctp_sack_info    params;
2829         struct sctp_transport   *trans = NULL;
2830         struct sctp_association *asoc = NULL;
2831         struct sctp_sock        *sp = sctp_sk(sk);
2832
2833         if (optlen == sizeof(struct sctp_sack_info)) {
2834                 if (copy_from_user(&params, optval, optlen))
2835                         return -EFAULT;
2836
2837                 if (params.sack_delay == 0 && params.sack_freq == 0)
2838                         return 0;
2839         } else if (optlen == sizeof(struct sctp_assoc_value)) {
2840                 pr_warn_ratelimited(DEPRECATED
2841                                     "%s (pid %d) "
2842                                     "Use of struct sctp_assoc_value in delayed_ack socket option.\n"
2843                                     "Use struct sctp_sack_info instead\n",
2844                                     current->comm, task_pid_nr(current));
2845                 if (copy_from_user(&params, optval, optlen))
2846                         return -EFAULT;
2847
2848                 if (params.sack_delay == 0)
2849                         params.sack_freq = 1;
2850                 else
2851                         params.sack_freq = 0;
2852         } else
2853                 return -EINVAL;
2854
2855         /* Validate value parameter. */
2856         if (params.sack_delay > 500)
2857                 return -EINVAL;
2858
2859         /* Get association, if sack_assoc_id != 0 and the socket is a one
2860          * to many style socket, and an association was not found, then
2861          * the id was invalid.
2862          */
2863         asoc = sctp_id2assoc(sk, params.sack_assoc_id);
2864         if (!asoc && params.sack_assoc_id && sctp_style(sk, UDP))
2865                 return -EINVAL;
2866
2867         if (params.sack_delay) {
2868                 if (asoc) {
2869                         asoc->sackdelay =
2870                                 msecs_to_jiffies(params.sack_delay);
2871                         asoc->param_flags =
2872                                 sctp_spp_sackdelay_enable(asoc->param_flags);
2873                 } else {
2874                         sp->sackdelay = params.sack_delay;
2875                         sp->param_flags =
2876                                 sctp_spp_sackdelay_enable(sp->param_flags);
2877                 }
2878         }
2879
2880         if (params.sack_freq == 1) {
2881                 if (asoc) {
2882                         asoc->param_flags =
2883                                 sctp_spp_sackdelay_disable(asoc->param_flags);
2884                 } else {
2885                         sp->param_flags =
2886                                 sctp_spp_sackdelay_disable(sp->param_flags);
2887                 }
2888         } else if (params.sack_freq > 1) {
2889                 if (asoc) {
2890                         asoc->sackfreq = params.sack_freq;
2891                         asoc->param_flags =
2892                                 sctp_spp_sackdelay_enable(asoc->param_flags);
2893                 } else {
2894                         sp->sackfreq = params.sack_freq;
2895                         sp->param_flags =
2896                                 sctp_spp_sackdelay_enable(sp->param_flags);
2897                 }
2898         }
2899
2900         /* If change is for association, also apply to each transport. */
2901         if (asoc) {
2902                 list_for_each_entry(trans, &asoc->peer.transport_addr_list,
2903                                 transports) {
2904                         if (params.sack_delay) {
2905                                 trans->sackdelay =
2906                                         msecs_to_jiffies(params.sack_delay);
2907                                 trans->param_flags =
2908                                         sctp_spp_sackdelay_enable(trans->param_flags);
2909                         }
2910                         if (params.sack_freq == 1) {
2911                                 trans->param_flags =
2912                                         sctp_spp_sackdelay_disable(trans->param_flags);
2913                         } else if (params.sack_freq > 1) {
2914                                 trans->sackfreq = params.sack_freq;
2915                                 trans->param_flags =
2916                                         sctp_spp_sackdelay_enable(trans->param_flags);
2917                         }
2918                 }
2919         }
2920
2921         return 0;
2922 }
2923
2924 /* 7.1.3 Initialization Parameters (SCTP_INITMSG)
2925  *
2926  * Applications can specify protocol parameters for the default association
2927  * initialization.  The option name argument to setsockopt() and getsockopt()
2928  * is SCTP_INITMSG.
2929  *
2930  * Setting initialization parameters is effective only on an unconnected
2931  * socket (for UDP-style sockets only future associations are effected
2932  * by the change).  With TCP-style sockets, this option is inherited by
2933  * sockets derived from a listener socket.
2934  */
2935 static int sctp_setsockopt_initmsg(struct sock *sk, char __user *optval, unsigned int optlen)
2936 {
2937         struct sctp_initmsg sinit;
2938         struct sctp_sock *sp = sctp_sk(sk);
2939
2940         if (optlen != sizeof(struct sctp_initmsg))
2941                 return -EINVAL;
2942         if (copy_from_user(&sinit, optval, optlen))
2943                 return -EFAULT;
2944
2945         if (sinit.sinit_num_ostreams)
2946                 sp->initmsg.sinit_num_ostreams = sinit.sinit_num_ostreams;
2947         if (sinit.sinit_max_instreams)
2948                 sp->initmsg.sinit_max_instreams = sinit.sinit_max_instreams;
2949         if (sinit.sinit_max_attempts)
2950                 sp->initmsg.sinit_max_attempts = sinit.sinit_max_attempts;
2951         if (sinit.sinit_max_init_timeo)
2952                 sp->initmsg.sinit_max_init_timeo = sinit.sinit_max_init_timeo;
2953
2954         return 0;
2955 }
2956
2957 /*
2958  * 7.1.14 Set default send parameters (SCTP_DEFAULT_SEND_PARAM)
2959  *
2960  *   Applications that wish to use the sendto() system call may wish to
2961  *   specify a default set of parameters that would normally be supplied
2962  *   through the inclusion of ancillary data.  This socket option allows
2963  *   such an application to set the default sctp_sndrcvinfo structure.
2964  *   The application that wishes to use this socket option simply passes
2965  *   in to this call the sctp_sndrcvinfo structure defined in Section
2966  *   5.2.2) The input parameters accepted by this call include
2967  *   sinfo_stream, sinfo_flags, sinfo_ppid, sinfo_context,
2968  *   sinfo_timetolive.  The user must provide the sinfo_assoc_id field in
2969  *   to this call if the caller is using the UDP model.
2970  */
2971 static int sctp_setsockopt_default_send_param(struct sock *sk,
2972                                               char __user *optval,
2973                                               unsigned int optlen)
2974 {
2975         struct sctp_sock *sp = sctp_sk(sk);
2976         struct sctp_association *asoc;
2977         struct sctp_sndrcvinfo info;
2978
2979         if (optlen != sizeof(info))
2980                 return -EINVAL;
2981         if (copy_from_user(&info, optval, optlen))
2982                 return -EFAULT;
2983         if (info.sinfo_flags &
2984             ~(SCTP_UNORDERED | SCTP_ADDR_OVER |
2985               SCTP_ABORT | SCTP_EOF))
2986                 return -EINVAL;
2987
2988         asoc = sctp_id2assoc(sk, info.sinfo_assoc_id);
2989         if (!asoc && info.sinfo_assoc_id && sctp_style(sk, UDP))
2990                 return -EINVAL;
2991         if (asoc) {
2992                 asoc->default_stream = info.sinfo_stream;
2993                 asoc->default_flags = info.sinfo_flags;
2994                 asoc->default_ppid = info.sinfo_ppid;
2995                 asoc->default_context = info.sinfo_context;
2996                 asoc->default_timetolive = info.sinfo_timetolive;
2997         } else {
2998                 sp->default_stream = info.sinfo_stream;
2999                 sp->default_flags = info.sinfo_flags;
3000                 sp->default_ppid = info.sinfo_ppid;
3001                 sp->default_context = info.sinfo_context;
3002                 sp->default_timetolive = info.sinfo_timetolive;
3003         }
3004
3005         return 0;
3006 }
3007
3008 /* RFC6458, Section 8.1.31. Set/get Default Send Parameters
3009  * (SCTP_DEFAULT_SNDINFO)
3010  */
3011 static int sctp_setsockopt_default_sndinfo(struct sock *sk,
3012                                            char __user *optval,
3013                                            unsigned int optlen)
3014 {
3015         struct sctp_sock *sp = sctp_sk(sk);
3016         struct sctp_association *asoc;
3017         struct sctp_sndinfo info;
3018
3019         if (optlen != sizeof(info))
3020                 return -EINVAL;
3021         if (copy_from_user(&info, optval, optlen))
3022                 return -EFAULT;
3023         if (info.snd_flags &
3024             ~(SCTP_UNORDERED | SCTP_ADDR_OVER |
3025               SCTP_ABORT | SCTP_EOF))
3026                 return -EINVAL;
3027
3028         asoc = sctp_id2assoc(sk, info.snd_assoc_id);
3029         if (!asoc && info.snd_assoc_id && sctp_style(sk, UDP))
3030                 return -EINVAL;
3031         if (asoc) {
3032                 asoc->default_stream = info.snd_sid;
3033                 asoc->default_flags = info.snd_flags;
3034                 asoc->default_ppid = info.snd_ppid;
3035                 asoc->default_context = info.snd_context;
3036         } else {
3037                 sp->default_stream = info.snd_sid;
3038                 sp->default_flags = info.snd_flags;
3039                 sp->default_ppid = info.snd_ppid;
3040                 sp->default_context = info.snd_context;
3041         }
3042
3043         return 0;
3044 }
3045
3046 /* 7.1.10 Set Primary Address (SCTP_PRIMARY_ADDR)
3047  *
3048  * Requests that the local SCTP stack use the enclosed peer address as
3049  * the association primary.  The enclosed address must be one of the
3050  * association peer's addresses.
3051  */
3052 static int sctp_setsockopt_primary_addr(struct sock *sk, char __user *optval,
3053                                         unsigned int optlen)
3054 {
3055         struct sctp_prim prim;
3056         struct sctp_transport *trans;
3057         struct sctp_af *af;
3058         int err;
3059
3060         if (optlen != sizeof(struct sctp_prim))
3061                 return -EINVAL;
3062
3063         if (copy_from_user(&prim, optval, sizeof(struct sctp_prim)))
3064                 return -EFAULT;
3065
3066         /* Allow security module to validate address but need address len. */
3067         af = sctp_get_af_specific(prim.ssp_addr.ss_family);
3068         if (!af)
3069                 return -EINVAL;
3070
3071         err = security_sctp_bind_connect(sk, SCTP_PRIMARY_ADDR,
3072                                          (struct sockaddr *)&prim.ssp_addr,
3073                                          af->sockaddr_len);
3074         if (err)
3075                 return err;
3076
3077         trans = sctp_addr_id2transport(sk, &prim.ssp_addr, prim.ssp_assoc_id);
3078         if (!trans)
3079                 return -EINVAL;
3080
3081         sctp_assoc_set_primary(trans->asoc, trans);
3082
3083         return 0;
3084 }
3085
3086 /*
3087  * 7.1.5 SCTP_NODELAY
3088  *
3089  * Turn on/off any Nagle-like algorithm.  This means that packets are
3090  * generally sent as soon as possible and no unnecessary delays are
3091  * introduced, at the cost of more packets in the network.  Expects an
3092  *  integer boolean flag.
3093  */
3094 static int sctp_setsockopt_nodelay(struct sock *sk, char __user *optval,
3095                                    unsigned int optlen)
3096 {
3097         int val;
3098
3099         if (optlen < sizeof(int))
3100                 return -EINVAL;
3101         if (get_user(val, (int __user *)optval))
3102                 return -EFAULT;
3103
3104         sctp_sk(sk)->nodelay = (val == 0) ? 0 : 1;
3105         return 0;
3106 }
3107
3108 /*
3109  *
3110  * 7.1.1 SCTP_RTOINFO
3111  *
3112  * The protocol parameters used to initialize and bound retransmission
3113  * timeout (RTO) are tunable. sctp_rtoinfo structure is used to access
3114  * and modify these parameters.
3115  * All parameters are time values, in milliseconds.  A value of 0, when
3116  * modifying the parameters, indicates that the current value should not
3117  * be changed.
3118  *
3119  */
3120 static int sctp_setsockopt_rtoinfo(struct sock *sk, char __user *optval, unsigned int optlen)
3121 {
3122         struct sctp_rtoinfo rtoinfo;
3123         struct sctp_association *asoc;
3124         unsigned long rto_min, rto_max;
3125         struct sctp_sock *sp = sctp_sk(sk);
3126
3127         if (optlen != sizeof (struct sctp_rtoinfo))
3128                 return -EINVAL;
3129
3130         if (copy_from_user(&rtoinfo, optval, optlen))
3131                 return -EFAULT;
3132
3133         asoc = sctp_id2assoc(sk, rtoinfo.srto_assoc_id);
3134
3135         /* Set the values to the specific association */
3136         if (!asoc && rtoinfo.srto_assoc_id && sctp_style(sk, UDP))
3137                 return -EINVAL;
3138
3139         rto_max = rtoinfo.srto_max;
3140         rto_min = rtoinfo.srto_min;
3141
3142         if (rto_max)
3143                 rto_max = asoc ? msecs_to_jiffies(rto_max) : rto_max;
3144         else
3145                 rto_max = asoc ? asoc->rto_max : sp->rtoinfo.srto_max;
3146
3147         if (rto_min)
3148                 rto_min = asoc ? msecs_to_jiffies(rto_min) : rto_min;
3149         else
3150                 rto_min = asoc ? asoc->rto_min : sp->rtoinfo.srto_min;
3151
3152         if (rto_min > rto_max)
3153                 return -EINVAL;
3154
3155         if (asoc) {
3156                 if (rtoinfo.srto_initial != 0)
3157                         asoc->rto_initial =
3158                                 msecs_to_jiffies(rtoinfo.srto_initial);
3159                 asoc->rto_max = rto_max;
3160                 asoc->rto_min = rto_min;
3161         } else {
3162                 /* If there is no association or the association-id = 0
3163                  * set the values to the endpoint.
3164                  */
3165                 if (rtoinfo.srto_initial != 0)
3166                         sp->rtoinfo.srto_initial = rtoinfo.srto_initial;
3167                 sp->rtoinfo.srto_max = rto_max;
3168                 sp->rtoinfo.srto_min = rto_min;
3169         }
3170
3171         return 0;
3172 }
3173
3174 /*
3175  *
3176  * 7.1.2 SCTP_ASSOCINFO
3177  *
3178  * This option is used to tune the maximum retransmission attempts
3179  * of the association.
3180  * Returns an error if the new association retransmission value is
3181  * greater than the sum of the retransmission value  of the peer.
3182  * See [SCTP] for more information.
3183  *
3184  */
3185 static int sctp_setsockopt_associnfo(struct sock *sk, char __user *optval, unsigned int optlen)
3186 {
3187
3188         struct sctp_assocparams assocparams;
3189         struct sctp_association *asoc;
3190
3191         if (optlen != sizeof(struct sctp_assocparams))
3192                 return -EINVAL;
3193         if (copy_from_user(&assocparams, optval, optlen))
3194                 return -EFAULT;
3195
3196         asoc = sctp_id2assoc(sk, assocparams.sasoc_assoc_id);
3197
3198         if (!asoc && assocparams.sasoc_assoc_id && sctp_style(sk, UDP))
3199                 return -EINVAL;
3200
3201         /* Set the values to the specific association */
3202         if (asoc) {
3203                 if (assocparams.sasoc_asocmaxrxt != 0) {
3204                         __u32 path_sum = 0;
3205                         int   paths = 0;
3206                         struct sctp_transport *peer_addr;
3207
3208                         list_for_each_entry(peer_addr, &asoc->peer.transport_addr_list,
3209                                         transports) {
3210                                 path_sum += peer_addr->pathmaxrxt;
3211                                 paths++;
3212                         }
3213
3214                         /* Only validate asocmaxrxt if we have more than
3215                          * one path/transport.  We do this because path
3216                          * retransmissions are only counted when we have more
3217                          * then one path.
3218                          */
3219                         if (paths > 1 &&
3220                             assocparams.sasoc_asocmaxrxt > path_sum)
3221                                 return -EINVAL;
3222
3223                         asoc->max_retrans = assocparams.sasoc_asocmaxrxt;
3224                 }
3225
3226                 if (assocparams.sasoc_cookie_life != 0)
3227                         asoc->cookie_life = ms_to_ktime(assocparams.sasoc_cookie_life);
3228         } else {
3229                 /* Set the values to the endpoint */
3230                 struct sctp_sock *sp = sctp_sk(sk);
3231
3232                 if (assocparams.sasoc_asocmaxrxt != 0)
3233                         sp->assocparams.sasoc_asocmaxrxt =
3234                                                 assocparams.sasoc_asocmaxrxt;
3235                 if (assocparams.sasoc_cookie_life != 0)
3236                         sp->assocparams.sasoc_cookie_life =
3237                                                 assocparams.sasoc_cookie_life;
3238         }
3239         return 0;
3240 }
3241
3242 /*
3243  * 7.1.16 Set/clear IPv4 mapped addresses (SCTP_I_WANT_MAPPED_V4_ADDR)
3244  *
3245  * This socket option is a boolean flag which turns on or off mapped V4
3246  * addresses.  If this option is turned on and the socket is type
3247  * PF_INET6, then IPv4 addresses will be mapped to V6 representation.
3248  * If this option is turned off, then no mapping will be done of V4
3249  * addresses and a user will receive both PF_INET6 and PF_INET type
3250  * addresses on the socket.
3251  */
3252 static int sctp_setsockopt_mappedv4(struct sock *sk, char __user *optval, unsigned int optlen)
3253 {
3254         int val;
3255         struct sctp_sock *sp = sctp_sk(sk);
3256
3257         if (optlen < sizeof(int))
3258                 return -EINVAL;
3259         if (get_user(val, (int __user *)optval))
3260                 return -EFAULT;
3261         if (val)
3262                 sp->v4mapped = 1;
3263         else
3264                 sp->v4mapped = 0;
3265
3266         return 0;
3267 }
3268
3269 /*
3270  * 8.1.16.  Get or Set the Maximum Fragmentation Size (SCTP_MAXSEG)
3271  * This option will get or set the maximum size to put in any outgoing
3272  * SCTP DATA chunk.  If a message is larger than this size it will be
3273  * fragmented by SCTP into the specified size.  Note that the underlying
3274  * SCTP implementation may fragment into smaller sized chunks when the
3275  * PMTU of the underlying association is smaller than the value set by
3276  * the user.  The default value for this option is '0' which indicates
3277  * the user is NOT limiting fragmentation and only the PMTU will effect
3278  * SCTP's choice of DATA chunk size.  Note also that values set larger
3279  * than the maximum size of an IP datagram will effectively let SCTP
3280  * control fragmentation (i.e. the same as setting this option to 0).
3281  *
3282  * The following structure is used to access and modify this parameter:
3283  *
3284  * struct sctp_assoc_value {
3285  *   sctp_assoc_t assoc_id;
3286  *   uint32_t assoc_value;
3287  * };
3288  *
3289  * assoc_id:  This parameter is ignored for one-to-one style sockets.
3290  *    For one-to-many style sockets this parameter indicates which
3291  *    association the user is performing an action upon.  Note that if
3292  *    this field's value is zero then the endpoints default value is
3293  *    changed (effecting future associations only).
3294  * assoc_value:  This parameter specifies the maximum size in bytes.
3295  */
3296 static int sctp_setsockopt_maxseg(struct sock *sk, char __user *optval, unsigned int optlen)
3297 {
3298         struct sctp_sock *sp = sctp_sk(sk);
3299         struct sctp_assoc_value params;
3300         struct sctp_association *asoc;
3301         int val;
3302
3303         if (optlen == sizeof(int)) {
3304                 pr_warn_ratelimited(DEPRECATED
3305                                     "%s (pid %d) "
3306                                     "Use of int in maxseg socket option.\n"
3307                                     "Use struct sctp_assoc_value instead\n",
3308                                     current->comm, task_pid_nr(current));
3309                 if (copy_from_user(&val, optval, optlen))
3310                         return -EFAULT;
3311                 params.assoc_id = 0;
3312         } else if (optlen == sizeof(struct sctp_assoc_value)) {
3313                 if (copy_from_user(&params, optval, optlen))
3314                         return -EFAULT;
3315                 val = params.assoc_value;
3316         } else {
3317                 return -EINVAL;
3318         }
3319
3320         asoc = sctp_id2assoc(sk, params.assoc_id);
3321
3322         if (val) {
3323                 int min_len, max_len;
3324                 __u16 datasize = asoc ? sctp_datachk_len(&asoc->stream) :
3325                                  sizeof(struct sctp_data_chunk);
3326
3327                 min_len = sctp_mtu_payload(sp, SCTP_DEFAULT_MINSEGMENT,
3328                                            datasize);
3329                 max_len = SCTP_MAX_CHUNK_LEN - datasize;
3330
3331                 if (val < min_len || val > max_len)
3332                         return -EINVAL;
3333         }
3334
3335         if (asoc) {
3336                 asoc->user_frag = val;
3337                 sctp_assoc_update_frag_point(asoc);
3338         } else {
3339                 if (params.assoc_id && sctp_style(sk, UDP))
3340                         return -EINVAL;
3341                 sp->user_frag = val;
3342         }
3343
3344         return 0;
3345 }
3346
3347
3348 /*
3349  *  7.1.9 Set Peer Primary Address (SCTP_SET_PEER_PRIMARY_ADDR)
3350  *
3351  *   Requests that the peer mark the enclosed address as the association
3352  *   primary. The enclosed address must be one of the association's
3353  *   locally bound addresses. The following structure is used to make a
3354  *   set primary request:
3355  */
3356 static int sctp_setsockopt_peer_primary_addr(struct sock *sk, char __user *optval,
3357                                              unsigned int optlen)
3358 {
3359         struct net *net = sock_net(sk);
3360         struct sctp_sock        *sp;
3361         struct sctp_association *asoc = NULL;
3362         struct sctp_setpeerprim prim;
3363         struct sctp_chunk       *chunk;
3364         struct sctp_af          *af;
3365         int                     err;
3366
3367         sp = sctp_sk(sk);
3368
3369         if (!net->sctp.addip_enable)
3370                 return -EPERM;
3371
3372         if (optlen != sizeof(struct sctp_setpeerprim))
3373                 return -EINVAL;
3374
3375         if (copy_from_user(&prim, optval, optlen))
3376                 return -EFAULT;
3377
3378         asoc = sctp_id2assoc(sk, prim.sspp_assoc_id);
3379         if (!asoc)
3380                 return -EINVAL;
3381
3382         if (!asoc->peer.asconf_capable)
3383                 return -EPERM;
3384
3385         if (asoc->peer.addip_disabled_mask & SCTP_PARAM_SET_PRIMARY)
3386                 return -EPERM;
3387
3388         if (!sctp_state(asoc, ESTABLISHED))
3389                 return -ENOTCONN;
3390
3391         af = sctp_get_af_specific(prim.sspp_addr.ss_family);
3392         if (!af)
3393                 return -EINVAL;
3394
3395         if (!af->addr_valid((union sctp_addr *)&prim.sspp_addr, sp, NULL))
3396                 return -EADDRNOTAVAIL;
3397
3398         if (!sctp_assoc_lookup_laddr(asoc, (union sctp_addr *)&prim.sspp_addr))
3399                 return -EADDRNOTAVAIL;
3400
3401         /* Allow security module to validate address. */
3402         err = security_sctp_bind_connect(sk, SCTP_SET_PEER_PRIMARY_ADDR,
3403                                          (struct sockaddr *)&prim.sspp_addr,
3404                                          af->sockaddr_len);
3405         if (err)
3406                 return err;
3407
3408         /* Create an ASCONF chunk with SET_PRIMARY parameter    */
3409         chunk = sctp_make_asconf_set_prim(asoc,
3410                                           (union sctp_addr *)&prim.sspp_addr);
3411         if (!chunk)
3412                 return -ENOMEM;
3413
3414         err = sctp_send_asconf(asoc, chunk);
3415
3416         pr_debug("%s: we set peer primary addr primitively\n", __func__);
3417
3418         return err;
3419 }
3420
3421 static int sctp_setsockopt_adaptation_layer(struct sock *sk, char __user *optval,
3422                                             unsigned int optlen)
3423 {
3424         struct sctp_setadaptation adaptation;
3425
3426         if (optlen != sizeof(struct sctp_setadaptation))
3427                 return -EINVAL;
3428         if (copy_from_user(&adaptation, optval, optlen))
3429                 return -EFAULT;
3430
3431         sctp_sk(sk)->adaptation_ind = adaptation.ssb_adaptation_ind;
3432
3433         return 0;
3434 }
3435
3436 /*
3437  * 7.1.29.  Set or Get the default context (SCTP_CONTEXT)
3438  *
3439  * The context field in the sctp_sndrcvinfo structure is normally only
3440  * used when a failed message is retrieved holding the value that was
3441  * sent down on the actual send call.  This option allows the setting of
3442  * a default context on an association basis that will be received on
3443  * reading messages from the peer.  This is especially helpful in the
3444  * one-2-many model for an application to keep some reference to an
3445  * internal state machine that is processing messages on the
3446  * association.  Note that the setting of this value only effects
3447  * received messages from the peer and does not effect the value that is
3448  * saved with outbound messages.
3449  */
3450 static int sctp_setsockopt_context(struct sock *sk, char __user *optval,
3451                                    unsigned int optlen)
3452 {
3453         struct sctp_assoc_value params;
3454         struct sctp_sock *sp;
3455         struct sctp_association *asoc;
3456
3457         if (optlen != sizeof(struct sctp_assoc_value))
3458                 return -EINVAL;
3459         if (copy_from_user(&params, optval, optlen))
3460                 return -EFAULT;
3461
3462         sp = sctp_sk(sk);
3463
3464         if (params.assoc_id != 0) {
3465                 asoc = sctp_id2assoc(sk, params.assoc_id);
3466                 if (!asoc)
3467                         return -EINVAL;
3468                 asoc->default_rcv_context = params.assoc_value;
3469         } else {
3470                 sp->default_rcv_context = params.assoc_value;
3471         }
3472
3473         return 0;
3474 }
3475
3476 /*
3477  * 7.1.24.  Get or set fragmented interleave (SCTP_FRAGMENT_INTERLEAVE)
3478  *
3479  * This options will at a minimum specify if the implementation is doing
3480  * fragmented interleave.  Fragmented interleave, for a one to many
3481  * socket, is when subsequent calls to receive a message may return
3482  * parts of messages from different associations.  Some implementations
3483  * may allow you to turn this value on or off.  If so, when turned off,
3484  * no fragment interleave will occur (which will cause a head of line
3485  * blocking amongst multiple associations sharing the same one to many
3486  * socket).  When this option is turned on, then each receive call may
3487  * come from a different association (thus the user must receive data
3488  * with the extended calls (e.g. sctp_recvmsg) to keep track of which
3489  * association each receive belongs to.
3490  *
3491  * This option takes a boolean value.  A non-zero value indicates that
3492  * fragmented interleave is on.  A value of zero indicates that
3493  * fragmented interleave is off.
3494  *
3495  * Note that it is important that an implementation that allows this
3496  * option to be turned on, have it off by default.  Otherwise an unaware
3497  * application using the one to many model may become confused and act
3498  * incorrectly.
3499  */
3500 static int sctp_setsockopt_fragment_interleave(struct sock *sk,
3501                                                char __user *optval,
3502                                                unsigned int optlen)
3503 {
3504         int val;
3505
3506         if (optlen != sizeof(int))
3507                 return -EINVAL;
3508         if (get_user(val, (int __user *)optval))
3509                 return -EFAULT;
3510
3511         sctp_sk(sk)->frag_interleave = !!val;
3512
3513         if (!sctp_sk(sk)->frag_interleave)
3514                 sctp_sk(sk)->strm_interleave = 0;
3515
3516         return 0;
3517 }
3518
3519 /*
3520  * 8.1.21.  Set or Get the SCTP Partial Delivery Point
3521  *       (SCTP_PARTIAL_DELIVERY_POINT)
3522  *
3523  * This option will set or get the SCTP partial delivery point.  This
3524  * point is the size of a message where the partial delivery API will be
3525  * invoked to help free up rwnd space for the peer.  Setting this to a
3526  * lower value will cause partial deliveries to happen more often.  The
3527  * calls argument is an integer that sets or gets the partial delivery
3528  * point.  Note also that the call will fail if the user attempts to set
3529  * this value larger than the socket receive buffer size.
3530  *
3531  * Note that any single message having a length smaller than or equal to
3532  * the SCTP partial delivery point will be delivered in one single read
3533  * call as long as the user provided buffer is large enough to hold the
3534  * message.
3535  */
3536 static int sctp_setsockopt_partial_delivery_point(struct sock *sk,
3537                                                   char __user *optval,
3538                                                   unsigned int optlen)
3539 {
3540         u32 val;
3541
3542         if (optlen != sizeof(u32))
3543                 return -EINVAL;
3544         if (get_user(val, (int __user *)optval))
3545                 return -EFAULT;
3546
3547         /* Note: We double the receive buffer from what the user sets
3548          * it to be, also initial rwnd is based on rcvbuf/2.
3549          */
3550         if (val > (sk->sk_rcvbuf >> 1))
3551                 return -EINVAL;
3552
3553         sctp_sk(sk)->pd_point = val;
3554
3555         return 0; /* is this the right error code? */
3556 }
3557
3558 /*
3559  * 7.1.28.  Set or Get the maximum burst (SCTP_MAX_BURST)
3560  *
3561  * This option will allow a user to change the maximum burst of packets
3562  * that can be emitted by this association.  Note that the default value
3563  * is 4, and some implementations may restrict this setting so that it
3564  * can only be lowered.
3565  *
3566  * NOTE: This text doesn't seem right.  Do this on a socket basis with
3567  * future associations inheriting the socket value.
3568  */
3569 static int sctp_setsockopt_maxburst(struct sock *sk,
3570                                     char __user *optval,
3571                                     unsigned int optlen)
3572 {
3573         struct sctp_assoc_value params;
3574         struct sctp_sock *sp;
3575         struct sctp_association *asoc;
3576         int val;
3577         int assoc_id = 0;
3578
3579         if (optlen == sizeof(int)) {
3580                 pr_warn_ratelimited(DEPRECATED
3581                                     "%s (pid %d) "
3582                                     "Use of int in max_burst socket option deprecated.\n"
3583                                     "Use struct sctp_assoc_value instead\n",
3584                                     current->comm, task_pid_nr(current));
3585                 if (copy_from_user(&val, optval, optlen))
3586                         return -EFAULT;
3587         } else if (optlen == sizeof(struct sctp_assoc_value)) {
3588                 if (copy_from_user(&params, optval, optlen))
3589                         return -EFAULT;
3590                 val = params.assoc_value;
3591                 assoc_id = params.assoc_id;
3592         } else
3593                 return -EINVAL;
3594
3595         sp = sctp_sk(sk);
3596
3597         if (assoc_id != 0) {
3598                 asoc = sctp_id2assoc(sk, assoc_id);
3599                 if (!asoc)
3600                         return -EINVAL;
3601                 asoc->max_burst = val;
3602         } else
3603                 sp->max_burst = val;
3604
3605         return 0;
3606 }
3607
3608 /*
3609  * 7.1.18.  Add a chunk that must be authenticated (SCTP_AUTH_CHUNK)
3610  *
3611  * This set option adds a chunk type that the user is requesting to be
3612  * received only in an authenticated way.  Changes to the list of chunks
3613  * will only effect future associations on the socket.
3614  */
3615 static int sctp_setsockopt_auth_chunk(struct sock *sk,
3616                                       char __user *optval,
3617                                       unsigned int optlen)
3618 {
3619         struct sctp_endpoint *ep = sctp_sk(sk)->ep;
3620         struct sctp_authchunk val;
3621
3622         if (!ep->auth_enable)
3623                 return -EACCES;
3624
3625         if (optlen != sizeof(struct sctp_authchunk))
3626                 return -EINVAL;
3627         if (copy_from_user(&val, optval, optlen))
3628                 return -EFAULT;
3629
3630         switch (val.sauth_chunk) {
3631         case SCTP_CID_INIT:
3632         case SCTP_CID_INIT_ACK:
3633         case SCTP_CID_SHUTDOWN_COMPLETE:
3634         case SCTP_CID_AUTH:
3635                 return -EINVAL;
3636         }
3637
3638         /* add this chunk id to the endpoint */
3639         return sctp_auth_ep_add_chunkid(ep, val.sauth_chunk);
3640 }
3641
3642 /*
3643  * 7.1.19.  Get or set the list of supported HMAC Identifiers (SCTP_HMAC_IDENT)
3644  *
3645  * This option gets or sets the list of HMAC algorithms that the local
3646  * endpoint requires the peer to use.