Merge tag 'kvm-ppc-next-5.2-2' of git://git.kernel.org/pub/scm/linux/kernel/git/paulu...
[sfrench/cifs-2.6.git] / net / sctp / socket.c
1 /* SCTP kernel implementation
2  * (C) Copyright IBM Corp. 2001, 2004
3  * Copyright (c) 1999-2000 Cisco, Inc.
4  * Copyright (c) 1999-2001 Motorola, Inc.
5  * Copyright (c) 2001-2003 Intel Corp.
6  * Copyright (c) 2001-2002 Nokia, Inc.
7  * Copyright (c) 2001 La Monte H.P. Yarroll
8  *
9  * This file is part of the SCTP kernel implementation
10  *
11  * These functions interface with the sockets layer to implement the
12  * SCTP Extensions for the Sockets API.
13  *
14  * Note that the descriptions from the specification are USER level
15  * functions--this file is the functions which populate the struct proto
16  * for SCTP which is the BOTTOM of the sockets interface.
17  *
18  * This SCTP implementation is free software;
19  * you can redistribute it and/or modify it under the terms of
20  * the GNU General Public License as published by
21  * the Free Software Foundation; either version 2, or (at your option)
22  * any later version.
23  *
24  * This SCTP implementation is distributed in the hope that it
25  * will be useful, but WITHOUT ANY WARRANTY; without even the implied
26  *                 ************************
27  * warranty of MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.
28  * See the GNU General Public License for more details.
29  *
30  * You should have received a copy of the GNU General Public License
31  * along with GNU CC; see the file COPYING.  If not, see
32  * <http://www.gnu.org/licenses/>.
33  *
34  * Please send any bug reports or fixes you make to the
35  * email address(es):
36  *    lksctp developers <linux-sctp@vger.kernel.org>
37  *
38  * Written or modified by:
39  *    La Monte H.P. Yarroll <piggy@acm.org>
40  *    Narasimha Budihal     <narsi@refcode.org>
41  *    Karl Knutson          <karl@athena.chicago.il.us>
42  *    Jon Grimm             <jgrimm@us.ibm.com>
43  *    Xingang Guo           <xingang.guo@intel.com>
44  *    Daisy Chang           <daisyc@us.ibm.com>
45  *    Sridhar Samudrala     <samudrala@us.ibm.com>
46  *    Inaky Perez-Gonzalez  <inaky.gonzalez@intel.com>
47  *    Ardelle Fan           <ardelle.fan@intel.com>
48  *    Ryan Layer            <rmlayer@us.ibm.com>
49  *    Anup Pemmaiah         <pemmaiah@cc.usu.edu>
50  *    Kevin Gao             <kevin.gao@intel.com>
51  */
52
53 #define pr_fmt(fmt) KBUILD_MODNAME ": " fmt
54
55 #include <crypto/hash.h>
56 #include <linux/types.h>
57 #include <linux/kernel.h>
58 #include <linux/wait.h>
59 #include <linux/time.h>
60 #include <linux/sched/signal.h>
61 #include <linux/ip.h>
62 #include <linux/capability.h>
63 #include <linux/fcntl.h>
64 #include <linux/poll.h>
65 #include <linux/init.h>
66 #include <linux/slab.h>
67 #include <linux/file.h>
68 #include <linux/compat.h>
69 #include <linux/rhashtable.h>
70
71 #include <net/ip.h>
72 #include <net/icmp.h>
73 #include <net/route.h>
74 #include <net/ipv6.h>
75 #include <net/inet_common.h>
76 #include <net/busy_poll.h>
77
78 #include <linux/socket.h> /* for sa_family_t */
79 #include <linux/export.h>
80 #include <net/sock.h>
81 #include <net/sctp/sctp.h>
82 #include <net/sctp/sm.h>
83 #include <net/sctp/stream_sched.h>
84
85 /* Forward declarations for internal helper functions. */
86 static bool sctp_writeable(struct sock *sk);
87 static void sctp_wfree(struct sk_buff *skb);
88 static int sctp_wait_for_sndbuf(struct sctp_association *asoc, long *timeo_p,
89                                 size_t msg_len);
90 static int sctp_wait_for_packet(struct sock *sk, int *err, long *timeo_p);
91 static int sctp_wait_for_connect(struct sctp_association *, long *timeo_p);
92 static int sctp_wait_for_accept(struct sock *sk, long timeo);
93 static void sctp_wait_for_close(struct sock *sk, long timeo);
94 static void sctp_destruct_sock(struct sock *sk);
95 static struct sctp_af *sctp_sockaddr_af(struct sctp_sock *opt,
96                                         union sctp_addr *addr, int len);
97 static int sctp_bindx_add(struct sock *, struct sockaddr *, int);
98 static int sctp_bindx_rem(struct sock *, struct sockaddr *, int);
99 static int sctp_send_asconf_add_ip(struct sock *, struct sockaddr *, int);
100 static int sctp_send_asconf_del_ip(struct sock *, struct sockaddr *, int);
101 static int sctp_send_asconf(struct sctp_association *asoc,
102                             struct sctp_chunk *chunk);
103 static int sctp_do_bind(struct sock *, union sctp_addr *, int);
104 static int sctp_autobind(struct sock *sk);
105 static int sctp_sock_migrate(struct sock *oldsk, struct sock *newsk,
106                              struct sctp_association *assoc,
107                              enum sctp_socket_type type);
108
109 static unsigned long sctp_memory_pressure;
110 static atomic_long_t sctp_memory_allocated;
111 struct percpu_counter sctp_sockets_allocated;
112
113 static void sctp_enter_memory_pressure(struct sock *sk)
114 {
115         sctp_memory_pressure = 1;
116 }
117
118
119 /* Get the sndbuf space available at the time on the association.  */
120 static inline int sctp_wspace(struct sctp_association *asoc)
121 {
122         struct sock *sk = asoc->base.sk;
123
124         return asoc->ep->sndbuf_policy ? sk->sk_sndbuf - asoc->sndbuf_used
125                                        : sk_stream_wspace(sk);
126 }
127
128 /* Increment the used sndbuf space count of the corresponding association by
129  * the size of the outgoing data chunk.
130  * Also, set the skb destructor for sndbuf accounting later.
131  *
132  * Since it is always 1-1 between chunk and skb, and also a new skb is always
133  * allocated for chunk bundling in sctp_packet_transmit(), we can use the
134  * destructor in the data chunk skb for the purpose of the sndbuf space
135  * tracking.
136  */
137 static inline void sctp_set_owner_w(struct sctp_chunk *chunk)
138 {
139         struct sctp_association *asoc = chunk->asoc;
140         struct sock *sk = asoc->base.sk;
141
142         /* The sndbuf space is tracked per association.  */
143         sctp_association_hold(asoc);
144
145         if (chunk->shkey)
146                 sctp_auth_shkey_hold(chunk->shkey);
147
148         skb_set_owner_w(chunk->skb, sk);
149
150         chunk->skb->destructor = sctp_wfree;
151         /* Save the chunk pointer in skb for sctp_wfree to use later.  */
152         skb_shinfo(chunk->skb)->destructor_arg = chunk;
153
154         refcount_add(sizeof(struct sctp_chunk), &sk->sk_wmem_alloc);
155         asoc->sndbuf_used += chunk->skb->truesize + sizeof(struct sctp_chunk);
156         sk->sk_wmem_queued += chunk->skb->truesize + sizeof(struct sctp_chunk);
157         sk_mem_charge(sk, chunk->skb->truesize);
158 }
159
160 static void sctp_clear_owner_w(struct sctp_chunk *chunk)
161 {
162         skb_orphan(chunk->skb);
163 }
164
165 static void sctp_for_each_tx_datachunk(struct sctp_association *asoc,
166                                        void (*cb)(struct sctp_chunk *))
167
168 {
169         struct sctp_outq *q = &asoc->outqueue;
170         struct sctp_transport *t;
171         struct sctp_chunk *chunk;
172
173         list_for_each_entry(t, &asoc->peer.transport_addr_list, transports)
174                 list_for_each_entry(chunk, &t->transmitted, transmitted_list)
175                         cb(chunk);
176
177         list_for_each_entry(chunk, &q->retransmit, transmitted_list)
178                 cb(chunk);
179
180         list_for_each_entry(chunk, &q->sacked, transmitted_list)
181                 cb(chunk);
182
183         list_for_each_entry(chunk, &q->abandoned, transmitted_list)
184                 cb(chunk);
185
186         list_for_each_entry(chunk, &q->out_chunk_list, list)
187                 cb(chunk);
188 }
189
190 static void sctp_for_each_rx_skb(struct sctp_association *asoc, struct sock *sk,
191                                  void (*cb)(struct sk_buff *, struct sock *))
192
193 {
194         struct sk_buff *skb, *tmp;
195
196         sctp_skb_for_each(skb, &asoc->ulpq.lobby, tmp)
197                 cb(skb, sk);
198
199         sctp_skb_for_each(skb, &asoc->ulpq.reasm, tmp)
200                 cb(skb, sk);
201
202         sctp_skb_for_each(skb, &asoc->ulpq.reasm_uo, tmp)
203                 cb(skb, sk);
204 }
205
206 /* Verify that this is a valid address. */
207 static inline int sctp_verify_addr(struct sock *sk, union sctp_addr *addr,
208                                    int len)
209 {
210         struct sctp_af *af;
211
212         /* Verify basic sockaddr. */
213         af = sctp_sockaddr_af(sctp_sk(sk), addr, len);
214         if (!af)
215                 return -EINVAL;
216
217         /* Is this a valid SCTP address?  */
218         if (!af->addr_valid(addr, sctp_sk(sk), NULL))
219                 return -EINVAL;
220
221         if (!sctp_sk(sk)->pf->send_verify(sctp_sk(sk), (addr)))
222                 return -EINVAL;
223
224         return 0;
225 }
226
227 /* Look up the association by its id.  If this is not a UDP-style
228  * socket, the ID field is always ignored.
229  */
230 struct sctp_association *sctp_id2assoc(struct sock *sk, sctp_assoc_t id)
231 {
232         struct sctp_association *asoc = NULL;
233
234         /* If this is not a UDP-style socket, assoc id should be ignored. */
235         if (!sctp_style(sk, UDP)) {
236                 /* Return NULL if the socket state is not ESTABLISHED. It
237                  * could be a TCP-style listening socket or a socket which
238                  * hasn't yet called connect() to establish an association.
239                  */
240                 if (!sctp_sstate(sk, ESTABLISHED) && !sctp_sstate(sk, CLOSING))
241                         return NULL;
242
243                 /* Get the first and the only association from the list. */
244                 if (!list_empty(&sctp_sk(sk)->ep->asocs))
245                         asoc = list_entry(sctp_sk(sk)->ep->asocs.next,
246                                           struct sctp_association, asocs);
247                 return asoc;
248         }
249
250         /* Otherwise this is a UDP-style socket. */
251         if (id <= SCTP_ALL_ASSOC)
252                 return NULL;
253
254         spin_lock_bh(&sctp_assocs_id_lock);
255         asoc = (struct sctp_association *)idr_find(&sctp_assocs_id, (int)id);
256         if (asoc && (asoc->base.sk != sk || asoc->base.dead))
257                 asoc = NULL;
258         spin_unlock_bh(&sctp_assocs_id_lock);
259
260         return asoc;
261 }
262
263 /* Look up the transport from an address and an assoc id. If both address and
264  * id are specified, the associations matching the address and the id should be
265  * the same.
266  */
267 static struct sctp_transport *sctp_addr_id2transport(struct sock *sk,
268                                               struct sockaddr_storage *addr,
269                                               sctp_assoc_t id)
270 {
271         struct sctp_association *addr_asoc = NULL, *id_asoc = NULL;
272         struct sctp_af *af = sctp_get_af_specific(addr->ss_family);
273         union sctp_addr *laddr = (union sctp_addr *)addr;
274         struct sctp_transport *transport;
275
276         if (!af || sctp_verify_addr(sk, laddr, af->sockaddr_len))
277                 return NULL;
278
279         addr_asoc = sctp_endpoint_lookup_assoc(sctp_sk(sk)->ep,
280                                                laddr,
281                                                &transport);
282
283         if (!addr_asoc)
284                 return NULL;
285
286         id_asoc = sctp_id2assoc(sk, id);
287         if (id_asoc && (id_asoc != addr_asoc))
288                 return NULL;
289
290         sctp_get_pf_specific(sk->sk_family)->addr_to_user(sctp_sk(sk),
291                                                 (union sctp_addr *)addr);
292
293         return transport;
294 }
295
296 /* API 3.1.2 bind() - UDP Style Syntax
297  * The syntax of bind() is,
298  *
299  *   ret = bind(int sd, struct sockaddr *addr, int addrlen);
300  *
301  *   sd      - the socket descriptor returned by socket().
302  *   addr    - the address structure (struct sockaddr_in or struct
303  *             sockaddr_in6 [RFC 2553]),
304  *   addr_len - the size of the address structure.
305  */
306 static int sctp_bind(struct sock *sk, struct sockaddr *addr, int addr_len)
307 {
308         int retval = 0;
309
310         lock_sock(sk);
311
312         pr_debug("%s: sk:%p, addr:%p, addr_len:%d\n", __func__, sk,
313                  addr, addr_len);
314
315         /* Disallow binding twice. */
316         if (!sctp_sk(sk)->ep->base.bind_addr.port)
317                 retval = sctp_do_bind(sk, (union sctp_addr *)addr,
318                                       addr_len);
319         else
320                 retval = -EINVAL;
321
322         release_sock(sk);
323
324         return retval;
325 }
326
327 static long sctp_get_port_local(struct sock *, union sctp_addr *);
328
329 /* Verify this is a valid sockaddr. */
330 static struct sctp_af *sctp_sockaddr_af(struct sctp_sock *opt,
331                                         union sctp_addr *addr, int len)
332 {
333         struct sctp_af *af;
334
335         /* Check minimum size.  */
336         if (len < sizeof (struct sockaddr))
337                 return NULL;
338
339         if (!opt->pf->af_supported(addr->sa.sa_family, opt))
340                 return NULL;
341
342         if (addr->sa.sa_family == AF_INET6) {
343                 if (len < SIN6_LEN_RFC2133)
344                         return NULL;
345                 /* V4 mapped address are really of AF_INET family */
346                 if (ipv6_addr_v4mapped(&addr->v6.sin6_addr) &&
347                     !opt->pf->af_supported(AF_INET, opt))
348                         return NULL;
349         }
350
351         /* If we get this far, af is valid. */
352         af = sctp_get_af_specific(addr->sa.sa_family);
353
354         if (len < af->sockaddr_len)
355                 return NULL;
356
357         return af;
358 }
359
360 /* Bind a local address either to an endpoint or to an association.  */
361 static int sctp_do_bind(struct sock *sk, union sctp_addr *addr, int len)
362 {
363         struct net *net = sock_net(sk);
364         struct sctp_sock *sp = sctp_sk(sk);
365         struct sctp_endpoint *ep = sp->ep;
366         struct sctp_bind_addr *bp = &ep->base.bind_addr;
367         struct sctp_af *af;
368         unsigned short snum;
369         int ret = 0;
370
371         /* Common sockaddr verification. */
372         af = sctp_sockaddr_af(sp, addr, len);
373         if (!af) {
374                 pr_debug("%s: sk:%p, newaddr:%p, len:%d EINVAL\n",
375                          __func__, sk, addr, len);
376                 return -EINVAL;
377         }
378
379         snum = ntohs(addr->v4.sin_port);
380
381         pr_debug("%s: sk:%p, new addr:%pISc, port:%d, new port:%d, len:%d\n",
382                  __func__, sk, &addr->sa, bp->port, snum, len);
383
384         /* PF specific bind() address verification. */
385         if (!sp->pf->bind_verify(sp, addr))
386                 return -EADDRNOTAVAIL;
387
388         /* We must either be unbound, or bind to the same port.
389          * It's OK to allow 0 ports if we are already bound.
390          * We'll just inhert an already bound port in this case
391          */
392         if (bp->port) {
393                 if (!snum)
394                         snum = bp->port;
395                 else if (snum != bp->port) {
396                         pr_debug("%s: new port %d doesn't match existing port "
397                                  "%d\n", __func__, snum, bp->port);
398                         return -EINVAL;
399                 }
400         }
401
402         if (snum && snum < inet_prot_sock(net) &&
403             !ns_capable(net->user_ns, CAP_NET_BIND_SERVICE))
404                 return -EACCES;
405
406         /* See if the address matches any of the addresses we may have
407          * already bound before checking against other endpoints.
408          */
409         if (sctp_bind_addr_match(bp, addr, sp))
410                 return -EINVAL;
411
412         /* Make sure we are allowed to bind here.
413          * The function sctp_get_port_local() does duplicate address
414          * detection.
415          */
416         addr->v4.sin_port = htons(snum);
417         if ((ret = sctp_get_port_local(sk, addr))) {
418                 return -EADDRINUSE;
419         }
420
421         /* Refresh ephemeral port.  */
422         if (!bp->port)
423                 bp->port = inet_sk(sk)->inet_num;
424
425         /* Add the address to the bind address list.
426          * Use GFP_ATOMIC since BHs will be disabled.
427          */
428         ret = sctp_add_bind_addr(bp, addr, af->sockaddr_len,
429                                  SCTP_ADDR_SRC, GFP_ATOMIC);
430
431         /* Copy back into socket for getsockname() use. */
432         if (!ret) {
433                 inet_sk(sk)->inet_sport = htons(inet_sk(sk)->inet_num);
434                 sp->pf->to_sk_saddr(addr, sk);
435         }
436
437         return ret;
438 }
439
440  /* ADDIP Section 4.1.1 Congestion Control of ASCONF Chunks
441  *
442  * R1) One and only one ASCONF Chunk MAY be in transit and unacknowledged
443  * at any one time.  If a sender, after sending an ASCONF chunk, decides
444  * it needs to transfer another ASCONF Chunk, it MUST wait until the
445  * ASCONF-ACK Chunk returns from the previous ASCONF Chunk before sending a
446  * subsequent ASCONF. Note this restriction binds each side, so at any
447  * time two ASCONF may be in-transit on any given association (one sent
448  * from each endpoint).
449  */
450 static int sctp_send_asconf(struct sctp_association *asoc,
451                             struct sctp_chunk *chunk)
452 {
453         struct net      *net = sock_net(asoc->base.sk);
454         int             retval = 0;
455
456         /* If there is an outstanding ASCONF chunk, queue it for later
457          * transmission.
458          */
459         if (asoc->addip_last_asconf) {
460                 list_add_tail(&chunk->list, &asoc->addip_chunk_list);
461                 goto out;
462         }
463
464         /* Hold the chunk until an ASCONF_ACK is received. */
465         sctp_chunk_hold(chunk);
466         retval = sctp_primitive_ASCONF(net, asoc, chunk);
467         if (retval)
468                 sctp_chunk_free(chunk);
469         else
470                 asoc->addip_last_asconf = chunk;
471
472 out:
473         return retval;
474 }
475
476 /* Add a list of addresses as bind addresses to local endpoint or
477  * association.
478  *
479  * Basically run through each address specified in the addrs/addrcnt
480  * array/length pair, determine if it is IPv6 or IPv4 and call
481  * sctp_do_bind() on it.
482  *
483  * If any of them fails, then the operation will be reversed and the
484  * ones that were added will be removed.
485  *
486  * Only sctp_setsockopt_bindx() is supposed to call this function.
487  */
488 static int sctp_bindx_add(struct sock *sk, struct sockaddr *addrs, int addrcnt)
489 {
490         int cnt;
491         int retval = 0;
492         void *addr_buf;
493         struct sockaddr *sa_addr;
494         struct sctp_af *af;
495
496         pr_debug("%s: sk:%p, addrs:%p, addrcnt:%d\n", __func__, sk,
497                  addrs, addrcnt);
498
499         addr_buf = addrs;
500         for (cnt = 0; cnt < addrcnt; cnt++) {
501                 /* The list may contain either IPv4 or IPv6 address;
502                  * determine the address length for walking thru the list.
503                  */
504                 sa_addr = addr_buf;
505                 af = sctp_get_af_specific(sa_addr->sa_family);
506                 if (!af) {
507                         retval = -EINVAL;
508                         goto err_bindx_add;
509                 }
510
511                 retval = sctp_do_bind(sk, (union sctp_addr *)sa_addr,
512                                       af->sockaddr_len);
513
514                 addr_buf += af->sockaddr_len;
515
516 err_bindx_add:
517                 if (retval < 0) {
518                         /* Failed. Cleanup the ones that have been added */
519                         if (cnt > 0)
520                                 sctp_bindx_rem(sk, addrs, cnt);
521                         return retval;
522                 }
523         }
524
525         return retval;
526 }
527
528 /* Send an ASCONF chunk with Add IP address parameters to all the peers of the
529  * associations that are part of the endpoint indicating that a list of local
530  * addresses are added to the endpoint.
531  *
532  * If any of the addresses is already in the bind address list of the
533  * association, we do not send the chunk for that association.  But it will not
534  * affect other associations.
535  *
536  * Only sctp_setsockopt_bindx() is supposed to call this function.
537  */
538 static int sctp_send_asconf_add_ip(struct sock          *sk,
539                                    struct sockaddr      *addrs,
540                                    int                  addrcnt)
541 {
542         struct net *net = sock_net(sk);
543         struct sctp_sock                *sp;
544         struct sctp_endpoint            *ep;
545         struct sctp_association         *asoc;
546         struct sctp_bind_addr           *bp;
547         struct sctp_chunk               *chunk;
548         struct sctp_sockaddr_entry      *laddr;
549         union sctp_addr                 *addr;
550         union sctp_addr                 saveaddr;
551         void                            *addr_buf;
552         struct sctp_af                  *af;
553         struct list_head                *p;
554         int                             i;
555         int                             retval = 0;
556
557         if (!net->sctp.addip_enable)
558                 return retval;
559
560         sp = sctp_sk(sk);
561         ep = sp->ep;
562
563         pr_debug("%s: sk:%p, addrs:%p, addrcnt:%d\n",
564                  __func__, sk, addrs, addrcnt);
565
566         list_for_each_entry(asoc, &ep->asocs, asocs) {
567                 if (!asoc->peer.asconf_capable)
568                         continue;
569
570                 if (asoc->peer.addip_disabled_mask & SCTP_PARAM_ADD_IP)
571                         continue;
572
573                 if (!sctp_state(asoc, ESTABLISHED))
574                         continue;
575
576                 /* Check if any address in the packed array of addresses is
577                  * in the bind address list of the association. If so,
578                  * do not send the asconf chunk to its peer, but continue with
579                  * other associations.
580                  */
581                 addr_buf = addrs;
582                 for (i = 0; i < addrcnt; i++) {
583                         addr = addr_buf;
584                         af = sctp_get_af_specific(addr->v4.sin_family);
585                         if (!af) {
586                                 retval = -EINVAL;
587                                 goto out;
588                         }
589
590                         if (sctp_assoc_lookup_laddr(asoc, addr))
591                                 break;
592
593                         addr_buf += af->sockaddr_len;
594                 }
595                 if (i < addrcnt)
596                         continue;
597
598                 /* Use the first valid address in bind addr list of
599                  * association as Address Parameter of ASCONF CHUNK.
600                  */
601                 bp = &asoc->base.bind_addr;
602                 p = bp->address_list.next;
603                 laddr = list_entry(p, struct sctp_sockaddr_entry, list);
604                 chunk = sctp_make_asconf_update_ip(asoc, &laddr->a, addrs,
605                                                    addrcnt, SCTP_PARAM_ADD_IP);
606                 if (!chunk) {
607                         retval = -ENOMEM;
608                         goto out;
609                 }
610
611                 /* Add the new addresses to the bind address list with
612                  * use_as_src set to 0.
613                  */
614                 addr_buf = addrs;
615                 for (i = 0; i < addrcnt; i++) {
616                         addr = addr_buf;
617                         af = sctp_get_af_specific(addr->v4.sin_family);
618                         memcpy(&saveaddr, addr, af->sockaddr_len);
619                         retval = sctp_add_bind_addr(bp, &saveaddr,
620                                                     sizeof(saveaddr),
621                                                     SCTP_ADDR_NEW, GFP_ATOMIC);
622                         addr_buf += af->sockaddr_len;
623                 }
624                 if (asoc->src_out_of_asoc_ok) {
625                         struct sctp_transport *trans;
626
627                         list_for_each_entry(trans,
628                             &asoc->peer.transport_addr_list, transports) {
629                                 trans->cwnd = min(4*asoc->pathmtu, max_t(__u32,
630                                     2*asoc->pathmtu, 4380));
631                                 trans->ssthresh = asoc->peer.i.a_rwnd;
632                                 trans->rto = asoc->rto_initial;
633                                 sctp_max_rto(asoc, trans);
634                                 trans->rtt = trans->srtt = trans->rttvar = 0;
635                                 /* Clear the source and route cache */
636                                 sctp_transport_route(trans, NULL,
637                                                      sctp_sk(asoc->base.sk));
638                         }
639                 }
640                 retval = sctp_send_asconf(asoc, chunk);
641         }
642
643 out:
644         return retval;
645 }
646
647 /* Remove a list of addresses from bind addresses list.  Do not remove the
648  * last address.
649  *
650  * Basically run through each address specified in the addrs/addrcnt
651  * array/length pair, determine if it is IPv6 or IPv4 and call
652  * sctp_del_bind() on it.
653  *
654  * If any of them fails, then the operation will be reversed and the
655  * ones that were removed will be added back.
656  *
657  * At least one address has to be left; if only one address is
658  * available, the operation will return -EBUSY.
659  *
660  * Only sctp_setsockopt_bindx() is supposed to call this function.
661  */
662 static int sctp_bindx_rem(struct sock *sk, struct sockaddr *addrs, int addrcnt)
663 {
664         struct sctp_sock *sp = sctp_sk(sk);
665         struct sctp_endpoint *ep = sp->ep;
666         int cnt;
667         struct sctp_bind_addr *bp = &ep->base.bind_addr;
668         int retval = 0;
669         void *addr_buf;
670         union sctp_addr *sa_addr;
671         struct sctp_af *af;
672
673         pr_debug("%s: sk:%p, addrs:%p, addrcnt:%d\n",
674                  __func__, sk, addrs, addrcnt);
675
676         addr_buf = addrs;
677         for (cnt = 0; cnt < addrcnt; cnt++) {
678                 /* If the bind address list is empty or if there is only one
679                  * bind address, there is nothing more to be removed (we need
680                  * at least one address here).
681                  */
682                 if (list_empty(&bp->address_list) ||
683                     (sctp_list_single_entry(&bp->address_list))) {
684                         retval = -EBUSY;
685                         goto err_bindx_rem;
686                 }
687
688                 sa_addr = addr_buf;
689                 af = sctp_get_af_specific(sa_addr->sa.sa_family);
690                 if (!af) {
691                         retval = -EINVAL;
692                         goto err_bindx_rem;
693                 }
694
695                 if (!af->addr_valid(sa_addr, sp, NULL)) {
696                         retval = -EADDRNOTAVAIL;
697                         goto err_bindx_rem;
698                 }
699
700                 if (sa_addr->v4.sin_port &&
701                     sa_addr->v4.sin_port != htons(bp->port)) {
702                         retval = -EINVAL;
703                         goto err_bindx_rem;
704                 }
705
706                 if (!sa_addr->v4.sin_port)
707                         sa_addr->v4.sin_port = htons(bp->port);
708
709                 /* FIXME - There is probably a need to check if sk->sk_saddr and
710                  * sk->sk_rcv_addr are currently set to one of the addresses to
711                  * be removed. This is something which needs to be looked into
712                  * when we are fixing the outstanding issues with multi-homing
713                  * socket routing and failover schemes. Refer to comments in
714                  * sctp_do_bind(). -daisy
715                  */
716                 retval = sctp_del_bind_addr(bp, sa_addr);
717
718                 addr_buf += af->sockaddr_len;
719 err_bindx_rem:
720                 if (retval < 0) {
721                         /* Failed. Add the ones that has been removed back */
722                         if (cnt > 0)
723                                 sctp_bindx_add(sk, addrs, cnt);
724                         return retval;
725                 }
726         }
727
728         return retval;
729 }
730
731 /* Send an ASCONF chunk with Delete IP address parameters to all the peers of
732  * the associations that are part of the endpoint indicating that a list of
733  * local addresses are removed from the endpoint.
734  *
735  * If any of the addresses is already in the bind address list of the
736  * association, we do not send the chunk for that association.  But it will not
737  * affect other associations.
738  *
739  * Only sctp_setsockopt_bindx() is supposed to call this function.
740  */
741 static int sctp_send_asconf_del_ip(struct sock          *sk,
742                                    struct sockaddr      *addrs,
743                                    int                  addrcnt)
744 {
745         struct net *net = sock_net(sk);
746         struct sctp_sock        *sp;
747         struct sctp_endpoint    *ep;
748         struct sctp_association *asoc;
749         struct sctp_transport   *transport;
750         struct sctp_bind_addr   *bp;
751         struct sctp_chunk       *chunk;
752         union sctp_addr         *laddr;
753         void                    *addr_buf;
754         struct sctp_af          *af;
755         struct sctp_sockaddr_entry *saddr;
756         int                     i;
757         int                     retval = 0;
758         int                     stored = 0;
759
760         chunk = NULL;
761         if (!net->sctp.addip_enable)
762                 return retval;
763
764         sp = sctp_sk(sk);
765         ep = sp->ep;
766
767         pr_debug("%s: sk:%p, addrs:%p, addrcnt:%d\n",
768                  __func__, sk, addrs, addrcnt);
769
770         list_for_each_entry(asoc, &ep->asocs, asocs) {
771
772                 if (!asoc->peer.asconf_capable)
773                         continue;
774
775                 if (asoc->peer.addip_disabled_mask & SCTP_PARAM_DEL_IP)
776                         continue;
777
778                 if (!sctp_state(asoc, ESTABLISHED))
779                         continue;
780
781                 /* Check if any address in the packed array of addresses is
782                  * not present in the bind address list of the association.
783                  * If so, do not send the asconf chunk to its peer, but
784                  * continue with other associations.
785                  */
786                 addr_buf = addrs;
787                 for (i = 0; i < addrcnt; i++) {
788                         laddr = addr_buf;
789                         af = sctp_get_af_specific(laddr->v4.sin_family);
790                         if (!af) {
791                                 retval = -EINVAL;
792                                 goto out;
793                         }
794
795                         if (!sctp_assoc_lookup_laddr(asoc, laddr))
796                                 break;
797
798                         addr_buf += af->sockaddr_len;
799                 }
800                 if (i < addrcnt)
801                         continue;
802
803                 /* Find one address in the association's bind address list
804                  * that is not in the packed array of addresses. This is to
805                  * make sure that we do not delete all the addresses in the
806                  * association.
807                  */
808                 bp = &asoc->base.bind_addr;
809                 laddr = sctp_find_unmatch_addr(bp, (union sctp_addr *)addrs,
810                                                addrcnt, sp);
811                 if ((laddr == NULL) && (addrcnt == 1)) {
812                         if (asoc->asconf_addr_del_pending)
813                                 continue;
814                         asoc->asconf_addr_del_pending =
815                             kzalloc(sizeof(union sctp_addr), GFP_ATOMIC);
816                         if (asoc->asconf_addr_del_pending == NULL) {
817                                 retval = -ENOMEM;
818                                 goto out;
819                         }
820                         asoc->asconf_addr_del_pending->sa.sa_family =
821                                     addrs->sa_family;
822                         asoc->asconf_addr_del_pending->v4.sin_port =
823                                     htons(bp->port);
824                         if (addrs->sa_family == AF_INET) {
825                                 struct sockaddr_in *sin;
826
827                                 sin = (struct sockaddr_in *)addrs;
828                                 asoc->asconf_addr_del_pending->v4.sin_addr.s_addr = sin->sin_addr.s_addr;
829                         } else if (addrs->sa_family == AF_INET6) {
830                                 struct sockaddr_in6 *sin6;
831
832                                 sin6 = (struct sockaddr_in6 *)addrs;
833                                 asoc->asconf_addr_del_pending->v6.sin6_addr = sin6->sin6_addr;
834                         }
835
836                         pr_debug("%s: keep the last address asoc:%p %pISc at %p\n",
837                                  __func__, asoc, &asoc->asconf_addr_del_pending->sa,
838                                  asoc->asconf_addr_del_pending);
839
840                         asoc->src_out_of_asoc_ok = 1;
841                         stored = 1;
842                         goto skip_mkasconf;
843                 }
844
845                 if (laddr == NULL)
846                         return -EINVAL;
847
848                 /* We do not need RCU protection throughout this loop
849                  * because this is done under a socket lock from the
850                  * setsockopt call.
851                  */
852                 chunk = sctp_make_asconf_update_ip(asoc, laddr, addrs, addrcnt,
853                                                    SCTP_PARAM_DEL_IP);
854                 if (!chunk) {
855                         retval = -ENOMEM;
856                         goto out;
857                 }
858
859 skip_mkasconf:
860                 /* Reset use_as_src flag for the addresses in the bind address
861                  * list that are to be deleted.
862                  */
863                 addr_buf = addrs;
864                 for (i = 0; i < addrcnt; i++) {
865                         laddr = addr_buf;
866                         af = sctp_get_af_specific(laddr->v4.sin_family);
867                         list_for_each_entry(saddr, &bp->address_list, list) {
868                                 if (sctp_cmp_addr_exact(&saddr->a, laddr))
869                                         saddr->state = SCTP_ADDR_DEL;
870                         }
871                         addr_buf += af->sockaddr_len;
872                 }
873
874                 /* Update the route and saddr entries for all the transports
875                  * as some of the addresses in the bind address list are
876                  * about to be deleted and cannot be used as source addresses.
877                  */
878                 list_for_each_entry(transport, &asoc->peer.transport_addr_list,
879                                         transports) {
880                         sctp_transport_route(transport, NULL,
881                                              sctp_sk(asoc->base.sk));
882                 }
883
884                 if (stored)
885                         /* We don't need to transmit ASCONF */
886                         continue;
887                 retval = sctp_send_asconf(asoc, chunk);
888         }
889 out:
890         return retval;
891 }
892
893 /* set addr events to assocs in the endpoint.  ep and addr_wq must be locked */
894 int sctp_asconf_mgmt(struct sctp_sock *sp, struct sctp_sockaddr_entry *addrw)
895 {
896         struct sock *sk = sctp_opt2sk(sp);
897         union sctp_addr *addr;
898         struct sctp_af *af;
899
900         /* It is safe to write port space in caller. */
901         addr = &addrw->a;
902         addr->v4.sin_port = htons(sp->ep->base.bind_addr.port);
903         af = sctp_get_af_specific(addr->sa.sa_family);
904         if (!af)
905                 return -EINVAL;
906         if (sctp_verify_addr(sk, addr, af->sockaddr_len))
907                 return -EINVAL;
908
909         if (addrw->state == SCTP_ADDR_NEW)
910                 return sctp_send_asconf_add_ip(sk, (struct sockaddr *)addr, 1);
911         else
912                 return sctp_send_asconf_del_ip(sk, (struct sockaddr *)addr, 1);
913 }
914
915 /* Helper for tunneling sctp_bindx() requests through sctp_setsockopt()
916  *
917  * API 8.1
918  * int sctp_bindx(int sd, struct sockaddr *addrs, int addrcnt,
919  *                int flags);
920  *
921  * If sd is an IPv4 socket, the addresses passed must be IPv4 addresses.
922  * If the sd is an IPv6 socket, the addresses passed can either be IPv4
923  * or IPv6 addresses.
924  *
925  * A single address may be specified as INADDR_ANY or IN6ADDR_ANY, see
926  * Section 3.1.2 for this usage.
927  *
928  * addrs is a pointer to an array of one or more socket addresses. Each
929  * address is contained in its appropriate structure (i.e. struct
930  * sockaddr_in or struct sockaddr_in6) the family of the address type
931  * must be used to distinguish the address length (note that this
932  * representation is termed a "packed array" of addresses). The caller
933  * specifies the number of addresses in the array with addrcnt.
934  *
935  * On success, sctp_bindx() returns 0. On failure, sctp_bindx() returns
936  * -1, and sets errno to the appropriate error code.
937  *
938  * For SCTP, the port given in each socket address must be the same, or
939  * sctp_bindx() will fail, setting errno to EINVAL.
940  *
941  * The flags parameter is formed from the bitwise OR of zero or more of
942  * the following currently defined flags:
943  *
944  * SCTP_BINDX_ADD_ADDR
945  *
946  * SCTP_BINDX_REM_ADDR
947  *
948  * SCTP_BINDX_ADD_ADDR directs SCTP to add the given addresses to the
949  * association, and SCTP_BINDX_REM_ADDR directs SCTP to remove the given
950  * addresses from the association. The two flags are mutually exclusive;
951  * if both are given, sctp_bindx() will fail with EINVAL. A caller may
952  * not remove all addresses from an association; sctp_bindx() will
953  * reject such an attempt with EINVAL.
954  *
955  * An application can use sctp_bindx(SCTP_BINDX_ADD_ADDR) to associate
956  * additional addresses with an endpoint after calling bind().  Or use
957  * sctp_bindx(SCTP_BINDX_REM_ADDR) to remove some addresses a listening
958  * socket is associated with so that no new association accepted will be
959  * associated with those addresses. If the endpoint supports dynamic
960  * address a SCTP_BINDX_REM_ADDR or SCTP_BINDX_ADD_ADDR may cause a
961  * endpoint to send the appropriate message to the peer to change the
962  * peers address lists.
963  *
964  * Adding and removing addresses from a connected association is
965  * optional functionality. Implementations that do not support this
966  * functionality should return EOPNOTSUPP.
967  *
968  * Basically do nothing but copying the addresses from user to kernel
969  * land and invoking either sctp_bindx_add() or sctp_bindx_rem() on the sk.
970  * This is used for tunneling the sctp_bindx() request through sctp_setsockopt()
971  * from userspace.
972  *
973  * On exit there is no need to do sockfd_put(), sys_setsockopt() does
974  * it.
975  *
976  * sk        The sk of the socket
977  * addrs     The pointer to the addresses in user land
978  * addrssize Size of the addrs buffer
979  * op        Operation to perform (add or remove, see the flags of
980  *           sctp_bindx)
981  *
982  * Returns 0 if ok, <0 errno code on error.
983  */
984 static int sctp_setsockopt_bindx(struct sock *sk,
985                                  struct sockaddr __user *addrs,
986                                  int addrs_size, int op)
987 {
988         struct sockaddr *kaddrs;
989         int err;
990         int addrcnt = 0;
991         int walk_size = 0;
992         struct sockaddr *sa_addr;
993         void *addr_buf;
994         struct sctp_af *af;
995
996         pr_debug("%s: sk:%p addrs:%p addrs_size:%d opt:%d\n",
997                  __func__, sk, addrs, addrs_size, op);
998
999         if (unlikely(addrs_size <= 0))
1000                 return -EINVAL;
1001
1002         kaddrs = memdup_user(addrs, addrs_size);
1003         if (unlikely(IS_ERR(kaddrs)))
1004                 return PTR_ERR(kaddrs);
1005
1006         /* Walk through the addrs buffer and count the number of addresses. */
1007         addr_buf = kaddrs;
1008         while (walk_size < addrs_size) {
1009                 if (walk_size + sizeof(sa_family_t) > addrs_size) {
1010                         kfree(kaddrs);
1011                         return -EINVAL;
1012                 }
1013
1014                 sa_addr = addr_buf;
1015                 af = sctp_get_af_specific(sa_addr->sa_family);
1016
1017                 /* If the address family is not supported or if this address
1018                  * causes the address buffer to overflow return EINVAL.
1019                  */
1020                 if (!af || (walk_size + af->sockaddr_len) > addrs_size) {
1021                         kfree(kaddrs);
1022                         return -EINVAL;
1023                 }
1024                 addrcnt++;
1025                 addr_buf += af->sockaddr_len;
1026                 walk_size += af->sockaddr_len;
1027         }
1028
1029         /* Do the work. */
1030         switch (op) {
1031         case SCTP_BINDX_ADD_ADDR:
1032                 /* Allow security module to validate bindx addresses. */
1033                 err = security_sctp_bind_connect(sk, SCTP_SOCKOPT_BINDX_ADD,
1034                                                  (struct sockaddr *)kaddrs,
1035                                                  addrs_size);
1036                 if (err)
1037                         goto out;
1038                 err = sctp_bindx_add(sk, kaddrs, addrcnt);
1039                 if (err)
1040                         goto out;
1041                 err = sctp_send_asconf_add_ip(sk, kaddrs, addrcnt);
1042                 break;
1043
1044         case SCTP_BINDX_REM_ADDR:
1045                 err = sctp_bindx_rem(sk, kaddrs, addrcnt);
1046                 if (err)
1047                         goto out;
1048                 err = sctp_send_asconf_del_ip(sk, kaddrs, addrcnt);
1049                 break;
1050
1051         default:
1052                 err = -EINVAL;
1053                 break;
1054         }
1055
1056 out:
1057         kfree(kaddrs);
1058
1059         return err;
1060 }
1061
1062 /* __sctp_connect(struct sock* sk, struct sockaddr *kaddrs, int addrs_size)
1063  *
1064  * Common routine for handling connect() and sctp_connectx().
1065  * Connect will come in with just a single address.
1066  */
1067 static int __sctp_connect(struct sock *sk,
1068                           struct sockaddr *kaddrs,
1069                           int addrs_size, int flags,
1070                           sctp_assoc_t *assoc_id)
1071 {
1072         struct net *net = sock_net(sk);
1073         struct sctp_sock *sp;
1074         struct sctp_endpoint *ep;
1075         struct sctp_association *asoc = NULL;
1076         struct sctp_association *asoc2;
1077         struct sctp_transport *transport;
1078         union sctp_addr to;
1079         enum sctp_scope scope;
1080         long timeo;
1081         int err = 0;
1082         int addrcnt = 0;
1083         int walk_size = 0;
1084         union sctp_addr *sa_addr = NULL;
1085         void *addr_buf;
1086         unsigned short port;
1087
1088         sp = sctp_sk(sk);
1089         ep = sp->ep;
1090
1091         /* connect() cannot be done on a socket that is already in ESTABLISHED
1092          * state - UDP-style peeled off socket or a TCP-style socket that
1093          * is already connected.
1094          * It cannot be done even on a TCP-style listening socket.
1095          */
1096         if (sctp_sstate(sk, ESTABLISHED) || sctp_sstate(sk, CLOSING) ||
1097             (sctp_style(sk, TCP) && sctp_sstate(sk, LISTENING))) {
1098                 err = -EISCONN;
1099                 goto out_free;
1100         }
1101
1102         /* Walk through the addrs buffer and count the number of addresses. */
1103         addr_buf = kaddrs;
1104         while (walk_size < addrs_size) {
1105                 struct sctp_af *af;
1106
1107                 if (walk_size + sizeof(sa_family_t) > addrs_size) {
1108                         err = -EINVAL;
1109                         goto out_free;
1110                 }
1111
1112                 sa_addr = addr_buf;
1113                 af = sctp_get_af_specific(sa_addr->sa.sa_family);
1114
1115                 /* If the address family is not supported or if this address
1116                  * causes the address buffer to overflow return EINVAL.
1117                  */
1118                 if (!af || (walk_size + af->sockaddr_len) > addrs_size) {
1119                         err = -EINVAL;
1120                         goto out_free;
1121                 }
1122
1123                 port = ntohs(sa_addr->v4.sin_port);
1124
1125                 /* Save current address so we can work with it */
1126                 memcpy(&to, sa_addr, af->sockaddr_len);
1127
1128                 err = sctp_verify_addr(sk, &to, af->sockaddr_len);
1129                 if (err)
1130                         goto out_free;
1131
1132                 /* Make sure the destination port is correctly set
1133                  * in all addresses.
1134                  */
1135                 if (asoc && asoc->peer.port && asoc->peer.port != port) {
1136                         err = -EINVAL;
1137                         goto out_free;
1138                 }
1139
1140                 /* Check if there already is a matching association on the
1141                  * endpoint (other than the one created here).
1142                  */
1143                 asoc2 = sctp_endpoint_lookup_assoc(ep, &to, &transport);
1144                 if (asoc2 && asoc2 != asoc) {
1145                         if (asoc2->state >= SCTP_STATE_ESTABLISHED)
1146                                 err = -EISCONN;
1147                         else
1148                                 err = -EALREADY;
1149                         goto out_free;
1150                 }
1151
1152                 /* If we could not find a matching association on the endpoint,
1153                  * make sure that there is no peeled-off association matching
1154                  * the peer address even on another socket.
1155                  */
1156                 if (sctp_endpoint_is_peeled_off(ep, &to)) {
1157                         err = -EADDRNOTAVAIL;
1158                         goto out_free;
1159                 }
1160
1161                 if (!asoc) {
1162                         /* If a bind() or sctp_bindx() is not called prior to
1163                          * an sctp_connectx() call, the system picks an
1164                          * ephemeral port and will choose an address set
1165                          * equivalent to binding with a wildcard address.
1166                          */
1167                         if (!ep->base.bind_addr.port) {
1168                                 if (sctp_autobind(sk)) {
1169                                         err = -EAGAIN;
1170                                         goto out_free;
1171                                 }
1172                         } else {
1173                                 /*
1174                                  * If an unprivileged user inherits a 1-many
1175                                  * style socket with open associations on a
1176                                  * privileged port, it MAY be permitted to
1177                                  * accept new associations, but it SHOULD NOT
1178                                  * be permitted to open new associations.
1179                                  */
1180                                 if (ep->base.bind_addr.port <
1181                                     inet_prot_sock(net) &&
1182                                     !ns_capable(net->user_ns,
1183                                     CAP_NET_BIND_SERVICE)) {
1184                                         err = -EACCES;
1185                                         goto out_free;
1186                                 }
1187                         }
1188
1189                         scope = sctp_scope(&to);
1190                         asoc = sctp_association_new(ep, sk, scope, GFP_KERNEL);
1191                         if (!asoc) {
1192                                 err = -ENOMEM;
1193                                 goto out_free;
1194                         }
1195
1196                         err = sctp_assoc_set_bind_addr_from_ep(asoc, scope,
1197                                                               GFP_KERNEL);
1198                         if (err < 0) {
1199                                 goto out_free;
1200                         }
1201
1202                 }
1203
1204                 /* Prime the peer's transport structures.  */
1205                 transport = sctp_assoc_add_peer(asoc, &to, GFP_KERNEL,
1206                                                 SCTP_UNKNOWN);
1207                 if (!transport) {
1208                         err = -ENOMEM;
1209                         goto out_free;
1210                 }
1211
1212                 addrcnt++;
1213                 addr_buf += af->sockaddr_len;
1214                 walk_size += af->sockaddr_len;
1215         }
1216
1217         /* In case the user of sctp_connectx() wants an association
1218          * id back, assign one now.
1219          */
1220         if (assoc_id) {
1221                 err = sctp_assoc_set_id(asoc, GFP_KERNEL);
1222                 if (err < 0)
1223                         goto out_free;
1224         }
1225
1226         err = sctp_primitive_ASSOCIATE(net, asoc, NULL);
1227         if (err < 0) {
1228                 goto out_free;
1229         }
1230
1231         /* Initialize sk's dport and daddr for getpeername() */
1232         inet_sk(sk)->inet_dport = htons(asoc->peer.port);
1233         sp->pf->to_sk_daddr(sa_addr, sk);
1234         sk->sk_err = 0;
1235
1236         timeo = sock_sndtimeo(sk, flags & O_NONBLOCK);
1237
1238         if (assoc_id)
1239                 *assoc_id = asoc->assoc_id;
1240
1241         err = sctp_wait_for_connect(asoc, &timeo);
1242         /* Note: the asoc may be freed after the return of
1243          * sctp_wait_for_connect.
1244          */
1245
1246         /* Don't free association on exit. */
1247         asoc = NULL;
1248
1249 out_free:
1250         pr_debug("%s: took out_free path with asoc:%p kaddrs:%p err:%d\n",
1251                  __func__, asoc, kaddrs, err);
1252
1253         if (asoc) {
1254                 /* sctp_primitive_ASSOCIATE may have added this association
1255                  * To the hash table, try to unhash it, just in case, its a noop
1256                  * if it wasn't hashed so we're safe
1257                  */
1258                 sctp_association_free(asoc);
1259         }
1260         return err;
1261 }
1262
1263 /* Helper for tunneling sctp_connectx() requests through sctp_setsockopt()
1264  *
1265  * API 8.9
1266  * int sctp_connectx(int sd, struct sockaddr *addrs, int addrcnt,
1267  *                      sctp_assoc_t *asoc);
1268  *
1269  * If sd is an IPv4 socket, the addresses passed must be IPv4 addresses.
1270  * If the sd is an IPv6 socket, the addresses passed can either be IPv4
1271  * or IPv6 addresses.
1272  *
1273  * A single address may be specified as INADDR_ANY or IN6ADDR_ANY, see
1274  * Section 3.1.2 for this usage.
1275  *
1276  * addrs is a pointer to an array of one or more socket addresses. Each
1277  * address is contained in its appropriate structure (i.e. struct
1278  * sockaddr_in or struct sockaddr_in6) the family of the address type
1279  * must be used to distengish the address length (note that this
1280  * representation is termed a "packed array" of addresses). The caller
1281  * specifies the number of addresses in the array with addrcnt.
1282  *
1283  * On success, sctp_connectx() returns 0. It also sets the assoc_id to
1284  * the association id of the new association.  On failure, sctp_connectx()
1285  * returns -1, and sets errno to the appropriate error code.  The assoc_id
1286  * is not touched by the kernel.
1287  *
1288  * For SCTP, the port given in each socket address must be the same, or
1289  * sctp_connectx() will fail, setting errno to EINVAL.
1290  *
1291  * An application can use sctp_connectx to initiate an association with
1292  * an endpoint that is multi-homed.  Much like sctp_bindx() this call
1293  * allows a caller to specify multiple addresses at which a peer can be
1294  * reached.  The way the SCTP stack uses the list of addresses to set up
1295  * the association is implementation dependent.  This function only
1296  * specifies that the stack will try to make use of all the addresses in
1297  * the list when needed.
1298  *
1299  * Note that the list of addresses passed in is only used for setting up
1300  * the association.  It does not necessarily equal the set of addresses
1301  * the peer uses for the resulting association.  If the caller wants to
1302  * find out the set of peer addresses, it must use sctp_getpaddrs() to
1303  * retrieve them after the association has been set up.
1304  *
1305  * Basically do nothing but copying the addresses from user to kernel
1306  * land and invoking either sctp_connectx(). This is used for tunneling
1307  * the sctp_connectx() request through sctp_setsockopt() from userspace.
1308  *
1309  * On exit there is no need to do sockfd_put(), sys_setsockopt() does
1310  * it.
1311  *
1312  * sk        The sk of the socket
1313  * addrs     The pointer to the addresses in user land
1314  * addrssize Size of the addrs buffer
1315  *
1316  * Returns >=0 if ok, <0 errno code on error.
1317  */
1318 static int __sctp_setsockopt_connectx(struct sock *sk,
1319                                       struct sockaddr __user *addrs,
1320                                       int addrs_size,
1321                                       sctp_assoc_t *assoc_id)
1322 {
1323         struct sockaddr *kaddrs;
1324         int err = 0, flags = 0;
1325
1326         pr_debug("%s: sk:%p addrs:%p addrs_size:%d\n",
1327                  __func__, sk, addrs, addrs_size);
1328
1329         if (unlikely(addrs_size <= 0))
1330                 return -EINVAL;
1331
1332         kaddrs = memdup_user(addrs, addrs_size);
1333         if (unlikely(IS_ERR(kaddrs)))
1334                 return PTR_ERR(kaddrs);
1335
1336         /* Allow security module to validate connectx addresses. */
1337         err = security_sctp_bind_connect(sk, SCTP_SOCKOPT_CONNECTX,
1338                                          (struct sockaddr *)kaddrs,
1339                                           addrs_size);
1340         if (err)
1341                 goto out_free;
1342
1343         /* in-kernel sockets don't generally have a file allocated to them
1344          * if all they do is call sock_create_kern().
1345          */
1346         if (sk->sk_socket->file)
1347                 flags = sk->sk_socket->file->f_flags;
1348
1349         err = __sctp_connect(sk, kaddrs, addrs_size, flags, assoc_id);
1350
1351 out_free:
1352         kfree(kaddrs);
1353
1354         return err;
1355 }
1356
1357 /*
1358  * This is an older interface.  It's kept for backward compatibility
1359  * to the option that doesn't provide association id.
1360  */
1361 static int sctp_setsockopt_connectx_old(struct sock *sk,
1362                                         struct sockaddr __user *addrs,
1363                                         int addrs_size)
1364 {
1365         return __sctp_setsockopt_connectx(sk, addrs, addrs_size, NULL);
1366 }
1367
1368 /*
1369  * New interface for the API.  The since the API is done with a socket
1370  * option, to make it simple we feed back the association id is as a return
1371  * indication to the call.  Error is always negative and association id is
1372  * always positive.
1373  */
1374 static int sctp_setsockopt_connectx(struct sock *sk,
1375                                     struct sockaddr __user *addrs,
1376                                     int addrs_size)
1377 {
1378         sctp_assoc_t assoc_id = 0;
1379         int err = 0;
1380
1381         err = __sctp_setsockopt_connectx(sk, addrs, addrs_size, &assoc_id);
1382
1383         if (err)
1384                 return err;
1385         else
1386                 return assoc_id;
1387 }
1388
1389 /*
1390  * New (hopefully final) interface for the API.
1391  * We use the sctp_getaddrs_old structure so that use-space library
1392  * can avoid any unnecessary allocations. The only different part
1393  * is that we store the actual length of the address buffer into the
1394  * addrs_num structure member. That way we can re-use the existing
1395  * code.
1396  */
1397 #ifdef CONFIG_COMPAT
1398 struct compat_sctp_getaddrs_old {
1399         sctp_assoc_t    assoc_id;
1400         s32             addr_num;
1401         compat_uptr_t   addrs;          /* struct sockaddr * */
1402 };
1403 #endif
1404
1405 static int sctp_getsockopt_connectx3(struct sock *sk, int len,
1406                                      char __user *optval,
1407                                      int __user *optlen)
1408 {
1409         struct sctp_getaddrs_old param;
1410         sctp_assoc_t assoc_id = 0;
1411         int err = 0;
1412
1413 #ifdef CONFIG_COMPAT
1414         if (in_compat_syscall()) {
1415                 struct compat_sctp_getaddrs_old param32;
1416
1417                 if (len < sizeof(param32))
1418                         return -EINVAL;
1419                 if (copy_from_user(&param32, optval, sizeof(param32)))
1420                         return -EFAULT;
1421
1422                 param.assoc_id = param32.assoc_id;
1423                 param.addr_num = param32.addr_num;
1424                 param.addrs = compat_ptr(param32.addrs);
1425         } else
1426 #endif
1427         {
1428                 if (len < sizeof(param))
1429                         return -EINVAL;
1430                 if (copy_from_user(&param, optval, sizeof(param)))
1431                         return -EFAULT;
1432         }
1433
1434         err = __sctp_setsockopt_connectx(sk, (struct sockaddr __user *)
1435                                          param.addrs, param.addr_num,
1436                                          &assoc_id);
1437         if (err == 0 || err == -EINPROGRESS) {
1438                 if (copy_to_user(optval, &assoc_id, sizeof(assoc_id)))
1439                         return -EFAULT;
1440                 if (put_user(sizeof(assoc_id), optlen))
1441                         return -EFAULT;
1442         }
1443
1444         return err;
1445 }
1446
1447 /* API 3.1.4 close() - UDP Style Syntax
1448  * Applications use close() to perform graceful shutdown (as described in
1449  * Section 10.1 of [SCTP]) on ALL the associations currently represented
1450  * by a UDP-style socket.
1451  *
1452  * The syntax is
1453  *
1454  *   ret = close(int sd);
1455  *
1456  *   sd      - the socket descriptor of the associations to be closed.
1457  *
1458  * To gracefully shutdown a specific association represented by the
1459  * UDP-style socket, an application should use the sendmsg() call,
1460  * passing no user data, but including the appropriate flag in the
1461  * ancillary data (see Section xxxx).
1462  *
1463  * If sd in the close() call is a branched-off socket representing only
1464  * one association, the shutdown is performed on that association only.
1465  *
1466  * 4.1.6 close() - TCP Style Syntax
1467  *
1468  * Applications use close() to gracefully close down an association.
1469  *
1470  * The syntax is:
1471  *
1472  *    int close(int sd);
1473  *
1474  *      sd      - the socket descriptor of the association to be closed.
1475  *
1476  * After an application calls close() on a socket descriptor, no further
1477  * socket operations will succeed on that descriptor.
1478  *
1479  * API 7.1.4 SO_LINGER
1480  *
1481  * An application using the TCP-style socket can use this option to
1482  * perform the SCTP ABORT primitive.  The linger option structure is:
1483  *
1484  *  struct  linger {
1485  *     int     l_onoff;                // option on/off
1486  *     int     l_linger;               // linger time
1487  * };
1488  *
1489  * To enable the option, set l_onoff to 1.  If the l_linger value is set
1490  * to 0, calling close() is the same as the ABORT primitive.  If the
1491  * value is set to a negative value, the setsockopt() call will return
1492  * an error.  If the value is set to a positive value linger_time, the
1493  * close() can be blocked for at most linger_time ms.  If the graceful
1494  * shutdown phase does not finish during this period, close() will
1495  * return but the graceful shutdown phase continues in the system.
1496  */
1497 static void sctp_close(struct sock *sk, long timeout)
1498 {
1499         struct net *net = sock_net(sk);
1500         struct sctp_endpoint *ep;
1501         struct sctp_association *asoc;
1502         struct list_head *pos, *temp;
1503         unsigned int data_was_unread;
1504
1505         pr_debug("%s: sk:%p, timeout:%ld\n", __func__, sk, timeout);
1506
1507         lock_sock_nested(sk, SINGLE_DEPTH_NESTING);
1508         sk->sk_shutdown = SHUTDOWN_MASK;
1509         inet_sk_set_state(sk, SCTP_SS_CLOSING);
1510
1511         ep = sctp_sk(sk)->ep;
1512
1513         /* Clean up any skbs sitting on the receive queue.  */
1514         data_was_unread = sctp_queue_purge_ulpevents(&sk->sk_receive_queue);
1515         data_was_unread += sctp_queue_purge_ulpevents(&sctp_sk(sk)->pd_lobby);
1516
1517         /* Walk all associations on an endpoint.  */
1518         list_for_each_safe(pos, temp, &ep->asocs) {
1519                 asoc = list_entry(pos, struct sctp_association, asocs);
1520
1521                 if (sctp_style(sk, TCP)) {
1522                         /* A closed association can still be in the list if
1523                          * it belongs to a TCP-style listening socket that is
1524                          * not yet accepted. If so, free it. If not, send an
1525                          * ABORT or SHUTDOWN based on the linger options.
1526                          */
1527                         if (sctp_state(asoc, CLOSED)) {
1528                                 sctp_association_free(asoc);
1529                                 continue;
1530                         }
1531                 }
1532
1533                 if (data_was_unread || !skb_queue_empty(&asoc->ulpq.lobby) ||
1534                     !skb_queue_empty(&asoc->ulpq.reasm) ||
1535                     !skb_queue_empty(&asoc->ulpq.reasm_uo) ||
1536                     (sock_flag(sk, SOCK_LINGER) && !sk->sk_lingertime)) {
1537                         struct sctp_chunk *chunk;
1538
1539                         chunk = sctp_make_abort_user(asoc, NULL, 0);
1540                         sctp_primitive_ABORT(net, asoc, chunk);
1541                 } else
1542                         sctp_primitive_SHUTDOWN(net, asoc, NULL);
1543         }
1544
1545         /* On a TCP-style socket, block for at most linger_time if set. */
1546         if (sctp_style(sk, TCP) && timeout)
1547                 sctp_wait_for_close(sk, timeout);
1548
1549         /* This will run the backlog queue.  */
1550         release_sock(sk);
1551
1552         /* Supposedly, no process has access to the socket, but
1553          * the net layers still may.
1554          * Also, sctp_destroy_sock() needs to be called with addr_wq_lock
1555          * held and that should be grabbed before socket lock.
1556          */
1557         spin_lock_bh(&net->sctp.addr_wq_lock);
1558         bh_lock_sock_nested(sk);
1559
1560         /* Hold the sock, since sk_common_release() will put sock_put()
1561          * and we have just a little more cleanup.
1562          */
1563         sock_hold(sk);
1564         sk_common_release(sk);
1565
1566         bh_unlock_sock(sk);
1567         spin_unlock_bh(&net->sctp.addr_wq_lock);
1568
1569         sock_put(sk);
1570
1571         SCTP_DBG_OBJCNT_DEC(sock);
1572 }
1573
1574 /* Handle EPIPE error. */
1575 static int sctp_error(struct sock *sk, int flags, int err)
1576 {
1577         if (err == -EPIPE)
1578                 err = sock_error(sk) ? : -EPIPE;
1579         if (err == -EPIPE && !(flags & MSG_NOSIGNAL))
1580                 send_sig(SIGPIPE, current, 0);
1581         return err;
1582 }
1583
1584 /* API 3.1.3 sendmsg() - UDP Style Syntax
1585  *
1586  * An application uses sendmsg() and recvmsg() calls to transmit data to
1587  * and receive data from its peer.
1588  *
1589  *  ssize_t sendmsg(int socket, const struct msghdr *message,
1590  *                  int flags);
1591  *
1592  *  socket  - the socket descriptor of the endpoint.
1593  *  message - pointer to the msghdr structure which contains a single
1594  *            user message and possibly some ancillary data.
1595  *
1596  *            See Section 5 for complete description of the data
1597  *            structures.
1598  *
1599  *  flags   - flags sent or received with the user message, see Section
1600  *            5 for complete description of the flags.
1601  *
1602  * Note:  This function could use a rewrite especially when explicit
1603  * connect support comes in.
1604  */
1605 /* BUG:  We do not implement the equivalent of sk_stream_wait_memory(). */
1606
1607 static int sctp_msghdr_parse(const struct msghdr *msg,
1608                              struct sctp_cmsgs *cmsgs);
1609
1610 static int sctp_sendmsg_parse(struct sock *sk, struct sctp_cmsgs *cmsgs,
1611                               struct sctp_sndrcvinfo *srinfo,
1612                               const struct msghdr *msg, size_t msg_len)
1613 {
1614         __u16 sflags;
1615         int err;
1616
1617         if (sctp_sstate(sk, LISTENING) && sctp_style(sk, TCP))
1618                 return -EPIPE;
1619
1620         if (msg_len > sk->sk_sndbuf)
1621                 return -EMSGSIZE;
1622
1623         memset(cmsgs, 0, sizeof(*cmsgs));
1624         err = sctp_msghdr_parse(msg, cmsgs);
1625         if (err) {
1626                 pr_debug("%s: msghdr parse err:%x\n", __func__, err);
1627                 return err;
1628         }
1629
1630         memset(srinfo, 0, sizeof(*srinfo));
1631         if (cmsgs->srinfo) {
1632                 srinfo->sinfo_stream = cmsgs->srinfo->sinfo_stream;
1633                 srinfo->sinfo_flags = cmsgs->srinfo->sinfo_flags;
1634                 srinfo->sinfo_ppid = cmsgs->srinfo->sinfo_ppid;
1635                 srinfo->sinfo_context = cmsgs->srinfo->sinfo_context;
1636                 srinfo->sinfo_assoc_id = cmsgs->srinfo->sinfo_assoc_id;
1637                 srinfo->sinfo_timetolive = cmsgs->srinfo->sinfo_timetolive;
1638         }
1639
1640         if (cmsgs->sinfo) {
1641                 srinfo->sinfo_stream = cmsgs->sinfo->snd_sid;
1642                 srinfo->sinfo_flags = cmsgs->sinfo->snd_flags;
1643                 srinfo->sinfo_ppid = cmsgs->sinfo->snd_ppid;
1644                 srinfo->sinfo_context = cmsgs->sinfo->snd_context;
1645                 srinfo->sinfo_assoc_id = cmsgs->sinfo->snd_assoc_id;
1646         }
1647
1648         if (cmsgs->prinfo) {
1649                 srinfo->sinfo_timetolive = cmsgs->prinfo->pr_value;
1650                 SCTP_PR_SET_POLICY(srinfo->sinfo_flags,
1651                                    cmsgs->prinfo->pr_policy);
1652         }
1653
1654         sflags = srinfo->sinfo_flags;
1655         if (!sflags && msg_len)
1656                 return 0;
1657
1658         if (sctp_style(sk, TCP) && (sflags & (SCTP_EOF | SCTP_ABORT)))
1659                 return -EINVAL;
1660
1661         if (((sflags & SCTP_EOF) && msg_len > 0) ||
1662             (!(sflags & (SCTP_EOF | SCTP_ABORT)) && msg_len == 0))
1663                 return -EINVAL;
1664
1665         if ((sflags & SCTP_ADDR_OVER) && !msg->msg_name)
1666                 return -EINVAL;
1667
1668         return 0;
1669 }
1670
1671 static int sctp_sendmsg_new_asoc(struct sock *sk, __u16 sflags,
1672                                  struct sctp_cmsgs *cmsgs,
1673                                  union sctp_addr *daddr,
1674                                  struct sctp_transport **tp)
1675 {
1676         struct sctp_endpoint *ep = sctp_sk(sk)->ep;
1677         struct net *net = sock_net(sk);
1678         struct sctp_association *asoc;
1679         enum sctp_scope scope;
1680         struct cmsghdr *cmsg;
1681         __be32 flowinfo = 0;
1682         struct sctp_af *af;
1683         int err;
1684
1685         *tp = NULL;
1686
1687         if (sflags & (SCTP_EOF | SCTP_ABORT))
1688                 return -EINVAL;
1689
1690         if (sctp_style(sk, TCP) && (sctp_sstate(sk, ESTABLISHED) ||
1691                                     sctp_sstate(sk, CLOSING)))
1692                 return -EADDRNOTAVAIL;
1693
1694         if (sctp_endpoint_is_peeled_off(ep, daddr))
1695                 return -EADDRNOTAVAIL;
1696
1697         if (!ep->base.bind_addr.port) {
1698                 if (sctp_autobind(sk))
1699                         return -EAGAIN;
1700         } else {
1701                 if (ep->base.bind_addr.port < inet_prot_sock(net) &&
1702                     !ns_capable(net->user_ns, CAP_NET_BIND_SERVICE))
1703                         return -EACCES;
1704         }
1705
1706         scope = sctp_scope(daddr);
1707
1708         /* Label connection socket for first association 1-to-many
1709          * style for client sequence socket()->sendmsg(). This
1710          * needs to be done before sctp_assoc_add_peer() as that will
1711          * set up the initial packet that needs to account for any
1712          * security ip options (CIPSO/CALIPSO) added to the packet.
1713          */
1714         af = sctp_get_af_specific(daddr->sa.sa_family);
1715         if (!af)
1716                 return -EINVAL;
1717         err = security_sctp_bind_connect(sk, SCTP_SENDMSG_CONNECT,
1718                                          (struct sockaddr *)daddr,
1719                                          af->sockaddr_len);
1720         if (err < 0)
1721                 return err;
1722
1723         asoc = sctp_association_new(ep, sk, scope, GFP_KERNEL);
1724         if (!asoc)
1725                 return -ENOMEM;
1726
1727         if (sctp_assoc_set_bind_addr_from_ep(asoc, scope, GFP_KERNEL) < 0) {
1728                 err = -ENOMEM;
1729                 goto free;
1730         }
1731
1732         if (cmsgs->init) {
1733                 struct sctp_initmsg *init = cmsgs->init;
1734
1735                 if (init->sinit_num_ostreams) {
1736                         __u16 outcnt = init->sinit_num_ostreams;
1737
1738                         asoc->c.sinit_num_ostreams = outcnt;
1739                         /* outcnt has been changed, need to re-init stream */
1740                         err = sctp_stream_init(&asoc->stream, outcnt, 0,
1741                                                GFP_KERNEL);
1742                         if (err)
1743                                 goto free;
1744                 }
1745
1746                 if (init->sinit_max_instreams)
1747                         asoc->c.sinit_max_instreams = init->sinit_max_instreams;
1748
1749                 if (init->sinit_max_attempts)
1750                         asoc->max_init_attempts = init->sinit_max_attempts;
1751
1752                 if (init->sinit_max_init_timeo)
1753                         asoc->max_init_timeo =
1754                                 msecs_to_jiffies(init->sinit_max_init_timeo);
1755         }
1756
1757         *tp = sctp_assoc_add_peer(asoc, daddr, GFP_KERNEL, SCTP_UNKNOWN);
1758         if (!*tp) {
1759                 err = -ENOMEM;
1760                 goto free;
1761         }
1762
1763         if (!cmsgs->addrs_msg)
1764                 return 0;
1765
1766         if (daddr->sa.sa_family == AF_INET6)
1767                 flowinfo = daddr->v6.sin6_flowinfo;
1768
1769         /* sendv addr list parse */
1770         for_each_cmsghdr(cmsg, cmsgs->addrs_msg) {
1771                 struct sctp_transport *transport;
1772                 struct sctp_association *old;
1773                 union sctp_addr _daddr;
1774                 int dlen;
1775
1776                 if (cmsg->cmsg_level != IPPROTO_SCTP ||
1777                     (cmsg->cmsg_type != SCTP_DSTADDRV4 &&
1778                      cmsg->cmsg_type != SCTP_DSTADDRV6))
1779                         continue;
1780
1781                 daddr = &_daddr;
1782                 memset(daddr, 0, sizeof(*daddr));
1783                 dlen = cmsg->cmsg_len - sizeof(struct cmsghdr);
1784                 if (cmsg->cmsg_type == SCTP_DSTADDRV4) {
1785                         if (dlen < sizeof(struct in_addr)) {
1786                                 err = -EINVAL;
1787                                 goto free;
1788                         }
1789
1790                         dlen = sizeof(struct in_addr);
1791                         daddr->v4.sin_family = AF_INET;
1792                         daddr->v4.sin_port = htons(asoc->peer.port);
1793                         memcpy(&daddr->v4.sin_addr, CMSG_DATA(cmsg), dlen);
1794                 } else {
1795                         if (dlen < sizeof(struct in6_addr)) {
1796                                 err = -EINVAL;
1797                                 goto free;
1798                         }
1799
1800                         dlen = sizeof(struct in6_addr);
1801                         daddr->v6.sin6_flowinfo = flowinfo;
1802                         daddr->v6.sin6_family = AF_INET6;
1803                         daddr->v6.sin6_port = htons(asoc->peer.port);
1804                         memcpy(&daddr->v6.sin6_addr, CMSG_DATA(cmsg), dlen);
1805                 }
1806                 err = sctp_verify_addr(sk, daddr, sizeof(*daddr));
1807                 if (err)
1808                         goto free;
1809
1810                 old = sctp_endpoint_lookup_assoc(ep, daddr, &transport);
1811                 if (old && old != asoc) {
1812                         if (old->state >= SCTP_STATE_ESTABLISHED)
1813                                 err = -EISCONN;
1814                         else
1815                                 err = -EALREADY;
1816                         goto free;
1817                 }
1818
1819                 if (sctp_endpoint_is_peeled_off(ep, daddr)) {
1820                         err = -EADDRNOTAVAIL;
1821                         goto free;
1822                 }
1823
1824                 transport = sctp_assoc_add_peer(asoc, daddr, GFP_KERNEL,
1825                                                 SCTP_UNKNOWN);
1826                 if (!transport) {
1827                         err = -ENOMEM;
1828                         goto free;
1829                 }
1830         }
1831
1832         return 0;
1833
1834 free:
1835         sctp_association_free(asoc);
1836         return err;
1837 }
1838
1839 static int sctp_sendmsg_check_sflags(struct sctp_association *asoc,
1840                                      __u16 sflags, struct msghdr *msg,
1841                                      size_t msg_len)
1842 {
1843         struct sock *sk = asoc->base.sk;
1844         struct net *net = sock_net(sk);
1845
1846         if (sctp_state(asoc, CLOSED) && sctp_style(sk, TCP))
1847                 return -EPIPE;
1848
1849         if ((sflags & SCTP_SENDALL) && sctp_style(sk, UDP) &&
1850             !sctp_state(asoc, ESTABLISHED))
1851                 return 0;
1852
1853         if (sflags & SCTP_EOF) {
1854                 pr_debug("%s: shutting down association:%p\n", __func__, asoc);
1855                 sctp_primitive_SHUTDOWN(net, asoc, NULL);
1856
1857                 return 0;
1858         }
1859
1860         if (sflags & SCTP_ABORT) {
1861                 struct sctp_chunk *chunk;
1862
1863                 chunk = sctp_make_abort_user(asoc, msg, msg_len);
1864                 if (!chunk)
1865                         return -ENOMEM;
1866
1867                 pr_debug("%s: aborting association:%p\n", __func__, asoc);
1868                 sctp_primitive_ABORT(net, asoc, chunk);
1869                 iov_iter_revert(&msg->msg_iter, msg_len);
1870
1871                 return 0;
1872         }
1873
1874         return 1;
1875 }
1876
1877 static int sctp_sendmsg_to_asoc(struct sctp_association *asoc,
1878                                 struct msghdr *msg, size_t msg_len,
1879                                 struct sctp_transport *transport,
1880                                 struct sctp_sndrcvinfo *sinfo)
1881 {
1882         struct sock *sk = asoc->base.sk;
1883         struct sctp_sock *sp = sctp_sk(sk);
1884         struct net *net = sock_net(sk);
1885         struct sctp_datamsg *datamsg;
1886         bool wait_connect = false;
1887         struct sctp_chunk *chunk;
1888         long timeo;
1889         int err;
1890
1891         if (sinfo->sinfo_stream >= asoc->stream.outcnt) {
1892                 err = -EINVAL;
1893                 goto err;
1894         }
1895
1896         if (unlikely(!SCTP_SO(&asoc->stream, sinfo->sinfo_stream)->ext)) {
1897                 err = sctp_stream_init_ext(&asoc->stream, sinfo->sinfo_stream);
1898                 if (err)
1899                         goto err;
1900         }
1901
1902         if (sp->disable_fragments && msg_len > asoc->frag_point) {
1903                 err = -EMSGSIZE;
1904                 goto err;
1905         }
1906
1907         if (asoc->pmtu_pending) {
1908                 if (sp->param_flags & SPP_PMTUD_ENABLE)
1909                         sctp_assoc_sync_pmtu(asoc);
1910                 asoc->pmtu_pending = 0;
1911         }
1912
1913         if (sctp_wspace(asoc) < (int)msg_len)
1914                 sctp_prsctp_prune(asoc, sinfo, msg_len - sctp_wspace(asoc));
1915
1916         if (sctp_wspace(asoc) <= 0) {
1917                 timeo = sock_sndtimeo(sk, msg->msg_flags & MSG_DONTWAIT);
1918                 err = sctp_wait_for_sndbuf(asoc, &timeo, msg_len);
1919                 if (err)
1920                         goto err;
1921         }
1922
1923         if (sctp_state(asoc, CLOSED)) {
1924                 err = sctp_primitive_ASSOCIATE(net, asoc, NULL);
1925                 if (err)
1926                         goto err;
1927
1928                 if (sp->strm_interleave) {
1929                         timeo = sock_sndtimeo(sk, 0);
1930                         err = sctp_wait_for_connect(asoc, &timeo);
1931                         if (err) {
1932                                 err = -ESRCH;
1933                                 goto err;
1934                         }
1935                 } else {
1936                         wait_connect = true;
1937                 }
1938
1939                 pr_debug("%s: we associated primitively\n", __func__);
1940         }
1941
1942         datamsg = sctp_datamsg_from_user(asoc, sinfo, &msg->msg_iter);
1943         if (IS_ERR(datamsg)) {
1944                 err = PTR_ERR(datamsg);
1945                 goto err;
1946         }
1947
1948         asoc->force_delay = !!(msg->msg_flags & MSG_MORE);
1949
1950         list_for_each_entry(chunk, &datamsg->chunks, frag_list) {
1951                 sctp_chunk_hold(chunk);
1952                 sctp_set_owner_w(chunk);
1953                 chunk->transport = transport;
1954         }
1955
1956         err = sctp_primitive_SEND(net, asoc, datamsg);
1957         if (err) {
1958                 sctp_datamsg_free(datamsg);
1959                 goto err;
1960         }
1961
1962         pr_debug("%s: we sent primitively\n", __func__);
1963
1964         sctp_datamsg_put(datamsg);
1965
1966         if (unlikely(wait_connect)) {
1967                 timeo = sock_sndtimeo(sk, msg->msg_flags & MSG_DONTWAIT);
1968                 sctp_wait_for_connect(asoc, &timeo);
1969         }
1970
1971         err = msg_len;
1972
1973 err:
1974         return err;
1975 }
1976
1977 static union sctp_addr *sctp_sendmsg_get_daddr(struct sock *sk,
1978                                                const struct msghdr *msg,
1979                                                struct sctp_cmsgs *cmsgs)
1980 {
1981         union sctp_addr *daddr = NULL;
1982         int err;
1983
1984         if (!sctp_style(sk, UDP_HIGH_BANDWIDTH) && msg->msg_name) {
1985                 int len = msg->msg_namelen;
1986
1987                 if (len > sizeof(*daddr))
1988                         len = sizeof(*daddr);
1989
1990                 daddr = (union sctp_addr *)msg->msg_name;
1991
1992                 err = sctp_verify_addr(sk, daddr, len);
1993                 if (err)
1994                         return ERR_PTR(err);
1995         }
1996
1997         return daddr;
1998 }
1999
2000 static void sctp_sendmsg_update_sinfo(struct sctp_association *asoc,
2001                                       struct sctp_sndrcvinfo *sinfo,
2002                                       struct sctp_cmsgs *cmsgs)
2003 {
2004         if (!cmsgs->srinfo && !cmsgs->sinfo) {
2005                 sinfo->sinfo_stream = asoc->default_stream;
2006                 sinfo->sinfo_ppid = asoc->default_ppid;
2007                 sinfo->sinfo_context = asoc->default_context;
2008                 sinfo->sinfo_assoc_id = sctp_assoc2id(asoc);
2009
2010                 if (!cmsgs->prinfo)
2011                         sinfo->sinfo_flags = asoc->default_flags;
2012         }
2013
2014         if (!cmsgs->srinfo && !cmsgs->prinfo)
2015                 sinfo->sinfo_timetolive = asoc->default_timetolive;
2016
2017         if (cmsgs->authinfo) {
2018                 /* Reuse sinfo_tsn to indicate that authinfo was set and
2019                  * sinfo_ssn to save the keyid on tx path.
2020                  */
2021                 sinfo->sinfo_tsn = 1;
2022                 sinfo->sinfo_ssn = cmsgs->authinfo->auth_keynumber;
2023         }
2024 }
2025
2026 static int sctp_sendmsg(struct sock *sk, struct msghdr *msg, size_t msg_len)
2027 {
2028         struct sctp_endpoint *ep = sctp_sk(sk)->ep;
2029         struct sctp_transport *transport = NULL;
2030         struct sctp_sndrcvinfo _sinfo, *sinfo;
2031         struct sctp_association *asoc, *tmp;
2032         struct sctp_cmsgs cmsgs;
2033         union sctp_addr *daddr;
2034         bool new = false;
2035         __u16 sflags;
2036         int err;
2037
2038         /* Parse and get snd_info */
2039         err = sctp_sendmsg_parse(sk, &cmsgs, &_sinfo, msg, msg_len);
2040         if (err)
2041                 goto out;
2042
2043         sinfo  = &_sinfo;
2044         sflags = sinfo->sinfo_flags;
2045
2046         /* Get daddr from msg */
2047         daddr = sctp_sendmsg_get_daddr(sk, msg, &cmsgs);
2048         if (IS_ERR(daddr)) {
2049                 err = PTR_ERR(daddr);
2050                 goto out;
2051         }
2052
2053         lock_sock(sk);
2054
2055         /* SCTP_SENDALL process */
2056         if ((sflags & SCTP_SENDALL) && sctp_style(sk, UDP)) {
2057                 list_for_each_entry_safe(asoc, tmp, &ep->asocs, asocs) {
2058                         err = sctp_sendmsg_check_sflags(asoc, sflags, msg,
2059                                                         msg_len);
2060                         if (err == 0)
2061                                 continue;
2062                         if (err < 0)
2063                                 goto out_unlock;
2064
2065                         sctp_sendmsg_update_sinfo(asoc, sinfo, &cmsgs);
2066
2067                         err = sctp_sendmsg_to_asoc(asoc, msg, msg_len,
2068                                                    NULL, sinfo);
2069                         if (err < 0)
2070                                 goto out_unlock;
2071
2072                         iov_iter_revert(&msg->msg_iter, err);
2073                 }
2074
2075                 goto out_unlock;
2076         }
2077
2078         /* Get and check or create asoc */
2079         if (daddr) {
2080                 asoc = sctp_endpoint_lookup_assoc(ep, daddr, &transport);
2081                 if (asoc) {
2082                         err = sctp_sendmsg_check_sflags(asoc, sflags, msg,
2083                                                         msg_len);
2084                         if (err <= 0)
2085                                 goto out_unlock;
2086                 } else {
2087                         err = sctp_sendmsg_new_asoc(sk, sflags, &cmsgs, daddr,
2088                                                     &transport);
2089                         if (err)
2090                                 goto out_unlock;
2091
2092                         asoc = transport->asoc;
2093                         new = true;
2094                 }
2095
2096                 if (!sctp_style(sk, TCP) && !(sflags & SCTP_ADDR_OVER))
2097                         transport = NULL;
2098         } else {
2099                 asoc = sctp_id2assoc(sk, sinfo->sinfo_assoc_id);
2100                 if (!asoc) {
2101                         err = -EPIPE;
2102                         goto out_unlock;
2103                 }
2104
2105                 err = sctp_sendmsg_check_sflags(asoc, sflags, msg, msg_len);
2106                 if (err <= 0)
2107                         goto out_unlock;
2108         }
2109
2110         /* Update snd_info with the asoc */
2111         sctp_sendmsg_update_sinfo(asoc, sinfo, &cmsgs);
2112
2113         /* Send msg to the asoc */
2114         err = sctp_sendmsg_to_asoc(asoc, msg, msg_len, transport, sinfo);
2115         if (err < 0 && err != -ESRCH && new)
2116                 sctp_association_free(asoc);
2117
2118 out_unlock:
2119         release_sock(sk);
2120 out:
2121         return sctp_error(sk, msg->msg_flags, err);
2122 }
2123
2124 /* This is an extended version of skb_pull() that removes the data from the
2125  * start of a skb even when data is spread across the list of skb's in the
2126  * frag_list. len specifies the total amount of data that needs to be removed.
2127  * when 'len' bytes could be removed from the skb, it returns 0.
2128  * If 'len' exceeds the total skb length,  it returns the no. of bytes that
2129  * could not be removed.
2130  */
2131 static int sctp_skb_pull(struct sk_buff *skb, int len)
2132 {
2133         struct sk_buff *list;
2134         int skb_len = skb_headlen(skb);
2135         int rlen;
2136
2137         if (len <= skb_len) {
2138                 __skb_pull(skb, len);
2139                 return 0;
2140         }
2141         len -= skb_len;
2142         __skb_pull(skb, skb_len);
2143
2144         skb_walk_frags(skb, list) {
2145                 rlen = sctp_skb_pull(list, len);
2146                 skb->len -= (len-rlen);
2147                 skb->data_len -= (len-rlen);
2148
2149                 if (!rlen)
2150                         return 0;
2151
2152                 len = rlen;
2153         }
2154
2155         return len;
2156 }
2157
2158 /* API 3.1.3  recvmsg() - UDP Style Syntax
2159  *
2160  *  ssize_t recvmsg(int socket, struct msghdr *message,
2161  *                    int flags);
2162  *
2163  *  socket  - the socket descriptor of the endpoint.
2164  *  message - pointer to the msghdr structure which contains a single
2165  *            user message and possibly some ancillary data.
2166  *
2167  *            See Section 5 for complete description of the data
2168  *            structures.
2169  *
2170  *  flags   - flags sent or received with the user message, see Section
2171  *            5 for complete description of the flags.
2172  */
2173 static int sctp_recvmsg(struct sock *sk, struct msghdr *msg, size_t len,
2174                         int noblock, int flags, int *addr_len)
2175 {
2176         struct sctp_ulpevent *event = NULL;
2177         struct sctp_sock *sp = sctp_sk(sk);
2178         struct sk_buff *skb, *head_skb;
2179         int copied;
2180         int err = 0;
2181         int skb_len;
2182
2183         pr_debug("%s: sk:%p, msghdr:%p, len:%zd, noblock:%d, flags:0x%x, "
2184                  "addr_len:%p)\n", __func__, sk, msg, len, noblock, flags,
2185                  addr_len);
2186
2187         lock_sock(sk);
2188
2189         if (sctp_style(sk, TCP) && !sctp_sstate(sk, ESTABLISHED) &&
2190             !sctp_sstate(sk, CLOSING) && !sctp_sstate(sk, CLOSED)) {
2191                 err = -ENOTCONN;
2192                 goto out;
2193         }
2194
2195         skb = sctp_skb_recv_datagram(sk, flags, noblock, &err);
2196         if (!skb)
2197                 goto out;
2198
2199         /* Get the total length of the skb including any skb's in the
2200          * frag_list.
2201          */
2202         skb_len = skb->len;
2203
2204         copied = skb_len;
2205         if (copied > len)
2206                 copied = len;
2207
2208         err = skb_copy_datagram_msg(skb, 0, msg, copied);
2209
2210         event = sctp_skb2event(skb);
2211
2212         if (err)
2213                 goto out_free;
2214
2215         if (event->chunk && event->chunk->head_skb)
2216                 head_skb = event->chunk->head_skb;
2217         else
2218                 head_skb = skb;
2219         sock_recv_ts_and_drops(msg, sk, head_skb);
2220         if (sctp_ulpevent_is_notification(event)) {
2221                 msg->msg_flags |= MSG_NOTIFICATION;
2222                 sp->pf->event_msgname(event, msg->msg_name, addr_len);
2223         } else {
2224                 sp->pf->skb_msgname(head_skb, msg->msg_name, addr_len);
2225         }
2226
2227         /* Check if we allow SCTP_NXTINFO. */
2228         if (sp->recvnxtinfo)
2229                 sctp_ulpevent_read_nxtinfo(event, msg, sk);
2230         /* Check if we allow SCTP_RCVINFO. */
2231         if (sp->recvrcvinfo)
2232                 sctp_ulpevent_read_rcvinfo(event, msg);
2233         /* Check if we allow SCTP_SNDRCVINFO. */
2234         if (sctp_ulpevent_type_enabled(sp->subscribe, SCTP_DATA_IO_EVENT))
2235                 sctp_ulpevent_read_sndrcvinfo(event, msg);
2236
2237         err = copied;
2238
2239         /* If skb's length exceeds the user's buffer, update the skb and
2240          * push it back to the receive_queue so that the next call to
2241          * recvmsg() will return the remaining data. Don't set MSG_EOR.
2242          */
2243         if (skb_len > copied) {
2244                 msg->msg_flags &= ~MSG_EOR;
2245                 if (flags & MSG_PEEK)
2246                         goto out_free;
2247                 sctp_skb_pull(skb, copied);
2248                 skb_queue_head(&sk->sk_receive_queue, skb);
2249
2250                 /* When only partial message is copied to the user, increase
2251                  * rwnd by that amount. If all the data in the skb is read,
2252                  * rwnd is updated when the event is freed.
2253                  */
2254                 if (!sctp_ulpevent_is_notification(event))
2255                         sctp_assoc_rwnd_increase(event->asoc, copied);
2256                 goto out;
2257         } else if ((event->msg_flags & MSG_NOTIFICATION) ||
2258                    (event->msg_flags & MSG_EOR))
2259                 msg->msg_flags |= MSG_EOR;
2260         else
2261                 msg->msg_flags &= ~MSG_EOR;
2262
2263 out_free:
2264         if (flags & MSG_PEEK) {
2265                 /* Release the skb reference acquired after peeking the skb in
2266                  * sctp_skb_recv_datagram().
2267                  */
2268                 kfree_skb(skb);
2269         } else {
2270                 /* Free the event which includes releasing the reference to
2271                  * the owner of the skb, freeing the skb and updating the
2272                  * rwnd.
2273                  */
2274                 sctp_ulpevent_free(event);
2275         }
2276 out:
2277         release_sock(sk);
2278         return err;
2279 }
2280
2281 /* 7.1.12 Enable/Disable message fragmentation (SCTP_DISABLE_FRAGMENTS)
2282  *
2283  * This option is a on/off flag.  If enabled no SCTP message
2284  * fragmentation will be performed.  Instead if a message being sent
2285  * exceeds the current PMTU size, the message will NOT be sent and
2286  * instead a error will be indicated to the user.
2287  */
2288 static int sctp_setsockopt_disable_fragments(struct sock *sk,
2289                                              char __user *optval,
2290                                              unsigned int optlen)
2291 {
2292         int val;
2293
2294         if (optlen < sizeof(int))
2295                 return -EINVAL;
2296
2297         if (get_user(val, (int __user *)optval))
2298                 return -EFAULT;
2299
2300         sctp_sk(sk)->disable_fragments = (val == 0) ? 0 : 1;
2301
2302         return 0;
2303 }
2304
2305 static int sctp_setsockopt_events(struct sock *sk, char __user *optval,
2306                                   unsigned int optlen)
2307 {
2308         struct sctp_event_subscribe subscribe;
2309         __u8 *sn_type = (__u8 *)&subscribe;
2310         struct sctp_sock *sp = sctp_sk(sk);
2311         struct sctp_association *asoc;
2312         int i;
2313
2314         if (optlen > sizeof(struct sctp_event_subscribe))
2315                 return -EINVAL;
2316
2317         if (copy_from_user(&subscribe, optval, optlen))
2318                 return -EFAULT;
2319
2320         for (i = 0; i < optlen; i++)
2321                 sctp_ulpevent_type_set(&sp->subscribe, SCTP_SN_TYPE_BASE + i,
2322                                        sn_type[i]);
2323
2324         list_for_each_entry(asoc, &sp->ep->asocs, asocs)
2325                 asoc->subscribe = sctp_sk(sk)->subscribe;
2326
2327         /* At the time when a user app subscribes to SCTP_SENDER_DRY_EVENT,
2328          * if there is no data to be sent or retransmit, the stack will
2329          * immediately send up this notification.
2330          */
2331         if (sctp_ulpevent_type_enabled(sp->subscribe, SCTP_SENDER_DRY_EVENT)) {
2332                 struct sctp_ulpevent *event;
2333
2334                 asoc = sctp_id2assoc(sk, 0);
2335                 if (asoc && sctp_outq_is_empty(&asoc->outqueue)) {
2336                         event = sctp_ulpevent_make_sender_dry_event(asoc,
2337                                         GFP_USER | __GFP_NOWARN);
2338                         if (!event)
2339                                 return -ENOMEM;
2340
2341                         asoc->stream.si->enqueue_event(&asoc->ulpq, event);
2342                 }
2343         }
2344
2345         return 0;
2346 }
2347
2348 /* 7.1.8 Automatic Close of associations (SCTP_AUTOCLOSE)
2349  *
2350  * This socket option is applicable to the UDP-style socket only.  When
2351  * set it will cause associations that are idle for more than the
2352  * specified number of seconds to automatically close.  An association
2353  * being idle is defined an association that has NOT sent or received
2354  * user data.  The special value of '0' indicates that no automatic
2355  * close of any associations should be performed.  The option expects an
2356  * integer defining the number of seconds of idle time before an
2357  * association is closed.
2358  */
2359 static int sctp_setsockopt_autoclose(struct sock *sk, char __user *optval,
2360                                      unsigned int optlen)
2361 {
2362         struct sctp_sock *sp = sctp_sk(sk);
2363         struct net *net = sock_net(sk);
2364
2365         /* Applicable to UDP-style socket only */
2366         if (sctp_style(sk, TCP))
2367                 return -EOPNOTSUPP;
2368         if (optlen != sizeof(int))
2369                 return -EINVAL;
2370         if (copy_from_user(&sp->autoclose, optval, optlen))
2371                 return -EFAULT;
2372
2373         if (sp->autoclose > net->sctp.max_autoclose)
2374                 sp->autoclose = net->sctp.max_autoclose;
2375
2376         return 0;
2377 }
2378
2379 /* 7.1.13 Peer Address Parameters (SCTP_PEER_ADDR_PARAMS)
2380  *
2381  * Applications can enable or disable heartbeats for any peer address of
2382  * an association, modify an address's heartbeat interval, force a
2383  * heartbeat to be sent immediately, and adjust the address's maximum
2384  * number of retransmissions sent before an address is considered
2385  * unreachable.  The following structure is used to access and modify an
2386  * address's parameters:
2387  *
2388  *  struct sctp_paddrparams {
2389  *     sctp_assoc_t            spp_assoc_id;
2390  *     struct sockaddr_storage spp_address;
2391  *     uint32_t                spp_hbinterval;
2392  *     uint16_t                spp_pathmaxrxt;
2393  *     uint32_t                spp_pathmtu;
2394  *     uint32_t                spp_sackdelay;
2395  *     uint32_t                spp_flags;
2396  *     uint32_t                spp_ipv6_flowlabel;
2397  *     uint8_t                 spp_dscp;
2398  * };
2399  *
2400  *   spp_assoc_id    - (one-to-many style socket) This is filled in the
2401  *                     application, and identifies the association for
2402  *                     this query.
2403  *   spp_address     - This specifies which address is of interest.
2404  *   spp_hbinterval  - This contains the value of the heartbeat interval,
2405  *                     in milliseconds.  If a  value of zero
2406  *                     is present in this field then no changes are to
2407  *                     be made to this parameter.
2408  *   spp_pathmaxrxt  - This contains the maximum number of
2409  *                     retransmissions before this address shall be
2410  *                     considered unreachable. If a  value of zero
2411  *                     is present in this field then no changes are to
2412  *                     be made to this parameter.
2413  *   spp_pathmtu     - When Path MTU discovery is disabled the value
2414  *                     specified here will be the "fixed" path mtu.
2415  *                     Note that if the spp_address field is empty
2416  *                     then all associations on this address will
2417  *                     have this fixed path mtu set upon them.
2418  *
2419  *   spp_sackdelay   - When delayed sack is enabled, this value specifies
2420  *                     the number of milliseconds that sacks will be delayed
2421  *                     for. This value will apply to all addresses of an
2422  *                     association if the spp_address field is empty. Note
2423  *                     also, that if delayed sack is enabled and this
2424  *                     value is set to 0, no change is made to the last
2425  *                     recorded delayed sack timer value.
2426  *
2427  *   spp_flags       - These flags are used to control various features
2428  *                     on an association. The flag field may contain
2429  *                     zero or more of the following options.
2430  *
2431  *                     SPP_HB_ENABLE  - Enable heartbeats on the
2432  *                     specified address. Note that if the address
2433  *                     field is empty all addresses for the association
2434  *                     have heartbeats enabled upon them.
2435  *
2436  *                     SPP_HB_DISABLE - Disable heartbeats on the
2437  *                     speicifed address. Note that if the address
2438  *                     field is empty all addresses for the association
2439  *                     will have their heartbeats disabled. Note also
2440  *                     that SPP_HB_ENABLE and SPP_HB_DISABLE are
2441  *                     mutually exclusive, only one of these two should
2442  *                     be specified. Enabling both fields will have
2443  *                     undetermined results.
2444  *
2445  *                     SPP_HB_DEMAND - Request a user initiated heartbeat
2446  *                     to be made immediately.
2447  *
2448  *                     SPP_HB_TIME_IS_ZERO - Specify's that the time for
2449  *                     heartbeat delayis to be set to the value of 0
2450  *                     milliseconds.
2451  *
2452  *                     SPP_PMTUD_ENABLE - This field will enable PMTU
2453  *                     discovery upon the specified address. Note that
2454  *                     if the address feild is empty then all addresses
2455  *                     on the association are effected.
2456  *
2457  *                     SPP_PMTUD_DISABLE - This field will disable PMTU
2458  *                     discovery upon the specified address. Note that
2459  *                     if the address feild is empty then all addresses
2460  *                     on the association are effected. Not also that
2461  *                     SPP_PMTUD_ENABLE and SPP_PMTUD_DISABLE are mutually
2462  *                     exclusive. Enabling both will have undetermined
2463  *                     results.
2464  *
2465  *                     SPP_SACKDELAY_ENABLE - Setting this flag turns
2466  *                     on delayed sack. The time specified in spp_sackdelay
2467  *                     is used to specify the sack delay for this address. Note
2468  *                     that if spp_address is empty then all addresses will
2469  *                     enable delayed sack and take on the sack delay
2470  *                     value specified in spp_sackdelay.
2471  *                     SPP_SACKDELAY_DISABLE - Setting this flag turns
2472  *                     off delayed sack. If the spp_address field is blank then
2473  *                     delayed sack is disabled for the entire association. Note
2474  *                     also that this field is mutually exclusive to
2475  *                     SPP_SACKDELAY_ENABLE, setting both will have undefined
2476  *                     results.
2477  *
2478  *                     SPP_IPV6_FLOWLABEL:  Setting this flag enables the
2479  *                     setting of the IPV6 flow label value.  The value is
2480  *                     contained in the spp_ipv6_flowlabel field.
2481  *                     Upon retrieval, this flag will be set to indicate that
2482  *                     the spp_ipv6_flowlabel field has a valid value returned.
2483  *                     If a specific destination address is set (in the
2484  *                     spp_address field), then the value returned is that of
2485  *                     the address.  If just an association is specified (and
2486  *                     no address), then the association's default flow label
2487  *                     is returned.  If neither an association nor a destination
2488  *                     is specified, then the socket's default flow label is
2489  *                     returned.  For non-IPv6 sockets, this flag will be left
2490  *                     cleared.
2491  *
2492  *                     SPP_DSCP:  Setting this flag enables the setting of the
2493  *                     Differentiated Services Code Point (DSCP) value
2494  *                     associated with either the association or a specific
2495  *                     address.  The value is obtained in the spp_dscp field.
2496  *                     Upon retrieval, this flag will be set to indicate that
2497  *                     the spp_dscp field has a valid value returned.  If a
2498  *                     specific destination address is set when called (in the
2499  *                     spp_address field), then that specific destination
2500  *                     address's DSCP value is returned.  If just an association
2501  *                     is specified, then the association's default DSCP is
2502  *                     returned.  If neither an association nor a destination is
2503  *                     specified, then the socket's default DSCP is returned.
2504  *
2505  *   spp_ipv6_flowlabel
2506  *                   - This field is used in conjunction with the
2507  *                     SPP_IPV6_FLOWLABEL flag and contains the IPv6 flow label.
2508  *                     The 20 least significant bits are used for the flow
2509  *                     label.  This setting has precedence over any IPv6-layer
2510  *                     setting.
2511  *
2512  *   spp_dscp        - This field is used in conjunction with the SPP_DSCP flag
2513  *                     and contains the DSCP.  The 6 most significant bits are
2514  *                     used for the DSCP.  This setting has precedence over any
2515  *                     IPv4- or IPv6- layer setting.
2516  */
2517 static int sctp_apply_peer_addr_params(struct sctp_paddrparams *params,
2518                                        struct sctp_transport   *trans,
2519                                        struct sctp_association *asoc,
2520                                        struct sctp_sock        *sp,
2521                                        int                      hb_change,
2522                                        int                      pmtud_change,
2523                                        int                      sackdelay_change)
2524 {
2525         int error;
2526
2527         if (params->spp_flags & SPP_HB_DEMAND && trans) {
2528                 struct net *net = sock_net(trans->asoc->base.sk);
2529
2530                 error = sctp_primitive_REQUESTHEARTBEAT(net, trans->asoc, trans);
2531                 if (error)
2532                         return error;
2533         }
2534
2535         /* Note that unless the spp_flag is set to SPP_HB_ENABLE the value of
2536          * this field is ignored.  Note also that a value of zero indicates
2537          * the current setting should be left unchanged.
2538          */
2539         if (params->spp_flags & SPP_HB_ENABLE) {
2540
2541                 /* Re-zero the interval if the SPP_HB_TIME_IS_ZERO is
2542                  * set.  This lets us use 0 value when this flag
2543                  * is set.
2544                  */
2545                 if (params->spp_flags & SPP_HB_TIME_IS_ZERO)
2546                         params->spp_hbinterval = 0;
2547
2548                 if (params->spp_hbinterval ||
2549                     (params->spp_flags & SPP_HB_TIME_IS_ZERO)) {
2550                         if (trans) {
2551                                 trans->hbinterval =
2552                                     msecs_to_jiffies(params->spp_hbinterval);
2553                         } else if (asoc) {
2554                                 asoc->hbinterval =
2555                                     msecs_to_jiffies(params->spp_hbinterval);
2556                         } else {
2557                                 sp->hbinterval = params->spp_hbinterval;
2558                         }
2559                 }
2560         }
2561
2562         if (hb_change) {
2563                 if (trans) {
2564                         trans->param_flags =
2565                                 (trans->param_flags & ~SPP_HB) | hb_change;
2566                 } else if (asoc) {
2567                         asoc->param_flags =
2568                                 (asoc->param_flags & ~SPP_HB) | hb_change;
2569                 } else {
2570                         sp->param_flags =
2571                                 (sp->param_flags & ~SPP_HB) | hb_change;
2572                 }
2573         }
2574
2575         /* When Path MTU discovery is disabled the value specified here will
2576          * be the "fixed" path mtu (i.e. the value of the spp_flags field must
2577          * include the flag SPP_PMTUD_DISABLE for this field to have any
2578          * effect).
2579          */
2580         if ((params->spp_flags & SPP_PMTUD_DISABLE) && params->spp_pathmtu) {
2581                 if (trans) {
2582                         trans->pathmtu = params->spp_pathmtu;
2583                         sctp_assoc_sync_pmtu(asoc);
2584                 } else if (asoc) {
2585                         sctp_assoc_set_pmtu(asoc, params->spp_pathmtu);
2586                 } else {
2587                         sp->pathmtu = params->spp_pathmtu;
2588                 }
2589         }
2590
2591         if (pmtud_change) {
2592                 if (trans) {
2593                         int update = (trans->param_flags & SPP_PMTUD_DISABLE) &&
2594                                 (params->spp_flags & SPP_PMTUD_ENABLE);
2595                         trans->param_flags =
2596                                 (trans->param_flags & ~SPP_PMTUD) | pmtud_change;
2597                         if (update) {
2598                                 sctp_transport_pmtu(trans, sctp_opt2sk(sp));
2599                                 sctp_assoc_sync_pmtu(asoc);
2600                         }
2601                 } else if (asoc) {
2602                         asoc->param_flags =
2603                                 (asoc->param_flags & ~SPP_PMTUD) | pmtud_change;
2604                 } else {
2605                         sp->param_flags =
2606                                 (sp->param_flags & ~SPP_PMTUD) | pmtud_change;
2607                 }
2608         }
2609
2610         /* Note that unless the spp_flag is set to SPP_SACKDELAY_ENABLE the
2611          * value of this field is ignored.  Note also that a value of zero
2612          * indicates the current setting should be left unchanged.
2613          */
2614         if ((params->spp_flags & SPP_SACKDELAY_ENABLE) && params->spp_sackdelay) {
2615                 if (trans) {
2616                         trans->sackdelay =
2617                                 msecs_to_jiffies(params->spp_sackdelay);
2618                 } else if (asoc) {
2619                         asoc->sackdelay =
2620                                 msecs_to_jiffies(params->spp_sackdelay);
2621                 } else {
2622                         sp->sackdelay = params->spp_sackdelay;
2623                 }
2624         }
2625
2626         if (sackdelay_change) {
2627                 if (trans) {
2628                         trans->param_flags =
2629                                 (trans->param_flags & ~SPP_SACKDELAY) |
2630                                 sackdelay_change;
2631                 } else if (asoc) {
2632                         asoc->param_flags =
2633                                 (asoc->param_flags & ~SPP_SACKDELAY) |
2634                                 sackdelay_change;
2635                 } else {
2636                         sp->param_flags =
2637                                 (sp->param_flags & ~SPP_SACKDELAY) |
2638                                 sackdelay_change;
2639                 }
2640         }
2641
2642         /* Note that a value of zero indicates the current setting should be
2643            left unchanged.
2644          */
2645         if (params->spp_pathmaxrxt) {
2646                 if (trans) {
2647                         trans->pathmaxrxt = params->spp_pathmaxrxt;
2648                 } else if (asoc) {
2649                         asoc->pathmaxrxt = params->spp_pathmaxrxt;
2650                 } else {
2651                         sp->pathmaxrxt = params->spp_pathmaxrxt;
2652                 }
2653         }
2654
2655         if (params->spp_flags & SPP_IPV6_FLOWLABEL) {
2656                 if (trans) {
2657                         if (trans->ipaddr.sa.sa_family == AF_INET6) {
2658                                 trans->flowlabel = params->spp_ipv6_flowlabel &
2659                                                    SCTP_FLOWLABEL_VAL_MASK;
2660                                 trans->flowlabel |= SCTP_FLOWLABEL_SET_MASK;
2661                         }
2662                 } else if (asoc) {
2663                         struct sctp_transport *t;
2664
2665                         list_for_each_entry(t, &asoc->peer.transport_addr_list,
2666                                             transports) {
2667                                 if (t->ipaddr.sa.sa_family != AF_INET6)
2668                                         continue;
2669                                 t->flowlabel = params->spp_ipv6_flowlabel &
2670                                                SCTP_FLOWLABEL_VAL_MASK;
2671                                 t->flowlabel |= SCTP_FLOWLABEL_SET_MASK;
2672                         }
2673                         asoc->flowlabel = params->spp_ipv6_flowlabel &
2674                                           SCTP_FLOWLABEL_VAL_MASK;
2675                         asoc->flowlabel |= SCTP_FLOWLABEL_SET_MASK;
2676                 } else if (sctp_opt2sk(sp)->sk_family == AF_INET6) {
2677                         sp->flowlabel = params->spp_ipv6_flowlabel &
2678                                         SCTP_FLOWLABEL_VAL_MASK;
2679                         sp->flowlabel |= SCTP_FLOWLABEL_SET_MASK;
2680                 }
2681         }
2682
2683         if (params->spp_flags & SPP_DSCP) {
2684                 if (trans) {
2685                         trans->dscp = params->spp_dscp & SCTP_DSCP_VAL_MASK;
2686                         trans->dscp |= SCTP_DSCP_SET_MASK;
2687                 } else if (asoc) {
2688                         struct sctp_transport *t;
2689
2690                         list_for_each_entry(t, &asoc->peer.transport_addr_list,
2691                                             transports) {
2692                                 t->dscp = params->spp_dscp &
2693                                           SCTP_DSCP_VAL_MASK;
2694                                 t->dscp |= SCTP_DSCP_SET_MASK;
2695                         }
2696                         asoc->dscp = params->spp_dscp & SCTP_DSCP_VAL_MASK;
2697                         asoc->dscp |= SCTP_DSCP_SET_MASK;
2698                 } else {
2699                         sp->dscp = params->spp_dscp & SCTP_DSCP_VAL_MASK;
2700                         sp->dscp |= SCTP_DSCP_SET_MASK;
2701                 }
2702         }
2703
2704         return 0;
2705 }
2706
2707 static int sctp_setsockopt_peer_addr_params(struct sock *sk,
2708                                             char __user *optval,
2709                                             unsigned int optlen)
2710 {
2711         struct sctp_paddrparams  params;
2712         struct sctp_transport   *trans = NULL;
2713         struct sctp_association *asoc = NULL;
2714         struct sctp_sock        *sp = sctp_sk(sk);
2715         int error;
2716         int hb_change, pmtud_change, sackdelay_change;
2717
2718         if (optlen == sizeof(params)) {
2719                 if (copy_from_user(&params, optval, optlen))
2720                         return -EFAULT;
2721         } else if (optlen == ALIGN(offsetof(struct sctp_paddrparams,
2722                                             spp_ipv6_flowlabel), 4)) {
2723                 if (copy_from_user(&params, optval, optlen))
2724                         return -EFAULT;
2725                 if (params.spp_flags & (SPP_DSCP | SPP_IPV6_FLOWLABEL))
2726                         return -EINVAL;
2727         } else {
2728                 return -EINVAL;
2729         }
2730
2731         /* Validate flags and value parameters. */
2732         hb_change        = params.spp_flags & SPP_HB;
2733         pmtud_change     = params.spp_flags & SPP_PMTUD;
2734         sackdelay_change = params.spp_flags & SPP_SACKDELAY;
2735
2736         if (hb_change        == SPP_HB ||
2737             pmtud_change     == SPP_PMTUD ||
2738             sackdelay_change == SPP_SACKDELAY ||
2739             params.spp_sackdelay > 500 ||
2740             (params.spp_pathmtu &&
2741              params.spp_pathmtu < SCTP_DEFAULT_MINSEGMENT))
2742                 return -EINVAL;
2743
2744         /* If an address other than INADDR_ANY is specified, and
2745          * no transport is found, then the request is invalid.
2746          */
2747         if (!sctp_is_any(sk, (union sctp_addr *)&params.spp_address)) {
2748                 trans = sctp_addr_id2transport(sk, &params.spp_address,
2749                                                params.spp_assoc_id);
2750                 if (!trans)
2751                         return -EINVAL;
2752         }
2753
2754         /* Get association, if assoc_id != SCTP_FUTURE_ASSOC and the
2755          * socket is a one to many style socket, and an association
2756          * was not found, then the id was invalid.
2757          */
2758         asoc = sctp_id2assoc(sk, params.spp_assoc_id);
2759         if (!asoc && params.spp_assoc_id != SCTP_FUTURE_ASSOC &&
2760             sctp_style(sk, UDP))
2761                 return -EINVAL;
2762
2763         /* Heartbeat demand can only be sent on a transport or
2764          * association, but not a socket.
2765          */
2766         if (params.spp_flags & SPP_HB_DEMAND && !trans && !asoc)
2767                 return -EINVAL;
2768
2769         /* Process parameters. */
2770         error = sctp_apply_peer_addr_params(&params, trans, asoc, sp,
2771                                             hb_change, pmtud_change,
2772                                             sackdelay_change);
2773
2774         if (error)
2775                 return error;
2776
2777         /* If changes are for association, also apply parameters to each
2778          * transport.
2779          */
2780         if (!trans && asoc) {
2781                 list_for_each_entry(trans, &asoc->peer.transport_addr_list,
2782                                 transports) {
2783                         sctp_apply_peer_addr_params(&params, trans, asoc, sp,
2784                                                     hb_change, pmtud_change,
2785                                                     sackdelay_change);
2786                 }
2787         }
2788
2789         return 0;
2790 }
2791
2792 static inline __u32 sctp_spp_sackdelay_enable(__u32 param_flags)
2793 {
2794         return (param_flags & ~SPP_SACKDELAY) | SPP_SACKDELAY_ENABLE;
2795 }
2796
2797 static inline __u32 sctp_spp_sackdelay_disable(__u32 param_flags)
2798 {
2799         return (param_flags & ~SPP_SACKDELAY) | SPP_SACKDELAY_DISABLE;
2800 }
2801
2802 static void sctp_apply_asoc_delayed_ack(struct sctp_sack_info *params,
2803                                         struct sctp_association *asoc)
2804 {
2805         struct sctp_transport *trans;
2806
2807         if (params->sack_delay) {
2808                 asoc->sackdelay = msecs_to_jiffies(params->sack_delay);
2809                 asoc->param_flags =
2810                         sctp_spp_sackdelay_enable(asoc->param_flags);
2811         }
2812         if (params->sack_freq == 1) {
2813                 asoc->param_flags =
2814                         sctp_spp_sackdelay_disable(asoc->param_flags);
2815         } else if (params->sack_freq > 1) {
2816                 asoc->sackfreq = params->sack_freq;
2817                 asoc->param_flags =
2818                         sctp_spp_sackdelay_enable(asoc->param_flags);
2819         }
2820
2821         list_for_each_entry(trans, &asoc->peer.transport_addr_list,
2822                             transports) {
2823                 if (params->sack_delay) {
2824                         trans->sackdelay = msecs_to_jiffies(params->sack_delay);
2825                         trans->param_flags =
2826                                 sctp_spp_sackdelay_enable(trans->param_flags);
2827                 }
2828                 if (params->sack_freq == 1) {
2829                         trans->param_flags =
2830                                 sctp_spp_sackdelay_disable(trans->param_flags);
2831                 } else if (params->sack_freq > 1) {
2832                         trans->sackfreq = params->sack_freq;
2833                         trans->param_flags =
2834                                 sctp_spp_sackdelay_enable(trans->param_flags);
2835                 }
2836         }
2837 }
2838
2839 /*
2840  * 7.1.23.  Get or set delayed ack timer (SCTP_DELAYED_SACK)
2841  *
2842  * This option will effect the way delayed acks are performed.  This
2843  * option allows you to get or set the delayed ack time, in
2844  * milliseconds.  It also allows changing the delayed ack frequency.
2845  * Changing the frequency to 1 disables the delayed sack algorithm.  If
2846  * the assoc_id is 0, then this sets or gets the endpoints default
2847  * values.  If the assoc_id field is non-zero, then the set or get
2848  * effects the specified association for the one to many model (the
2849  * assoc_id field is ignored by the one to one model).  Note that if
2850  * sack_delay or sack_freq are 0 when setting this option, then the
2851  * current values will remain unchanged.
2852  *
2853  * struct sctp_sack_info {
2854  *     sctp_assoc_t            sack_assoc_id;
2855  *     uint32_t                sack_delay;
2856  *     uint32_t                sack_freq;
2857  * };
2858  *
2859  * sack_assoc_id -  This parameter, indicates which association the user
2860  *    is performing an action upon.  Note that if this field's value is
2861  *    zero then the endpoints default value is changed (effecting future
2862  *    associations only).
2863  *
2864  * sack_delay -  This parameter contains the number of milliseconds that
2865  *    the user is requesting the delayed ACK timer be set to.  Note that
2866  *    this value is defined in the standard to be between 200 and 500
2867  *    milliseconds.
2868  *
2869  * sack_freq -  This parameter contains the number of packets that must
2870  *    be received before a sack is sent without waiting for the delay
2871  *    timer to expire.  The default value for this is 2, setting this
2872  *    value to 1 will disable the delayed sack algorithm.
2873  */
2874
2875 static int sctp_setsockopt_delayed_ack(struct sock *sk,
2876                                        char __user *optval, unsigned int optlen)
2877 {
2878         struct sctp_sock *sp = sctp_sk(sk);
2879         struct sctp_association *asoc;
2880         struct sctp_sack_info params;
2881
2882         if (optlen == sizeof(struct sctp_sack_info)) {
2883                 if (copy_from_user(&params, optval, optlen))
2884                         return -EFAULT;
2885
2886                 if (params.sack_delay == 0 && params.sack_freq == 0)
2887                         return 0;
2888         } else if (optlen == sizeof(struct sctp_assoc_value)) {
2889                 pr_warn_ratelimited(DEPRECATED
2890                                     "%s (pid %d) "
2891                                     "Use of struct sctp_assoc_value in delayed_ack socket option.\n"
2892                                     "Use struct sctp_sack_info instead\n",
2893                                     current->comm, task_pid_nr(current));
2894                 if (copy_from_user(&params, optval, optlen))
2895                         return -EFAULT;
2896
2897                 if (params.sack_delay == 0)
2898                         params.sack_freq = 1;
2899                 else
2900                         params.sack_freq = 0;
2901         } else
2902                 return -EINVAL;
2903
2904         /* Validate value parameter. */
2905         if (params.sack_delay > 500)
2906                 return -EINVAL;
2907
2908         /* Get association, if sack_assoc_id != SCTP_FUTURE_ASSOC and the
2909          * socket is a one to many style socket, and an association
2910          * was not found, then the id was invalid.
2911          */
2912         asoc = sctp_id2assoc(sk, params.sack_assoc_id);
2913         if (!asoc && params.sack_assoc_id > SCTP_ALL_ASSOC &&
2914             sctp_style(sk, UDP))
2915                 return -EINVAL;
2916
2917         if (asoc) {
2918                 sctp_apply_asoc_delayed_ack(&params, asoc);
2919
2920                 return 0;
2921         }
2922
2923         if (sctp_style(sk, TCP))
2924                 params.sack_assoc_id = SCTP_FUTURE_ASSOC;
2925
2926         if (params.sack_assoc_id == SCTP_FUTURE_ASSOC ||
2927             params.sack_assoc_id == SCTP_ALL_ASSOC) {
2928                 if (params.sack_delay) {
2929                         sp->sackdelay = params.sack_delay;
2930                         sp->param_flags =
2931                                 sctp_spp_sackdelay_enable(sp->param_flags);
2932                 }
2933                 if (params.sack_freq == 1) {
2934                         sp->param_flags =
2935                                 sctp_spp_sackdelay_disable(sp->param_flags);
2936                 } else if (params.sack_freq > 1) {
2937                         sp->sackfreq = params.sack_freq;
2938                         sp->param_flags =
2939                                 sctp_spp_sackdelay_enable(sp->param_flags);
2940                 }
2941         }
2942
2943         if (params.sack_assoc_id == SCTP_CURRENT_ASSOC ||
2944             params.sack_assoc_id == SCTP_ALL_ASSOC)
2945                 list_for_each_entry(asoc, &sp->ep->asocs, asocs)
2946                         sctp_apply_asoc_delayed_ack(&params, asoc);
2947
2948         return 0;
2949 }
2950
2951 /* 7.1.3 Initialization Parameters (SCTP_INITMSG)
2952  *
2953  * Applications can specify protocol parameters for the default association
2954  * initialization.  The option name argument to setsockopt() and getsockopt()
2955  * is SCTP_INITMSG.
2956  *
2957  * Setting initialization parameters is effective only on an unconnected
2958  * socket (for UDP-style sockets only future associations are effected
2959  * by the change).  With TCP-style sockets, this option is inherited by
2960  * sockets derived from a listener socket.
2961  */
2962 static int sctp_setsockopt_initmsg(struct sock *sk, char __user *optval, unsigned int optlen)
2963 {
2964         struct sctp_initmsg sinit;
2965         struct sctp_sock *sp = sctp_sk(sk);
2966
2967         if (optlen != sizeof(struct sctp_initmsg))
2968                 return -EINVAL;
2969         if (copy_from_user(&sinit, optval, optlen))
2970                 return -EFAULT;
2971
2972         if (sinit.sinit_num_ostreams)
2973                 sp->initmsg.sinit_num_ostreams = sinit.sinit_num_ostreams;
2974         if (sinit.sinit_max_instreams)
2975                 sp->initmsg.sinit_max_instreams = sinit.sinit_max_instreams;
2976         if (sinit.sinit_max_attempts)
2977                 sp->initmsg.sinit_max_attempts = sinit.sinit_max_attempts;
2978         if (sinit.sinit_max_init_timeo)
2979                 sp->initmsg.sinit_max_init_timeo = sinit.sinit_max_init_timeo;
2980
2981         return 0;
2982 }
2983
2984 /*
2985  * 7.1.14 Set default send parameters (SCTP_DEFAULT_SEND_PARAM)
2986  *
2987  *   Applications that wish to use the sendto() system call may wish to
2988  *   specify a default set of parameters that would normally be supplied
2989  *   through the inclusion of ancillary data.  This socket option allows
2990  *   such an application to set the default sctp_sndrcvinfo structure.
2991  *   The application that wishes to use this socket option simply passes
2992  *   in to this call the sctp_sndrcvinfo structure defined in Section
2993  *   5.2.2) The input parameters accepted by this call include
2994  *   sinfo_stream, sinfo_flags, sinfo_ppid, sinfo_context,
2995  *   sinfo_timetolive.  The user must provide the sinfo_assoc_id field in
2996  *   to this call if the caller is using the UDP model.
2997  */
2998 static int sctp_setsockopt_default_send_param(struct sock *sk,
2999                                               char __user *optval,
3000                                               unsigned int optlen)
3001 {
3002         struct sctp_sock *sp = sctp_sk(sk);
3003         struct sctp_association *asoc;
3004         struct sctp_sndrcvinfo info;
3005
3006         if (optlen != sizeof(info))
3007                 return -EINVAL;
3008         if (copy_from_user(&info, optval, optlen))
3009                 return -EFAULT;
3010         if (info.sinfo_flags &
3011             ~(SCTP_UNORDERED | SCTP_ADDR_OVER |
3012               SCTP_ABORT | SCTP_EOF))
3013                 return -EINVAL;
3014
3015         asoc = sctp_id2assoc(sk, info.sinfo_assoc_id);
3016         if (!asoc && info.sinfo_assoc_id > SCTP_ALL_ASSOC &&
3017             sctp_style(sk, UDP))
3018                 return -EINVAL;
3019
3020         if (asoc) {
3021                 asoc->default_stream = info.sinfo_stream;
3022                 asoc->default_flags = info.sinfo_flags;
3023                 asoc->default_ppid = info.sinfo_ppid;
3024                 asoc->default_context = info.sinfo_context;
3025                 asoc->default_timetolive = info.sinfo_timetolive;
3026
3027                 return 0;
3028         }
3029
3030         if (sctp_style(sk, TCP))
3031                 info.sinfo_assoc_id = SCTP_FUTURE_ASSOC;
3032
3033         if (info.sinfo_assoc_id == SCTP_FUTURE_ASSOC ||
3034             info.sinfo_assoc_id == SCTP_ALL_ASSOC) {
3035                 sp->default_stream = info.sinfo_stream;
3036                 sp->default_flags = info.sinfo_flags;
3037                 sp->default_ppid = info.sinfo_ppid;
3038                 sp->default_context = info.sinfo_context;
3039                 sp->default_timetolive = info.sinfo_timetolive;
3040         }
3041
3042         if (info.sinfo_assoc_id == SCTP_CURRENT_ASSOC ||
3043             info.sinfo_assoc_id == SCTP_ALL_ASSOC) {
3044                 list_for_each_entry(asoc, &sp->ep->asocs, asocs) {
3045                         asoc->default_stream = info.sinfo_stream;
3046                         asoc->default_flags = info.sinfo_flags;
3047                         asoc->default_ppid = info.sinfo_ppid;
3048                         asoc->default_context = info.sinfo_context;
3049                         asoc->default_timetolive = info.sinfo_timetolive;
3050                 }
3051         }
3052
3053         return 0;
3054 }
3055
3056 /* RFC6458, Section 8.1.31. Set/get Default Send Parameters
3057  * (SCTP_DEFAULT_SNDINFO)
3058  */
3059 static int sctp_setsockopt_default_sndinfo(struct sock *sk,
3060                                            char __user *optval,
3061                                            unsigned int optlen)
3062 {
3063         struct sctp_sock *sp = sctp_sk(sk);
3064         struct sctp_association *asoc;
3065         struct sctp_sndinfo info;
3066
3067         if (optlen != sizeof(info))
3068                 return -EINVAL;
3069         if (copy_from_user(&info, optval, optlen))
3070                 return -EFAULT;
3071         if (info.snd_flags &
3072             ~(SCTP_UNORDERED | SCTP_ADDR_OVER |
3073               SCTP_ABORT | SCTP_EOF))
3074                 return -EINVAL;
3075
3076         asoc = sctp_id2assoc(sk, info.snd_assoc_id);
3077         if (!asoc && info.snd_assoc_id > SCTP_ALL_ASSOC &&
3078             sctp_style(sk, UDP))
3079                 return -EINVAL;
3080
3081         if (asoc) {
3082                 asoc->default_stream = info.snd_sid;
3083                 asoc->default_flags = info.snd_flags;
3084                 asoc->default_ppid = info.snd_ppid;
3085                 asoc->default_context = info.snd_context;
3086
3087                 return 0;
3088         }
3089
3090         if (sctp_style(sk, TCP))
3091                 info.snd_assoc_id = SCTP_FUTURE_ASSOC;
3092
3093         if (info.snd_assoc_id == SCTP_FUTURE_ASSOC ||
3094             info.snd_assoc_id == SCTP_ALL_ASSOC) {
3095                 sp->default_stream = info.snd_sid;
3096                 sp->default_flags = info.snd_flags;
3097                 sp->default_ppid = info.snd_ppid;
3098                 sp->default_context = info.snd_context;
3099         }
3100
3101         if (info.snd_assoc_id == SCTP_CURRENT_ASSOC ||
3102             info.snd_assoc_id == SCTP_ALL_ASSOC) {
3103                 list_for_each_entry(asoc, &sp->ep->asocs, asocs) {
3104                         asoc->default_stream = info.snd_sid;
3105                         asoc->default_flags = info.snd_flags;
3106                         asoc->default_ppid = info.snd_ppid;
3107                         asoc->default_context = info.snd_context;
3108                 }
3109         }
3110
3111         return 0;
3112 }
3113
3114 /* 7.1.10 Set Primary Address (SCTP_PRIMARY_ADDR)
3115  *
3116  * Requests that the local SCTP stack use the enclosed peer address as
3117  * the association primary.  The enclosed address must be one of the
3118  * association peer's addresses.
3119  */
3120 static int sctp_setsockopt_primary_addr(struct sock *sk, char __user *optval,
3121                                         unsigned int optlen)
3122 {
3123         struct sctp_prim prim;
3124         struct sctp_transport *trans;
3125         struct sctp_af *af;
3126         int err;
3127
3128         if (optlen != sizeof(struct sctp_prim))
3129                 return -EINVAL;
3130
3131         if (copy_from_user(&prim, optval, sizeof(struct sctp_prim)))
3132                 return -EFAULT;
3133
3134         /* Allow security module to validate address but need address len. */
3135         af = sctp_get_af_specific(prim.ssp_addr.ss_family);
3136         if (!af)
3137                 return -EINVAL;
3138
3139         err = security_sctp_bind_connect(sk, SCTP_PRIMARY_ADDR,
3140                                          (struct sockaddr *)&prim.ssp_addr,
3141                                          af->sockaddr_len);
3142         if (err)
3143                 return err;
3144
3145         trans = sctp_addr_id2transport(sk, &prim.ssp_addr, prim.ssp_assoc_id);
3146         if (!trans)
3147                 return -EINVAL;
3148
3149         sctp_assoc_set_primary(trans->asoc, trans);
3150
3151         return 0;
3152 }
3153
3154 /*
3155  * 7.1.5 SCTP_NODELAY
3156  *
3157  * Turn on/off any Nagle-like algorithm.  This means that packets are
3158  * generally sent as soon as possible and no unnecessary delays are
3159  * introduced, at the cost of more packets in the network.  Expects an
3160  *  integer boolean flag.
3161  */
3162 static int sctp_setsockopt_nodelay(struct sock *sk, char __user *optval,
3163                                    unsigned int optlen)
3164 {
3165         int val;
3166
3167         if (optlen < sizeof(int))
3168                 return -EINVAL;
3169         if (get_user(val, (int __user *)optval))
3170                 return -EFAULT;
3171
3172         sctp_sk(sk)->nodelay = (val == 0) ? 0 : 1;
3173         return 0;
3174 }
3175
3176 /*
3177  *
3178  * 7.1.1 SCTP_RTOINFO
3179  *
3180  * The protocol parameters used to initialize and bound retransmission
3181  * timeout (RTO) are tunable. sctp_rtoinfo structure is used to access
3182  * and modify these parameters.
3183  * All parameters are time values, in milliseconds.  A value of 0, when
3184  * modifying the parameters, indicates that the current value should not
3185  * be changed.
3186  *
3187  */
3188 static int sctp_setsockopt_rtoinfo(struct sock *sk, char __user *optval, unsigned int optlen)
3189 {
3190         struct sctp_rtoinfo rtoinfo;
3191         struct sctp_association *asoc;
3192         unsigned long rto_min, rto_max;
3193         struct sctp_sock *sp = sctp_sk(sk);
3194
3195         if (optlen != sizeof (struct sctp_rtoinfo))
3196                 return -EINVAL;
3197
3198         if (copy_from_user(&rtoinfo, optval, optlen))
3199                 return -EFAULT;
3200
3201         asoc = sctp_id2assoc(sk, rtoinfo.srto_assoc_id);
3202
3203         /* Set the values to the specific association */
3204         if (!asoc && rtoinfo.srto_assoc_id != SCTP_FUTURE_ASSOC &&
3205             sctp_style(sk, UDP))
3206                 return -EINVAL;
3207
3208         rto_max = rtoinfo.srto_max;
3209         rto_min = rtoinfo.srto_min;
3210
3211         if (rto_max)
3212                 rto_max = asoc ? msecs_to_jiffies(rto_max) : rto_max;
3213         else
3214                 rto_max = asoc ? asoc->rto_max : sp->rtoinfo.srto_max;
3215
3216         if (rto_min)
3217                 rto_min = asoc ? msecs_to_jiffies(rto_min) : rto_min;
3218         else
3219                 rto_min = asoc ? asoc->rto_min : sp->rtoinfo.srto_min;
3220
3221         if (rto_min > rto_max)
3222                 return -EINVAL;
3223
3224         if (asoc) {
3225                 if (rtoinfo.srto_initial != 0)
3226                         asoc->rto_initial =
3227                                 msecs_to_jiffies(rtoinfo.srto_initial);
3228                 asoc->rto_max = rto_max;
3229                 asoc->rto_min = rto_min;
3230         } else {
3231                 /* If there is no association or the association-id = 0
3232                  * set the values to the endpoint.
3233                  */
3234                 if (rtoinfo.srto_initial != 0)
3235                         sp->rtoinfo.srto_initial = rtoinfo.srto_initial;
3236                 sp->rtoinfo.srto_max = rto_max;
3237                 sp->rtoinfo.srto_min = rto_min;
3238         }
3239
3240         return 0;
3241 }
3242
3243 /*
3244  *
3245  * 7.1.2 SCTP_ASSOCINFO
3246  *
3247  * This option is used to tune the maximum retransmission attempts
3248  * of the association.
3249  * Returns an error if the new association retransmission value is
3250  * greater than the sum of the retransmission value  of the peer.
3251  * See [SCTP] for more information.
3252  *
3253  */
3254 static int sctp_setsockopt_associnfo(struct sock *sk, char __user *optval, unsigned int optlen)
3255 {
3256
3257         struct sctp_assocparams assocparams;
3258         struct sctp_association *asoc;
3259
3260         if (optlen != sizeof(struct sctp_assocparams))
3261                 return -EINVAL;
3262         if (copy_from_user(&assocparams, optval, optlen))
3263                 return -EFAULT;
3264
3265         asoc = sctp_id2assoc(sk, assocparams.sasoc_assoc_id);
3266
3267         if (!asoc && assocparams.sasoc_assoc_id != SCTP_FUTURE_ASSOC &&
3268             sctp_style(sk, UDP))
3269                 return -EINVAL;
3270
3271         /* Set the values to the specific association */
3272         if (asoc) {
3273                 if (assocparams.sasoc_asocmaxrxt != 0) {
3274                         __u32 path_sum = 0;
3275                         int   paths = 0;
3276                         struct sctp_transport *peer_addr;
3277
3278                         list_for_each_entry(peer_addr, &asoc->peer.transport_addr_list,
3279                                         transports) {
3280                                 path_sum += peer_addr->pathmaxrxt;
3281                                 paths++;
3282                         }
3283
3284                         /* Only validate asocmaxrxt if we have more than
3285                          * one path/transport.  We do this because path
3286                          * retransmissions are only counted when we have more
3287                          * then one path.
3288                          */
3289                         if (paths > 1 &&
3290                             assocparams.sasoc_asocmaxrxt > path_sum)
3291                                 return -EINVAL;
3292
3293                         asoc->max_retrans = assocparams.sasoc_asocmaxrxt;
3294                 }
3295
3296                 if (assocparams.sasoc_cookie_life != 0)
3297                         asoc->cookie_life = ms_to_ktime(assocparams.sasoc_cookie_life);
3298         } else {
3299                 /* Set the values to the endpoint */
3300                 struct sctp_sock *sp = sctp_sk(sk);
3301
3302                 if (assocparams.sasoc_asocmaxrxt != 0)
3303                         sp->assocparams.sasoc_asocmaxrxt =
3304                                                 assocparams.sasoc_asocmaxrxt;
3305                 if (assocparams.sasoc_cookie_life != 0)
3306                         sp->assocparams.sasoc_cookie_life =
3307                                                 assocparams.sasoc_cookie_life;
3308         }
3309         return 0;
3310 }
3311
3312 /*
3313  * 7.1.16 Set/clear IPv4 mapped addresses (SCTP_I_WANT_MAPPED_V4_ADDR)
3314  *
3315  * This socket option is a boolean flag which turns on or off mapped V4
3316  * addresses.  If this option is turned on and the socket is type
3317  * PF_INET6, then IPv4 addresses will be mapped to V6 representation.
3318  * If this option is turned off, then no mapping will be done of V4
3319  * addresses and a user will receive both PF_INET6 and PF_INET type
3320  * addresses on the socket.
3321  */
3322 static int sctp_setsockopt_mappedv4(struct sock *sk, char __user *optval, unsigned int optlen)
3323 {
3324         int val;
3325         struct sctp_sock *sp = sctp_sk(sk);
3326
3327         if (optlen < sizeof(int))
3328                 return -EINVAL;
3329         if (get_user(val, (int __user *)optval))
3330                 return -EFAULT;
3331         if (val)
3332                 sp->v4mapped = 1;
3333         else
3334                 sp->v4mapped = 0;
3335
3336         return 0;
3337 }
3338
3339 /*
3340  * 8.1.16.  Get or Set the Maximum Fragmentation Size (SCTP_MAXSEG)
3341  * This option will get or set the maximum size to put in any outgoing
3342  * SCTP DATA chunk.  If a message is larger than this size it will be
3343  * fragmented by SCTP into the specified size.  Note that the underlying
3344  * SCTP implementation may fragment into smaller sized chunks when the
3345  * PMTU of the underlying association is smaller than the value set by
3346  * the user.  The default value for this option is '0' which indicates
3347  * the user is NOT limiting fragmentation and only the PMTU will effect
3348  * SCTP's choice of DATA chunk size.  Note also that values set larger
3349  * than the maximum size of an IP datagram will effectively let SCTP
3350  * control fragmentation (i.e. the same as setting this option to 0).
3351  *
3352  * The following structure is used to access and modify this parameter:
3353  *
3354  * struct sctp_assoc_value {
3355  *   sctp_assoc_t assoc_id;
3356  *   uint32_t assoc_value;
3357  * };
3358  *
3359  * assoc_id:  This parameter is ignored for one-to-one style sockets.
3360  *    For one-to-many style sockets this parameter indicates which
3361  *    association the user is performing an action upon.  Note that if
3362  *    this field's value is zero then the endpoints default value is
3363  *    changed (effecting future associations only).
3364  * assoc_value:  This parameter specifies the maximum size in bytes.
3365  */
3366 static int sctp_setsockopt_maxseg(struct sock *sk, char __user *optval, unsigned int optlen)
3367 {
3368         struct sctp_sock *sp = sctp_sk(sk);
3369         struct sctp_assoc_value params;
3370         struct sctp_association *asoc;
3371         int val;
3372
3373         if (optlen == sizeof(int)) {
3374                 pr_warn_ratelimited(DEPRECATED
3375                                     "%s (pid %d) "
3376                                     "Use of int in maxseg socket option.\n"
3377                                     "Use struct sctp_assoc_value instead\n",
3378                                     current->comm, task_pid_nr(current));
3379                 if (copy_from_user(&val, optval, optlen))
3380                         return -EFAULT;
3381                 params.assoc_id = SCTP_FUTURE_ASSOC;
3382         } else if (optlen == sizeof(struct sctp_assoc_value)) {
3383                 if (copy_from_user(&params, optval, optlen))
3384                         return -EFAULT;
3385                 val = params.assoc_value;
3386         } else {
3387                 return -EINVAL;
3388         }
3389
3390         asoc = sctp_id2assoc(sk, params.assoc_id);
3391         if (!asoc && params.assoc_id != SCTP_FUTURE_ASSOC &&
3392             sctp_style(sk, UDP))
3393                 return -EINVAL;
3394
3395         if (val) {
3396                 int min_len, max_len;
3397                 __u16 datasize = asoc ? sctp_datachk_len(&asoc->stream) :
3398                                  sizeof(struct sctp_data_chunk);
3399
3400                 min_len = sctp_min_frag_point(sp, datasize);
3401                 max_len = SCTP_MAX_CHUNK_LEN - datasize;
3402
3403                 if (val < min_len || val > max_len)
3404                         return -EINVAL;
3405         }
3406
3407         if (asoc) {
3408                 asoc->user_frag = val;
3409                 sctp_assoc_update_frag_point(asoc);
3410         } else {
3411                 sp->user_frag = val;
3412         }
3413
3414         return 0;
3415 }
3416
3417
3418 /*
3419  *  7.1.9 Set Peer Primary Address (SCTP_SET_PEER_PRIMARY_ADDR)
3420  *
3421  *   Requests that the peer mark the enclosed address as the association
3422  *   primary. The enclosed address must be one of the association's
3423  *   locally bound addresses. The following structure is used to make a
3424  *   set primary request:
3425  */
3426 static int sctp_setsockopt_peer_primary_addr(struct sock *sk, char __user *optval,
3427                                              unsigned int optlen)
3428 {
3429         struct net *net = sock_net(sk);
3430         struct sctp_sock        *sp;
3431         struct sctp_association *asoc = NULL;
3432         struct sctp_setpeerprim prim;
3433         struct sctp_chunk       *chunk;
3434         struct sctp_af          *af;
3435         int                     err;
3436
3437         sp = sctp_sk(sk);
3438
3439         if (!net->sctp.addip_enable)
3440                 return -EPERM;
3441
3442         if (optlen != sizeof(struct sctp_setpeerprim))
3443                 return -EINVAL;
3444
3445         if (copy_from_user(&prim, optval, optlen))
3446                 return -EFAULT;
3447
3448         asoc = sctp_id2assoc(sk, prim.sspp_assoc_id);
3449         if (!asoc)
3450                 return -EINVAL;
3451
3452         if (!asoc->peer.asconf_capable)
3453                 return -EPERM;
3454
3455         if (asoc->peer.addip_disabled_mask & SCTP_PARAM_SET_PRIMARY)
3456                 return -EPERM;
3457
3458         if (!sctp_state(asoc, ESTABLISHED))
3459                 return -ENOTCONN;
3460
3461         af = sctp_get_af_specific(prim.sspp_addr.ss_family);
3462         if (!af)
3463                 return -EINVAL;
3464
3465         if (!af->addr_valid((union sctp_addr *)&prim.sspp_addr, sp, NULL))
3466                 return -EADDRNOTAVAIL;
3467
3468         if (!sctp_assoc_lookup_laddr(asoc, (union sctp_addr *)&prim.sspp_addr))
3469                 return -EADDRNOTAVAIL;
3470
3471         /* Allow security module to validate address. */
3472         err = security_sctp_bind_connect(sk, SCTP_SET_PEER_PRIMARY_ADDR,
3473                                          (struct sockaddr *)&prim.sspp_addr,
3474                                          af->sockaddr_len);
3475         if (err)
3476                 return err;
3477
3478         /* Create an ASCONF chunk with SET_PRIMARY parameter    */
3479         chunk = sctp_make_asconf_set_prim(asoc,
3480                                           (union sctp_addr *)&prim.sspp_addr);
3481         if (!chunk)
3482                 return -ENOMEM;
3483
3484         err = sctp_send_asconf(asoc, chunk);
3485
3486         pr_debug("%s: we set peer primary addr primitively\n", __func__);
3487
3488         return err;
3489 }
3490
3491 static int sctp_setsockopt_adaptation_layer(struct sock *sk, char __user *optval,
3492                                             unsigned int optlen)
3493 {
3494         struct sctp_setadaptation adaptation;
3495
3496         if (optlen != sizeof(struct sctp_setadaptation))
3497                 return -EINVAL;
3498         if (copy_from_user(&adaptation, optval, optlen))
3499                 return -EFAULT;
3500
3501         sctp_sk(sk)->adaptation_ind = adaptation.ssb_adaptation_ind;
3502
3503         return 0;
3504 }
3505
3506 /*
3507  * 7.1.29.  Set or Get the default context (SCTP_CONTEXT)
3508  *
3509  * The context field in the sctp_sndrcvinfo structure is normally only
3510  * used when a failed message is retrieved holding the value that was
3511  * sent down on the actual send call.  This option allows the setting of
3512  * a default context on an association basis that will be received on
3513  * reading messages from the peer.  This is especially helpful in the
3514  * one-2-many model for an application to keep some reference to an
3515  * internal state machine that is processing messages on the
3516  * association.  Note that the setting of this value only effects
3517  * received messages from the peer and does not effect the value that is
3518  * saved with outbound messages.
3519  */
3520 static int sctp_setsockopt_context(struct sock *sk, char __user *optval,
3521                                    unsigned int optlen)
3522 {
3523         struct sctp_sock *sp = sctp_sk(sk);
3524         struct sctp_assoc_value params;
3525         struct sctp_association *asoc;
3526
3527         if (optlen != sizeof(struct sctp_assoc_value))
3528                 return -EINVAL;
3529         if (copy_from_user(&params, optval, optlen))
3530                 return -EFAULT;
3531
3532         asoc = sctp_id2assoc(sk, params.assoc_id);
3533         if (!asoc && params.assoc_id > SCTP_ALL_ASSOC &&
3534             sctp_style(sk, UDP))
3535                 return -EINVAL;
3536
3537         if (asoc) {
3538                 asoc->default_rcv_context = params.assoc_value;
3539
3540                 return 0;
3541         }
3542
3543         if (sctp_style(sk, TCP))
3544                 params.assoc_id = SCTP_FUTURE_ASSOC;
3545
3546         if (params.assoc_id == SCTP_FUTURE_ASSOC ||
3547             params.assoc_id == SCTP_ALL_ASSOC)
3548                 sp->default_rcv_context = params.assoc_value;
3549
3550         if (params.assoc_id == SCTP_CURRENT_ASSOC ||
3551             params.assoc_id == SCTP_ALL_ASSOC)
3552                 list_for_each_entry(asoc, &sp->ep->asocs, asocs)
3553                         asoc->default_rcv_context = params.assoc_value;
3554
3555         return 0;
3556 }
3557
3558 /*
3559  * 7.1.24.  Get or set fragmented interleave (SCTP_FRAGMENT_INTERLEAVE)
3560  *
3561  * This options will at a minimum specify if the implementation is doing
3562  * fragmented interleave.  Fragmented interleave, for a one to many
3563  * socket, is when subsequent calls to receive a message may return
3564  * parts of messages from different associations.  Some implementations
3565  * may allow you to turn this value on or off.  If so, when turned off,
3566  * no fragment interleave will occur (which will cause a head of line
3567  * blocking amongst multiple associations sharing the same one to many
3568  * socket).  When this option is turned on, then each receive call may
3569  * come from a different association (thus the user must receive data
3570  * with the extended calls (e.g. sctp_recvmsg) to keep track of which
3571  * association each receive belongs to.
3572  *
3573  * This option takes a boolean value.  A non-zero value indicates that
3574  * fragmented interleave is on.  A value of zero indicates that
3575  * fragmented interleave is off.
3576  *
3577  * Note that it is important that an implementation that allows this
3578  * option to be turned on, have it off by default.  Otherwise an unaware
3579  * application using the one to many model may become confused and act
3580  * incorrectly.
3581  */
3582 static int sctp_setsockopt_fragment_interleave(struct sock *sk,
3583                                                char __user *optval,
3584                                                unsigned int optlen)
3585 {
3586         int val;
3587
3588         if (optlen != sizeof(int))
3589                 return -EINVAL;
3590         if (get_user(val, (int __user *)optval))
3591                 return -EFAULT;
3592
3593         sctp_sk(sk)->frag_interleave = !!val;
3594
3595         if (!sctp_sk(sk)->frag_interleave)
3596                 sctp_sk(sk)->strm_interleave = 0;
3597
3598         return 0;
3599 }
3600
3601 /*
3602  * 8.1.21.  Set or Get the SCTP Partial Delivery Point
3603  *       (SCTP_PARTIAL_DELIVERY_POINT)
3604  *
3605  * This option will set or get the SCTP partial delivery point.  This
3606  * point is the size of a message where the partial delivery API will be
3607  * invoked to help free up rwnd space for the peer.  Setting this to a
3608  * lower value will cause partial deliveries to happen more often.  The
3609  * calls argument is an integer that sets or gets the partial delivery
3610  * point.  Note also that the call will fail if the user attempts to set
3611  * this value larger than the socket receive buffer size.
3612  *
3613  * Note that any single message having a length smaller than or equal to
3614  * the SCTP partial delivery point will be delivered in one single read
3615  * call as long as the user provided buffer is large enough to hold the
3616  * message.
3617  */
3618 static int sctp_setsockopt_partial_delivery_point(struct sock *sk,
3619                                                   char __user *optval,
3620                                                   unsigned int optlen)
3621 {
3622         u32 val;
3623
3624         if (optlen != sizeof(u32))
3625                 return -EINVAL;
3626         if (get_user(val, (int __user *)optval))
3627                 return -EFAULT;
3628
3629         /* Note: We double the receive buffer from what the user sets
3630          * it to be, also initial rwnd is based on rcvbuf/2.
3631          */
3632         if (val > (sk->sk_rcvbuf >> 1))
3633