Pull bugzilla-5737 into release branch
[sfrench/cifs-2.6.git] / kernel / signal.c
1 /*
2  *  linux/kernel/signal.c
3  *
4  *  Copyright (C) 1991, 1992  Linus Torvalds
5  *
6  *  1997-11-02  Modified for POSIX.1b signals by Richard Henderson
7  *
8  *  2003-06-02  Jim Houston - Concurrent Computer Corp.
9  *              Changes to use preallocated sigqueue structures
10  *              to allow signals to be sent reliably.
11  */
12
13 #include <linux/config.h>
14 #include <linux/slab.h>
15 #include <linux/module.h>
16 #include <linux/smp_lock.h>
17 #include <linux/init.h>
18 #include <linux/sched.h>
19 #include <linux/fs.h>
20 #include <linux/tty.h>
21 #include <linux/binfmts.h>
22 #include <linux/security.h>
23 #include <linux/syscalls.h>
24 #include <linux/ptrace.h>
25 #include <linux/signal.h>
26 #include <linux/capability.h>
27 #include <asm/param.h>
28 #include <asm/uaccess.h>
29 #include <asm/unistd.h>
30 #include <asm/siginfo.h>
31 #include "audit.h"      /* audit_signal_info() */
32
33 /*
34  * SLAB caches for signal bits.
35  */
36
37 static kmem_cache_t *sigqueue_cachep;
38
39 /*
40  * In POSIX a signal is sent either to a specific thread (Linux task)
41  * or to the process as a whole (Linux thread group).  How the signal
42  * is sent determines whether it's to one thread or the whole group,
43  * which determines which signal mask(s) are involved in blocking it
44  * from being delivered until later.  When the signal is delivered,
45  * either it's caught or ignored by a user handler or it has a default
46  * effect that applies to the whole thread group (POSIX process).
47  *
48  * The possible effects an unblocked signal set to SIG_DFL can have are:
49  *   ignore     - Nothing Happens
50  *   terminate  - kill the process, i.e. all threads in the group,
51  *                similar to exit_group.  The group leader (only) reports
52  *                WIFSIGNALED status to its parent.
53  *   coredump   - write a core dump file describing all threads using
54  *                the same mm and then kill all those threads
55  *   stop       - stop all the threads in the group, i.e. TASK_STOPPED state
56  *
57  * SIGKILL and SIGSTOP cannot be caught, blocked, or ignored.
58  * Other signals when not blocked and set to SIG_DFL behaves as follows.
59  * The job control signals also have other special effects.
60  *
61  *      +--------------------+------------------+
62  *      |  POSIX signal      |  default action  |
63  *      +--------------------+------------------+
64  *      |  SIGHUP            |  terminate       |
65  *      |  SIGINT            |  terminate       |
66  *      |  SIGQUIT           |  coredump        |
67  *      |  SIGILL            |  coredump        |
68  *      |  SIGTRAP           |  coredump        |
69  *      |  SIGABRT/SIGIOT    |  coredump        |
70  *      |  SIGBUS            |  coredump        |
71  *      |  SIGFPE            |  coredump        |
72  *      |  SIGKILL           |  terminate(+)    |
73  *      |  SIGUSR1           |  terminate       |
74  *      |  SIGSEGV           |  coredump        |
75  *      |  SIGUSR2           |  terminate       |
76  *      |  SIGPIPE           |  terminate       |
77  *      |  SIGALRM           |  terminate       |
78  *      |  SIGTERM           |  terminate       |
79  *      |  SIGCHLD           |  ignore          |
80  *      |  SIGCONT           |  ignore(*)       |
81  *      |  SIGSTOP           |  stop(*)(+)      |
82  *      |  SIGTSTP           |  stop(*)         |
83  *      |  SIGTTIN           |  stop(*)         |
84  *      |  SIGTTOU           |  stop(*)         |
85  *      |  SIGURG            |  ignore          |
86  *      |  SIGXCPU           |  coredump        |
87  *      |  SIGXFSZ           |  coredump        |
88  *      |  SIGVTALRM         |  terminate       |
89  *      |  SIGPROF           |  terminate       |
90  *      |  SIGPOLL/SIGIO     |  terminate       |
91  *      |  SIGSYS/SIGUNUSED  |  coredump        |
92  *      |  SIGSTKFLT         |  terminate       |
93  *      |  SIGWINCH          |  ignore          |
94  *      |  SIGPWR            |  terminate       |
95  *      |  SIGRTMIN-SIGRTMAX |  terminate       |
96  *      +--------------------+------------------+
97  *      |  non-POSIX signal  |  default action  |
98  *      +--------------------+------------------+
99  *      |  SIGEMT            |  coredump        |
100  *      +--------------------+------------------+
101  *
102  * (+) For SIGKILL and SIGSTOP the action is "always", not just "default".
103  * (*) Special job control effects:
104  * When SIGCONT is sent, it resumes the process (all threads in the group)
105  * from TASK_STOPPED state and also clears any pending/queued stop signals
106  * (any of those marked with "stop(*)").  This happens regardless of blocking,
107  * catching, or ignoring SIGCONT.  When any stop signal is sent, it clears
108  * any pending/queued SIGCONT signals; this happens regardless of blocking,
109  * catching, or ignored the stop signal, though (except for SIGSTOP) the
110  * default action of stopping the process may happen later or never.
111  */
112
113 #ifdef SIGEMT
114 #define M_SIGEMT        M(SIGEMT)
115 #else
116 #define M_SIGEMT        0
117 #endif
118
119 #if SIGRTMIN > BITS_PER_LONG
120 #define M(sig) (1ULL << ((sig)-1))
121 #else
122 #define M(sig) (1UL << ((sig)-1))
123 #endif
124 #define T(sig, mask) (M(sig) & (mask))
125
126 #define SIG_KERNEL_ONLY_MASK (\
127         M(SIGKILL)   |  M(SIGSTOP)                                   )
128
129 #define SIG_KERNEL_STOP_MASK (\
130         M(SIGSTOP)   |  M(SIGTSTP)   |  M(SIGTTIN)   |  M(SIGTTOU)   )
131
132 #define SIG_KERNEL_COREDUMP_MASK (\
133         M(SIGQUIT)   |  M(SIGILL)    |  M(SIGTRAP)   |  M(SIGABRT)   | \
134         M(SIGFPE)    |  M(SIGSEGV)   |  M(SIGBUS)    |  M(SIGSYS)    | \
135         M(SIGXCPU)   |  M(SIGXFSZ)   |  M_SIGEMT                     )
136
137 #define SIG_KERNEL_IGNORE_MASK (\
138         M(SIGCONT)   |  M(SIGCHLD)   |  M(SIGWINCH)  |  M(SIGURG)    )
139
140 #define sig_kernel_only(sig) \
141                 (((sig) < SIGRTMIN)  && T(sig, SIG_KERNEL_ONLY_MASK))
142 #define sig_kernel_coredump(sig) \
143                 (((sig) < SIGRTMIN)  && T(sig, SIG_KERNEL_COREDUMP_MASK))
144 #define sig_kernel_ignore(sig) \
145                 (((sig) < SIGRTMIN)  && T(sig, SIG_KERNEL_IGNORE_MASK))
146 #define sig_kernel_stop(sig) \
147                 (((sig) < SIGRTMIN)  && T(sig, SIG_KERNEL_STOP_MASK))
148
149 #define sig_needs_tasklist(sig) ((sig) == SIGCONT)
150
151 #define sig_user_defined(t, signr) \
152         (((t)->sighand->action[(signr)-1].sa.sa_handler != SIG_DFL) &&  \
153          ((t)->sighand->action[(signr)-1].sa.sa_handler != SIG_IGN))
154
155 #define sig_fatal(t, signr) \
156         (!T(signr, SIG_KERNEL_IGNORE_MASK|SIG_KERNEL_STOP_MASK) && \
157          (t)->sighand->action[(signr)-1].sa.sa_handler == SIG_DFL)
158
159 static int sig_ignored(struct task_struct *t, int sig)
160 {
161         void __user * handler;
162
163         /*
164          * Tracers always want to know about signals..
165          */
166         if (t->ptrace & PT_PTRACED)
167                 return 0;
168
169         /*
170          * Blocked signals are never ignored, since the
171          * signal handler may change by the time it is
172          * unblocked.
173          */
174         if (sigismember(&t->blocked, sig))
175                 return 0;
176
177         /* Is it explicitly or implicitly ignored? */
178         handler = t->sighand->action[sig-1].sa.sa_handler;
179         return   handler == SIG_IGN ||
180                 (handler == SIG_DFL && sig_kernel_ignore(sig));
181 }
182
183 /*
184  * Re-calculate pending state from the set of locally pending
185  * signals, globally pending signals, and blocked signals.
186  */
187 static inline int has_pending_signals(sigset_t *signal, sigset_t *blocked)
188 {
189         unsigned long ready;
190         long i;
191
192         switch (_NSIG_WORDS) {
193         default:
194                 for (i = _NSIG_WORDS, ready = 0; --i >= 0 ;)
195                         ready |= signal->sig[i] &~ blocked->sig[i];
196                 break;
197
198         case 4: ready  = signal->sig[3] &~ blocked->sig[3];
199                 ready |= signal->sig[2] &~ blocked->sig[2];
200                 ready |= signal->sig[1] &~ blocked->sig[1];
201                 ready |= signal->sig[0] &~ blocked->sig[0];
202                 break;
203
204         case 2: ready  = signal->sig[1] &~ blocked->sig[1];
205                 ready |= signal->sig[0] &~ blocked->sig[0];
206                 break;
207
208         case 1: ready  = signal->sig[0] &~ blocked->sig[0];
209         }
210         return ready != 0;
211 }
212
213 #define PENDING(p,b) has_pending_signals(&(p)->signal, (b))
214
215 fastcall void recalc_sigpending_tsk(struct task_struct *t)
216 {
217         if (t->signal->group_stop_count > 0 ||
218             (freezing(t)) ||
219             PENDING(&t->pending, &t->blocked) ||
220             PENDING(&t->signal->shared_pending, &t->blocked))
221                 set_tsk_thread_flag(t, TIF_SIGPENDING);
222         else
223                 clear_tsk_thread_flag(t, TIF_SIGPENDING);
224 }
225
226 void recalc_sigpending(void)
227 {
228         recalc_sigpending_tsk(current);
229 }
230
231 /* Given the mask, find the first available signal that should be serviced. */
232
233 static int
234 next_signal(struct sigpending *pending, sigset_t *mask)
235 {
236         unsigned long i, *s, *m, x;
237         int sig = 0;
238         
239         s = pending->signal.sig;
240         m = mask->sig;
241         switch (_NSIG_WORDS) {
242         default:
243                 for (i = 0; i < _NSIG_WORDS; ++i, ++s, ++m)
244                         if ((x = *s &~ *m) != 0) {
245                                 sig = ffz(~x) + i*_NSIG_BPW + 1;
246                                 break;
247                         }
248                 break;
249
250         case 2: if ((x = s[0] &~ m[0]) != 0)
251                         sig = 1;
252                 else if ((x = s[1] &~ m[1]) != 0)
253                         sig = _NSIG_BPW + 1;
254                 else
255                         break;
256                 sig += ffz(~x);
257                 break;
258
259         case 1: if ((x = *s &~ *m) != 0)
260                         sig = ffz(~x) + 1;
261                 break;
262         }
263         
264         return sig;
265 }
266
267 static struct sigqueue *__sigqueue_alloc(struct task_struct *t, gfp_t flags,
268                                          int override_rlimit)
269 {
270         struct sigqueue *q = NULL;
271
272         atomic_inc(&t->user->sigpending);
273         if (override_rlimit ||
274             atomic_read(&t->user->sigpending) <=
275                         t->signal->rlim[RLIMIT_SIGPENDING].rlim_cur)
276                 q = kmem_cache_alloc(sigqueue_cachep, flags);
277         if (unlikely(q == NULL)) {
278                 atomic_dec(&t->user->sigpending);
279         } else {
280                 INIT_LIST_HEAD(&q->list);
281                 q->flags = 0;
282                 q->user = get_uid(t->user);
283         }
284         return(q);
285 }
286
287 static void __sigqueue_free(struct sigqueue *q)
288 {
289         if (q->flags & SIGQUEUE_PREALLOC)
290                 return;
291         atomic_dec(&q->user->sigpending);
292         free_uid(q->user);
293         kmem_cache_free(sigqueue_cachep, q);
294 }
295
296 void flush_sigqueue(struct sigpending *queue)
297 {
298         struct sigqueue *q;
299
300         sigemptyset(&queue->signal);
301         while (!list_empty(&queue->list)) {
302                 q = list_entry(queue->list.next, struct sigqueue , list);
303                 list_del_init(&q->list);
304                 __sigqueue_free(q);
305         }
306 }
307
308 /*
309  * Flush all pending signals for a task.
310  */
311 void flush_signals(struct task_struct *t)
312 {
313         unsigned long flags;
314
315         spin_lock_irqsave(&t->sighand->siglock, flags);
316         clear_tsk_thread_flag(t,TIF_SIGPENDING);
317         flush_sigqueue(&t->pending);
318         flush_sigqueue(&t->signal->shared_pending);
319         spin_unlock_irqrestore(&t->sighand->siglock, flags);
320 }
321
322 /*
323  * Flush all handlers for a task.
324  */
325
326 void
327 flush_signal_handlers(struct task_struct *t, int force_default)
328 {
329         int i;
330         struct k_sigaction *ka = &t->sighand->action[0];
331         for (i = _NSIG ; i != 0 ; i--) {
332                 if (force_default || ka->sa.sa_handler != SIG_IGN)
333                         ka->sa.sa_handler = SIG_DFL;
334                 ka->sa.sa_flags = 0;
335                 sigemptyset(&ka->sa.sa_mask);
336                 ka++;
337         }
338 }
339
340
341 /* Notify the system that a driver wants to block all signals for this
342  * process, and wants to be notified if any signals at all were to be
343  * sent/acted upon.  If the notifier routine returns non-zero, then the
344  * signal will be acted upon after all.  If the notifier routine returns 0,
345  * then then signal will be blocked.  Only one block per process is
346  * allowed.  priv is a pointer to private data that the notifier routine
347  * can use to determine if the signal should be blocked or not.  */
348
349 void
350 block_all_signals(int (*notifier)(void *priv), void *priv, sigset_t *mask)
351 {
352         unsigned long flags;
353
354         spin_lock_irqsave(&current->sighand->siglock, flags);
355         current->notifier_mask = mask;
356         current->notifier_data = priv;
357         current->notifier = notifier;
358         spin_unlock_irqrestore(&current->sighand->siglock, flags);
359 }
360
361 /* Notify the system that blocking has ended. */
362
363 void
364 unblock_all_signals(void)
365 {
366         unsigned long flags;
367
368         spin_lock_irqsave(&current->sighand->siglock, flags);
369         current->notifier = NULL;
370         current->notifier_data = NULL;
371         recalc_sigpending();
372         spin_unlock_irqrestore(&current->sighand->siglock, flags);
373 }
374
375 static int collect_signal(int sig, struct sigpending *list, siginfo_t *info)
376 {
377         struct sigqueue *q, *first = NULL;
378         int still_pending = 0;
379
380         if (unlikely(!sigismember(&list->signal, sig)))
381                 return 0;
382
383         /*
384          * Collect the siginfo appropriate to this signal.  Check if
385          * there is another siginfo for the same signal.
386         */
387         list_for_each_entry(q, &list->list, list) {
388                 if (q->info.si_signo == sig) {
389                         if (first) {
390                                 still_pending = 1;
391                                 break;
392                         }
393                         first = q;
394                 }
395         }
396         if (first) {
397                 list_del_init(&first->list);
398                 copy_siginfo(info, &first->info);
399                 __sigqueue_free(first);
400                 if (!still_pending)
401                         sigdelset(&list->signal, sig);
402         } else {
403
404                 /* Ok, it wasn't in the queue.  This must be
405                    a fast-pathed signal or we must have been
406                    out of queue space.  So zero out the info.
407                  */
408                 sigdelset(&list->signal, sig);
409                 info->si_signo = sig;
410                 info->si_errno = 0;
411                 info->si_code = 0;
412                 info->si_pid = 0;
413                 info->si_uid = 0;
414         }
415         return 1;
416 }
417
418 static int __dequeue_signal(struct sigpending *pending, sigset_t *mask,
419                         siginfo_t *info)
420 {
421         int sig = 0;
422
423         sig = next_signal(pending, mask);
424         if (sig) {
425                 if (current->notifier) {
426                         if (sigismember(current->notifier_mask, sig)) {
427                                 if (!(current->notifier)(current->notifier_data)) {
428                                         clear_thread_flag(TIF_SIGPENDING);
429                                         return 0;
430                                 }
431                         }
432                 }
433
434                 if (!collect_signal(sig, pending, info))
435                         sig = 0;
436                                 
437         }
438         recalc_sigpending();
439
440         return sig;
441 }
442
443 /*
444  * Dequeue a signal and return the element to the caller, which is 
445  * expected to free it.
446  *
447  * All callers have to hold the siglock.
448  */
449 int dequeue_signal(struct task_struct *tsk, sigset_t *mask, siginfo_t *info)
450 {
451         int signr = __dequeue_signal(&tsk->pending, mask, info);
452         if (!signr)
453                 signr = __dequeue_signal(&tsk->signal->shared_pending,
454                                          mask, info);
455         if (signr && unlikely(sig_kernel_stop(signr))) {
456                 /*
457                  * Set a marker that we have dequeued a stop signal.  Our
458                  * caller might release the siglock and then the pending
459                  * stop signal it is about to process is no longer in the
460                  * pending bitmasks, but must still be cleared by a SIGCONT
461                  * (and overruled by a SIGKILL).  So those cases clear this
462                  * shared flag after we've set it.  Note that this flag may
463                  * remain set after the signal we return is ignored or
464                  * handled.  That doesn't matter because its only purpose
465                  * is to alert stop-signal processing code when another
466                  * processor has come along and cleared the flag.
467                  */
468                 if (!(tsk->signal->flags & SIGNAL_GROUP_EXIT))
469                         tsk->signal->flags |= SIGNAL_STOP_DEQUEUED;
470         }
471         if ( signr &&
472              ((info->si_code & __SI_MASK) == __SI_TIMER) &&
473              info->si_sys_private){
474                 /*
475                  * Release the siglock to ensure proper locking order
476                  * of timer locks outside of siglocks.  Note, we leave
477                  * irqs disabled here, since the posix-timers code is
478                  * about to disable them again anyway.
479                  */
480                 spin_unlock(&tsk->sighand->siglock);
481                 do_schedule_next_timer(info);
482                 spin_lock(&tsk->sighand->siglock);
483         }
484         return signr;
485 }
486
487 /*
488  * Tell a process that it has a new active signal..
489  *
490  * NOTE! we rely on the previous spin_lock to
491  * lock interrupts for us! We can only be called with
492  * "siglock" held, and the local interrupt must
493  * have been disabled when that got acquired!
494  *
495  * No need to set need_resched since signal event passing
496  * goes through ->blocked
497  */
498 void signal_wake_up(struct task_struct *t, int resume)
499 {
500         unsigned int mask;
501
502         set_tsk_thread_flag(t, TIF_SIGPENDING);
503
504         /*
505          * For SIGKILL, we want to wake it up in the stopped/traced case.
506          * We don't check t->state here because there is a race with it
507          * executing another processor and just now entering stopped state.
508          * By using wake_up_state, we ensure the process will wake up and
509          * handle its death signal.
510          */
511         mask = TASK_INTERRUPTIBLE;
512         if (resume)
513                 mask |= TASK_STOPPED | TASK_TRACED;
514         if (!wake_up_state(t, mask))
515                 kick_process(t);
516 }
517
518 /*
519  * Remove signals in mask from the pending set and queue.
520  * Returns 1 if any signals were found.
521  *
522  * All callers must be holding the siglock.
523  *
524  * This version takes a sigset mask and looks at all signals,
525  * not just those in the first mask word.
526  */
527 static int rm_from_queue_full(sigset_t *mask, struct sigpending *s)
528 {
529         struct sigqueue *q, *n;
530         sigset_t m;
531
532         sigandsets(&m, mask, &s->signal);
533         if (sigisemptyset(&m))
534                 return 0;
535
536         signandsets(&s->signal, &s->signal, mask);
537         list_for_each_entry_safe(q, n, &s->list, list) {
538                 if (sigismember(mask, q->info.si_signo)) {
539                         list_del_init(&q->list);
540                         __sigqueue_free(q);
541                 }
542         }
543         return 1;
544 }
545 /*
546  * Remove signals in mask from the pending set and queue.
547  * Returns 1 if any signals were found.
548  *
549  * All callers must be holding the siglock.
550  */
551 static int rm_from_queue(unsigned long mask, struct sigpending *s)
552 {
553         struct sigqueue *q, *n;
554
555         if (!sigtestsetmask(&s->signal, mask))
556                 return 0;
557
558         sigdelsetmask(&s->signal, mask);
559         list_for_each_entry_safe(q, n, &s->list, list) {
560                 if (q->info.si_signo < SIGRTMIN &&
561                     (mask & sigmask(q->info.si_signo))) {
562                         list_del_init(&q->list);
563                         __sigqueue_free(q);
564                 }
565         }
566         return 1;
567 }
568
569 /*
570  * Bad permissions for sending the signal
571  */
572 static int check_kill_permission(int sig, struct siginfo *info,
573                                  struct task_struct *t)
574 {
575         int error = -EINVAL;
576         if (!valid_signal(sig))
577                 return error;
578         error = -EPERM;
579         if ((info == SEND_SIG_NOINFO || (!is_si_special(info) && SI_FROMUSER(info)))
580             && ((sig != SIGCONT) ||
581                 (current->signal->session != t->signal->session))
582             && (current->euid ^ t->suid) && (current->euid ^ t->uid)
583             && (current->uid ^ t->suid) && (current->uid ^ t->uid)
584             && !capable(CAP_KILL))
585                 return error;
586
587         error = security_task_kill(t, info, sig);
588         if (!error)
589                 audit_signal_info(sig, t); /* Let audit system see the signal */
590         return error;
591 }
592
593 /* forward decl */
594 static void do_notify_parent_cldstop(struct task_struct *tsk, int why);
595
596 /*
597  * Handle magic process-wide effects of stop/continue signals.
598  * Unlike the signal actions, these happen immediately at signal-generation
599  * time regardless of blocking, ignoring, or handling.  This does the
600  * actual continuing for SIGCONT, but not the actual stopping for stop
601  * signals.  The process stop is done as a signal action for SIG_DFL.
602  */
603 static void handle_stop_signal(int sig, struct task_struct *p)
604 {
605         struct task_struct *t;
606
607         if (p->signal->flags & SIGNAL_GROUP_EXIT)
608                 /*
609                  * The process is in the middle of dying already.
610                  */
611                 return;
612
613         if (sig_kernel_stop(sig)) {
614                 /*
615                  * This is a stop signal.  Remove SIGCONT from all queues.
616                  */
617                 rm_from_queue(sigmask(SIGCONT), &p->signal->shared_pending);
618                 t = p;
619                 do {
620                         rm_from_queue(sigmask(SIGCONT), &t->pending);
621                         t = next_thread(t);
622                 } while (t != p);
623         } else if (sig == SIGCONT) {
624                 /*
625                  * Remove all stop signals from all queues,
626                  * and wake all threads.
627                  */
628                 if (unlikely(p->signal->group_stop_count > 0)) {
629                         /*
630                          * There was a group stop in progress.  We'll
631                          * pretend it finished before we got here.  We are
632                          * obliged to report it to the parent: if the
633                          * SIGSTOP happened "after" this SIGCONT, then it
634                          * would have cleared this pending SIGCONT.  If it
635                          * happened "before" this SIGCONT, then the parent
636                          * got the SIGCHLD about the stop finishing before
637                          * the continue happened.  We do the notification
638                          * now, and it's as if the stop had finished and
639                          * the SIGCHLD was pending on entry to this kill.
640                          */
641                         p->signal->group_stop_count = 0;
642                         p->signal->flags = SIGNAL_STOP_CONTINUED;
643                         spin_unlock(&p->sighand->siglock);
644                         do_notify_parent_cldstop(p, CLD_STOPPED);
645                         spin_lock(&p->sighand->siglock);
646                 }
647                 rm_from_queue(SIG_KERNEL_STOP_MASK, &p->signal->shared_pending);
648                 t = p;
649                 do {
650                         unsigned int state;
651                         rm_from_queue(SIG_KERNEL_STOP_MASK, &t->pending);
652                         
653                         /*
654                          * If there is a handler for SIGCONT, we must make
655                          * sure that no thread returns to user mode before
656                          * we post the signal, in case it was the only
657                          * thread eligible to run the signal handler--then
658                          * it must not do anything between resuming and
659                          * running the handler.  With the TIF_SIGPENDING
660                          * flag set, the thread will pause and acquire the
661                          * siglock that we hold now and until we've queued
662                          * the pending signal. 
663                          *
664                          * Wake up the stopped thread _after_ setting
665                          * TIF_SIGPENDING
666                          */
667                         state = TASK_STOPPED;
668                         if (sig_user_defined(t, SIGCONT) && !sigismember(&t->blocked, SIGCONT)) {
669                                 set_tsk_thread_flag(t, TIF_SIGPENDING);
670                                 state |= TASK_INTERRUPTIBLE;
671                         }
672                         wake_up_state(t, state);
673
674                         t = next_thread(t);
675                 } while (t != p);
676
677                 if (p->signal->flags & SIGNAL_STOP_STOPPED) {
678                         /*
679                          * We were in fact stopped, and are now continued.
680                          * Notify the parent with CLD_CONTINUED.
681                          */
682                         p->signal->flags = SIGNAL_STOP_CONTINUED;
683                         p->signal->group_exit_code = 0;
684                         spin_unlock(&p->sighand->siglock);
685                         do_notify_parent_cldstop(p, CLD_CONTINUED);
686                         spin_lock(&p->sighand->siglock);
687                 } else {
688                         /*
689                          * We are not stopped, but there could be a stop
690                          * signal in the middle of being processed after
691                          * being removed from the queue.  Clear that too.
692                          */
693                         p->signal->flags = 0;
694                 }
695         } else if (sig == SIGKILL) {
696                 /*
697                  * Make sure that any pending stop signal already dequeued
698                  * is undone by the wakeup for SIGKILL.
699                  */
700                 p->signal->flags = 0;
701         }
702 }
703
704 static int send_signal(int sig, struct siginfo *info, struct task_struct *t,
705                         struct sigpending *signals)
706 {
707         struct sigqueue * q = NULL;
708         int ret = 0;
709
710         /*
711          * fast-pathed signals for kernel-internal things like SIGSTOP
712          * or SIGKILL.
713          */
714         if (info == SEND_SIG_FORCED)
715                 goto out_set;
716
717         /* Real-time signals must be queued if sent by sigqueue, or
718            some other real-time mechanism.  It is implementation
719            defined whether kill() does so.  We attempt to do so, on
720            the principle of least surprise, but since kill is not
721            allowed to fail with EAGAIN when low on memory we just
722            make sure at least one signal gets delivered and don't
723            pass on the info struct.  */
724
725         q = __sigqueue_alloc(t, GFP_ATOMIC, (sig < SIGRTMIN &&
726                                              (is_si_special(info) ||
727                                               info->si_code >= 0)));
728         if (q) {
729                 list_add_tail(&q->list, &signals->list);
730                 switch ((unsigned long) info) {
731                 case (unsigned long) SEND_SIG_NOINFO:
732                         q->info.si_signo = sig;
733                         q->info.si_errno = 0;
734                         q->info.si_code = SI_USER;
735                         q->info.si_pid = current->pid;
736                         q->info.si_uid = current->uid;
737                         break;
738                 case (unsigned long) SEND_SIG_PRIV:
739                         q->info.si_signo = sig;
740                         q->info.si_errno = 0;
741                         q->info.si_code = SI_KERNEL;
742                         q->info.si_pid = 0;
743                         q->info.si_uid = 0;
744                         break;
745                 default:
746                         copy_siginfo(&q->info, info);
747                         break;
748                 }
749         } else if (!is_si_special(info)) {
750                 if (sig >= SIGRTMIN && info->si_code != SI_USER)
751                 /*
752                  * Queue overflow, abort.  We may abort if the signal was rt
753                  * and sent by user using something other than kill().
754                  */
755                         return -EAGAIN;
756         }
757
758 out_set:
759         sigaddset(&signals->signal, sig);
760         return ret;
761 }
762
763 #define LEGACY_QUEUE(sigptr, sig) \
764         (((sig) < SIGRTMIN) && sigismember(&(sigptr)->signal, (sig)))
765
766
767 static int
768 specific_send_sig_info(int sig, struct siginfo *info, struct task_struct *t)
769 {
770         int ret = 0;
771
772         BUG_ON(!irqs_disabled());
773         assert_spin_locked(&t->sighand->siglock);
774
775         /* Short-circuit ignored signals.  */
776         if (sig_ignored(t, sig))
777                 goto out;
778
779         /* Support queueing exactly one non-rt signal, so that we
780            can get more detailed information about the cause of
781            the signal. */
782         if (LEGACY_QUEUE(&t->pending, sig))
783                 goto out;
784
785         ret = send_signal(sig, info, t, &t->pending);
786         if (!ret && !sigismember(&t->blocked, sig))
787                 signal_wake_up(t, sig == SIGKILL);
788 out:
789         return ret;
790 }
791
792 /*
793  * Force a signal that the process can't ignore: if necessary
794  * we unblock the signal and change any SIG_IGN to SIG_DFL.
795  */
796
797 int
798 force_sig_info(int sig, struct siginfo *info, struct task_struct *t)
799 {
800         unsigned long int flags;
801         int ret;
802
803         spin_lock_irqsave(&t->sighand->siglock, flags);
804         if (t->sighand->action[sig-1].sa.sa_handler == SIG_IGN) {
805                 t->sighand->action[sig-1].sa.sa_handler = SIG_DFL;
806         }
807         if (sigismember(&t->blocked, sig)) {
808                 sigdelset(&t->blocked, sig);
809         }
810         recalc_sigpending_tsk(t);
811         ret = specific_send_sig_info(sig, info, t);
812         spin_unlock_irqrestore(&t->sighand->siglock, flags);
813
814         return ret;
815 }
816
817 void
818 force_sig_specific(int sig, struct task_struct *t)
819 {
820         force_sig_info(sig, SEND_SIG_FORCED, t);
821 }
822
823 /*
824  * Test if P wants to take SIG.  After we've checked all threads with this,
825  * it's equivalent to finding no threads not blocking SIG.  Any threads not
826  * blocking SIG were ruled out because they are not running and already
827  * have pending signals.  Such threads will dequeue from the shared queue
828  * as soon as they're available, so putting the signal on the shared queue
829  * will be equivalent to sending it to one such thread.
830  */
831 static inline int wants_signal(int sig, struct task_struct *p)
832 {
833         if (sigismember(&p->blocked, sig))
834                 return 0;
835         if (p->flags & PF_EXITING)
836                 return 0;
837         if (sig == SIGKILL)
838                 return 1;
839         if (p->state & (TASK_STOPPED | TASK_TRACED))
840                 return 0;
841         return task_curr(p) || !signal_pending(p);
842 }
843
844 static void
845 __group_complete_signal(int sig, struct task_struct *p)
846 {
847         struct task_struct *t;
848
849         /*
850          * Now find a thread we can wake up to take the signal off the queue.
851          *
852          * If the main thread wants the signal, it gets first crack.
853          * Probably the least surprising to the average bear.
854          */
855         if (wants_signal(sig, p))
856                 t = p;
857         else if (thread_group_empty(p))
858                 /*
859                  * There is just one thread and it does not need to be woken.
860                  * It will dequeue unblocked signals before it runs again.
861                  */
862                 return;
863         else {
864                 /*
865                  * Otherwise try to find a suitable thread.
866                  */
867                 t = p->signal->curr_target;
868                 if (t == NULL)
869                         /* restart balancing at this thread */
870                         t = p->signal->curr_target = p;
871
872                 while (!wants_signal(sig, t)) {
873                         t = next_thread(t);
874                         if (t == p->signal->curr_target)
875                                 /*
876                                  * No thread needs to be woken.
877                                  * Any eligible threads will see
878                                  * the signal in the queue soon.
879                                  */
880                                 return;
881                 }
882                 p->signal->curr_target = t;
883         }
884
885         /*
886          * Found a killable thread.  If the signal will be fatal,
887          * then start taking the whole group down immediately.
888          */
889         if (sig_fatal(p, sig) && !(p->signal->flags & SIGNAL_GROUP_EXIT) &&
890             !sigismember(&t->real_blocked, sig) &&
891             (sig == SIGKILL || !(t->ptrace & PT_PTRACED))) {
892                 /*
893                  * This signal will be fatal to the whole group.
894                  */
895                 if (!sig_kernel_coredump(sig)) {
896                         /*
897                          * Start a group exit and wake everybody up.
898                          * This way we don't have other threads
899                          * running and doing things after a slower
900                          * thread has the fatal signal pending.
901                          */
902                         p->signal->flags = SIGNAL_GROUP_EXIT;
903                         p->signal->group_exit_code = sig;
904                         p->signal->group_stop_count = 0;
905                         t = p;
906                         do {
907                                 sigaddset(&t->pending.signal, SIGKILL);
908                                 signal_wake_up(t, 1);
909                                 t = next_thread(t);
910                         } while (t != p);
911                         return;
912                 }
913
914                 /*
915                  * There will be a core dump.  We make all threads other
916                  * than the chosen one go into a group stop so that nothing
917                  * happens until it gets scheduled, takes the signal off
918                  * the shared queue, and does the core dump.  This is a
919                  * little more complicated than strictly necessary, but it
920                  * keeps the signal state that winds up in the core dump
921                  * unchanged from the death state, e.g. which thread had
922                  * the core-dump signal unblocked.
923                  */
924                 rm_from_queue(SIG_KERNEL_STOP_MASK, &t->pending);
925                 rm_from_queue(SIG_KERNEL_STOP_MASK, &p->signal->shared_pending);
926                 p->signal->group_stop_count = 0;
927                 p->signal->group_exit_task = t;
928                 t = p;
929                 do {
930                         p->signal->group_stop_count++;
931                         signal_wake_up(t, 0);
932                         t = next_thread(t);
933                 } while (t != p);
934                 wake_up_process(p->signal->group_exit_task);
935                 return;
936         }
937
938         /*
939          * The signal is already in the shared-pending queue.
940          * Tell the chosen thread to wake up and dequeue it.
941          */
942         signal_wake_up(t, sig == SIGKILL);
943         return;
944 }
945
946 int
947 __group_send_sig_info(int sig, struct siginfo *info, struct task_struct *p)
948 {
949         int ret = 0;
950
951         assert_spin_locked(&p->sighand->siglock);
952         handle_stop_signal(sig, p);
953
954         /* Short-circuit ignored signals.  */
955         if (sig_ignored(p, sig))
956                 return ret;
957
958         if (LEGACY_QUEUE(&p->signal->shared_pending, sig))
959                 /* This is a non-RT signal and we already have one queued.  */
960                 return ret;
961
962         /*
963          * Put this signal on the shared-pending queue, or fail with EAGAIN.
964          * We always use the shared queue for process-wide signals,
965          * to avoid several races.
966          */
967         ret = send_signal(sig, info, p, &p->signal->shared_pending);
968         if (unlikely(ret))
969                 return ret;
970
971         __group_complete_signal(sig, p);
972         return 0;
973 }
974
975 /*
976  * Nuke all other threads in the group.
977  */
978 void zap_other_threads(struct task_struct *p)
979 {
980         struct task_struct *t;
981
982         p->signal->flags = SIGNAL_GROUP_EXIT;
983         p->signal->group_stop_count = 0;
984
985         if (thread_group_empty(p))
986                 return;
987
988         for (t = next_thread(p); t != p; t = next_thread(t)) {
989                 /*
990                  * Don't bother with already dead threads
991                  */
992                 if (t->exit_state)
993                         continue;
994
995                 /*
996                  * We don't want to notify the parent, since we are
997                  * killed as part of a thread group due to another
998                  * thread doing an execve() or similar. So set the
999                  * exit signal to -1 to allow immediate reaping of
1000                  * the process.  But don't detach the thread group
1001                  * leader.
1002                  */
1003                 if (t != p->group_leader)
1004                         t->exit_signal = -1;
1005
1006                 /* SIGKILL will be handled before any pending SIGSTOP */
1007                 sigaddset(&t->pending.signal, SIGKILL);
1008                 signal_wake_up(t, 1);
1009         }
1010 }
1011
1012 /*
1013  * Must be called under rcu_read_lock() or with tasklist_lock read-held.
1014  */
1015 struct sighand_struct *lock_task_sighand(struct task_struct *tsk, unsigned long *flags)
1016 {
1017         struct sighand_struct *sighand;
1018
1019         for (;;) {
1020                 sighand = rcu_dereference(tsk->sighand);
1021                 if (unlikely(sighand == NULL))
1022                         break;
1023
1024                 spin_lock_irqsave(&sighand->siglock, *flags);
1025                 if (likely(sighand == tsk->sighand))
1026                         break;
1027                 spin_unlock_irqrestore(&sighand->siglock, *flags);
1028         }
1029
1030         return sighand;
1031 }
1032
1033 int group_send_sig_info(int sig, struct siginfo *info, struct task_struct *p)
1034 {
1035         unsigned long flags;
1036         int ret;
1037
1038         ret = check_kill_permission(sig, info, p);
1039
1040         if (!ret && sig) {
1041                 ret = -ESRCH;
1042                 if (lock_task_sighand(p, &flags)) {
1043                         ret = __group_send_sig_info(sig, info, p);
1044                         unlock_task_sighand(p, &flags);
1045                 }
1046         }
1047
1048         return ret;
1049 }
1050
1051 /*
1052  * kill_pg_info() sends a signal to a process group: this is what the tty
1053  * control characters do (^C, ^Z etc)
1054  */
1055
1056 int __kill_pg_info(int sig, struct siginfo *info, pid_t pgrp)
1057 {
1058         struct task_struct *p = NULL;
1059         int retval, success;
1060
1061         if (pgrp <= 0)
1062                 return -EINVAL;
1063
1064         success = 0;
1065         retval = -ESRCH;
1066         do_each_task_pid(pgrp, PIDTYPE_PGID, p) {
1067                 int err = group_send_sig_info(sig, info, p);
1068                 success |= !err;
1069                 retval = err;
1070         } while_each_task_pid(pgrp, PIDTYPE_PGID, p);
1071         return success ? 0 : retval;
1072 }
1073
1074 int
1075 kill_pg_info(int sig, struct siginfo *info, pid_t pgrp)
1076 {
1077         int retval;
1078
1079         read_lock(&tasklist_lock);
1080         retval = __kill_pg_info(sig, info, pgrp);
1081         read_unlock(&tasklist_lock);
1082
1083         return retval;
1084 }
1085
1086 int
1087 kill_proc_info(int sig, struct siginfo *info, pid_t pid)
1088 {
1089         int error;
1090         int acquired_tasklist_lock = 0;
1091         struct task_struct *p;
1092
1093         rcu_read_lock();
1094         if (unlikely(sig_needs_tasklist(sig))) {
1095                 read_lock(&tasklist_lock);
1096                 acquired_tasklist_lock = 1;
1097         }
1098         p = find_task_by_pid(pid);
1099         error = -ESRCH;
1100         if (p)
1101                 error = group_send_sig_info(sig, info, p);
1102         if (unlikely(acquired_tasklist_lock))
1103                 read_unlock(&tasklist_lock);
1104         rcu_read_unlock();
1105         return error;
1106 }
1107
1108 /* like kill_proc_info(), but doesn't use uid/euid of "current" */
1109 int kill_proc_info_as_uid(int sig, struct siginfo *info, pid_t pid,
1110                       uid_t uid, uid_t euid)
1111 {
1112         int ret = -EINVAL;
1113         struct task_struct *p;
1114
1115         if (!valid_signal(sig))
1116                 return ret;
1117
1118         read_lock(&tasklist_lock);
1119         p = find_task_by_pid(pid);
1120         if (!p) {
1121                 ret = -ESRCH;
1122                 goto out_unlock;
1123         }
1124         if ((info == SEND_SIG_NOINFO || (!is_si_special(info) && SI_FROMUSER(info)))
1125             && (euid != p->suid) && (euid != p->uid)
1126             && (uid != p->suid) && (uid != p->uid)) {
1127                 ret = -EPERM;
1128                 goto out_unlock;
1129         }
1130         if (sig && p->sighand) {
1131                 unsigned long flags;
1132                 spin_lock_irqsave(&p->sighand->siglock, flags);
1133                 ret = __group_send_sig_info(sig, info, p);
1134                 spin_unlock_irqrestore(&p->sighand->siglock, flags);
1135         }
1136 out_unlock:
1137         read_unlock(&tasklist_lock);
1138         return ret;
1139 }
1140 EXPORT_SYMBOL_GPL(kill_proc_info_as_uid);
1141
1142 /*
1143  * kill_something_info() interprets pid in interesting ways just like kill(2).
1144  *
1145  * POSIX specifies that kill(-1,sig) is unspecified, but what we have
1146  * is probably wrong.  Should make it like BSD or SYSV.
1147  */
1148
1149 static int kill_something_info(int sig, struct siginfo *info, int pid)
1150 {
1151         if (!pid) {
1152                 return kill_pg_info(sig, info, process_group(current));
1153         } else if (pid == -1) {
1154                 int retval = 0, count = 0;
1155                 struct task_struct * p;
1156
1157                 read_lock(&tasklist_lock);
1158                 for_each_process(p) {
1159                         if (p->pid > 1 && p->tgid != current->tgid) {
1160                                 int err = group_send_sig_info(sig, info, p);
1161                                 ++count;
1162                                 if (err != -EPERM)
1163                                         retval = err;
1164                         }
1165                 }
1166                 read_unlock(&tasklist_lock);
1167                 return count ? retval : -ESRCH;
1168         } else if (pid < 0) {
1169                 return kill_pg_info(sig, info, -pid);
1170         } else {
1171                 return kill_proc_info(sig, info, pid);
1172         }
1173 }
1174
1175 /*
1176  * These are for backward compatibility with the rest of the kernel source.
1177  */
1178
1179 /*
1180  * These two are the most common entry points.  They send a signal
1181  * just to the specific thread.
1182  */
1183 int
1184 send_sig_info(int sig, struct siginfo *info, struct task_struct *p)
1185 {
1186         int ret;
1187         unsigned long flags;
1188
1189         /*
1190          * Make sure legacy kernel users don't send in bad values
1191          * (normal paths check this in check_kill_permission).
1192          */
1193         if (!valid_signal(sig))
1194                 return -EINVAL;
1195
1196         /*
1197          * We need the tasklist lock even for the specific
1198          * thread case (when we don't need to follow the group
1199          * lists) in order to avoid races with "p->sighand"
1200          * going away or changing from under us.
1201          */
1202         read_lock(&tasklist_lock);  
1203         spin_lock_irqsave(&p->sighand->siglock, flags);
1204         ret = specific_send_sig_info(sig, info, p);
1205         spin_unlock_irqrestore(&p->sighand->siglock, flags);
1206         read_unlock(&tasklist_lock);
1207         return ret;
1208 }
1209
1210 #define __si_special(priv) \
1211         ((priv) ? SEND_SIG_PRIV : SEND_SIG_NOINFO)
1212
1213 int
1214 send_sig(int sig, struct task_struct *p, int priv)
1215 {
1216         return send_sig_info(sig, __si_special(priv), p);
1217 }
1218
1219 /*
1220  * This is the entry point for "process-wide" signals.
1221  * They will go to an appropriate thread in the thread group.
1222  */
1223 int
1224 send_group_sig_info(int sig, struct siginfo *info, struct task_struct *p)
1225 {
1226         int ret;
1227         read_lock(&tasklist_lock);
1228         ret = group_send_sig_info(sig, info, p);
1229         read_unlock(&tasklist_lock);
1230         return ret;
1231 }
1232
1233 void
1234 force_sig(int sig, struct task_struct *p)
1235 {
1236         force_sig_info(sig, SEND_SIG_PRIV, p);
1237 }
1238
1239 /*
1240  * When things go south during signal handling, we
1241  * will force a SIGSEGV. And if the signal that caused
1242  * the problem was already a SIGSEGV, we'll want to
1243  * make sure we don't even try to deliver the signal..
1244  */
1245 int
1246 force_sigsegv(int sig, struct task_struct *p)
1247 {
1248         if (sig == SIGSEGV) {
1249                 unsigned long flags;
1250                 spin_lock_irqsave(&p->sighand->siglock, flags);
1251                 p->sighand->action[sig - 1].sa.sa_handler = SIG_DFL;
1252                 spin_unlock_irqrestore(&p->sighand->siglock, flags);
1253         }
1254         force_sig(SIGSEGV, p);
1255         return 0;
1256 }
1257
1258 int
1259 kill_pg(pid_t pgrp, int sig, int priv)
1260 {
1261         return kill_pg_info(sig, __si_special(priv), pgrp);
1262 }
1263
1264 int
1265 kill_proc(pid_t pid, int sig, int priv)
1266 {
1267         return kill_proc_info(sig, __si_special(priv), pid);
1268 }
1269
1270 /*
1271  * These functions support sending signals using preallocated sigqueue
1272  * structures.  This is needed "because realtime applications cannot
1273  * afford to lose notifications of asynchronous events, like timer
1274  * expirations or I/O completions".  In the case of Posix Timers 
1275  * we allocate the sigqueue structure from the timer_create.  If this
1276  * allocation fails we are able to report the failure to the application
1277  * with an EAGAIN error.
1278  */
1279  
1280 struct sigqueue *sigqueue_alloc(void)
1281 {
1282         struct sigqueue *q;
1283
1284         if ((q = __sigqueue_alloc(current, GFP_KERNEL, 0)))
1285                 q->flags |= SIGQUEUE_PREALLOC;
1286         return(q);
1287 }
1288
1289 void sigqueue_free(struct sigqueue *q)
1290 {
1291         unsigned long flags;
1292         BUG_ON(!(q->flags & SIGQUEUE_PREALLOC));
1293         /*
1294          * If the signal is still pending remove it from the
1295          * pending queue.
1296          */
1297         if (unlikely(!list_empty(&q->list))) {
1298                 spinlock_t *lock = &current->sighand->siglock;
1299                 read_lock(&tasklist_lock);
1300                 spin_lock_irqsave(lock, flags);
1301                 if (!list_empty(&q->list))
1302                         list_del_init(&q->list);
1303                 spin_unlock_irqrestore(lock, flags);
1304                 read_unlock(&tasklist_lock);
1305         }
1306         q->flags &= ~SIGQUEUE_PREALLOC;
1307         __sigqueue_free(q);
1308 }
1309
1310 int send_sigqueue(int sig, struct sigqueue *q, struct task_struct *p)
1311 {
1312         unsigned long flags;
1313         int ret = 0;
1314
1315         BUG_ON(!(q->flags & SIGQUEUE_PREALLOC));
1316
1317         /*
1318          * The rcu based delayed sighand destroy makes it possible to
1319          * run this without tasklist lock held. The task struct itself
1320          * cannot go away as create_timer did get_task_struct().
1321          *
1322          * We return -1, when the task is marked exiting, so
1323          * posix_timer_event can redirect it to the group leader
1324          */
1325         rcu_read_lock();
1326
1327         if (!likely(lock_task_sighand(p, &flags))) {
1328                 ret = -1;
1329                 goto out_err;
1330         }
1331
1332         if (unlikely(!list_empty(&q->list))) {
1333                 /*
1334                  * If an SI_TIMER entry is already queue just increment
1335                  * the overrun count.
1336                  */
1337                 BUG_ON(q->info.si_code != SI_TIMER);
1338                 q->info.si_overrun++;
1339                 goto out;
1340         }
1341         /* Short-circuit ignored signals.  */
1342         if (sig_ignored(p, sig)) {
1343                 ret = 1;
1344                 goto out;
1345         }
1346
1347         list_add_tail(&q->list, &p->pending.list);
1348         sigaddset(&p->pending.signal, sig);
1349         if (!sigismember(&p->blocked, sig))
1350                 signal_wake_up(p, sig == SIGKILL);
1351
1352 out:
1353         unlock_task_sighand(p, &flags);
1354 out_err:
1355         rcu_read_unlock();
1356
1357         return ret;
1358 }
1359
1360 int
1361 send_group_sigqueue(int sig, struct sigqueue *q, struct task_struct *p)
1362 {
1363         unsigned long flags;
1364         int ret = 0;
1365
1366         BUG_ON(!(q->flags & SIGQUEUE_PREALLOC));
1367
1368         read_lock(&tasklist_lock);
1369         /* Since it_lock is held, p->sighand cannot be NULL. */
1370         spin_lock_irqsave(&p->sighand->siglock, flags);
1371         handle_stop_signal(sig, p);
1372
1373         /* Short-circuit ignored signals.  */
1374         if (sig_ignored(p, sig)) {
1375                 ret = 1;
1376                 goto out;
1377         }
1378
1379         if (unlikely(!list_empty(&q->list))) {
1380                 /*
1381                  * If an SI_TIMER entry is already queue just increment
1382                  * the overrun count.  Other uses should not try to
1383                  * send the signal multiple times.
1384                  */
1385                 BUG_ON(q->info.si_code != SI_TIMER);
1386                 q->info.si_overrun++;
1387                 goto out;
1388         } 
1389
1390         /*
1391          * Put this signal on the shared-pending queue.
1392          * We always use the shared queue for process-wide signals,
1393          * to avoid several races.
1394          */
1395         list_add_tail(&q->list, &p->signal->shared_pending.list);
1396         sigaddset(&p->signal->shared_pending.signal, sig);
1397
1398         __group_complete_signal(sig, p);
1399 out:
1400         spin_unlock_irqrestore(&p->sighand->siglock, flags);
1401         read_unlock(&tasklist_lock);
1402         return ret;
1403 }
1404
1405 /*
1406  * Wake up any threads in the parent blocked in wait* syscalls.
1407  */
1408 static inline void __wake_up_parent(struct task_struct *p,
1409                                     struct task_struct *parent)
1410 {
1411         wake_up_interruptible_sync(&parent->signal->wait_chldexit);
1412 }
1413
1414 /*
1415  * Let a parent know about the death of a child.
1416  * For a stopped/continued status change, use do_notify_parent_cldstop instead.
1417  */
1418
1419 void do_notify_parent(struct task_struct *tsk, int sig)
1420 {
1421         struct siginfo info;
1422         unsigned long flags;
1423         struct sighand_struct *psig;
1424
1425         BUG_ON(sig == -1);
1426
1427         /* do_notify_parent_cldstop should have been called instead.  */
1428         BUG_ON(tsk->state & (TASK_STOPPED|TASK_TRACED));
1429
1430         BUG_ON(!tsk->ptrace &&
1431                (tsk->group_leader != tsk || !thread_group_empty(tsk)));
1432
1433         info.si_signo = sig;
1434         info.si_errno = 0;
1435         info.si_pid = tsk->pid;
1436         info.si_uid = tsk->uid;
1437
1438         /* FIXME: find out whether or not this is supposed to be c*time. */
1439         info.si_utime = cputime_to_jiffies(cputime_add(tsk->utime,
1440                                                        tsk->signal->utime));
1441         info.si_stime = cputime_to_jiffies(cputime_add(tsk->stime,
1442                                                        tsk->signal->stime));
1443
1444         info.si_status = tsk->exit_code & 0x7f;
1445         if (tsk->exit_code & 0x80)
1446                 info.si_code = CLD_DUMPED;
1447         else if (tsk->exit_code & 0x7f)
1448                 info.si_code = CLD_KILLED;
1449         else {
1450                 info.si_code = CLD_EXITED;
1451                 info.si_status = tsk->exit_code >> 8;
1452         }
1453
1454         psig = tsk->parent->sighand;
1455         spin_lock_irqsave(&psig->siglock, flags);
1456         if (!tsk->ptrace && sig == SIGCHLD &&
1457             (psig->action[SIGCHLD-1].sa.sa_handler == SIG_IGN ||
1458              (psig->action[SIGCHLD-1].sa.sa_flags & SA_NOCLDWAIT))) {
1459                 /*
1460                  * We are exiting and our parent doesn't care.  POSIX.1
1461                  * defines special semantics for setting SIGCHLD to SIG_IGN
1462                  * or setting the SA_NOCLDWAIT flag: we should be reaped
1463                  * automatically and not left for our parent's wait4 call.
1464                  * Rather than having the parent do it as a magic kind of
1465                  * signal handler, we just set this to tell do_exit that we
1466                  * can be cleaned up without becoming a zombie.  Note that
1467                  * we still call __wake_up_parent in this case, because a
1468                  * blocked sys_wait4 might now return -ECHILD.
1469                  *
1470                  * Whether we send SIGCHLD or not for SA_NOCLDWAIT
1471                  * is implementation-defined: we do (if you don't want
1472                  * it, just use SIG_IGN instead).
1473                  */
1474                 tsk->exit_signal = -1;
1475                 if (psig->action[SIGCHLD-1].sa.sa_handler == SIG_IGN)
1476                         sig = 0;
1477         }
1478         if (valid_signal(sig) && sig > 0)
1479                 __group_send_sig_info(sig, &info, tsk->parent);
1480         __wake_up_parent(tsk, tsk->parent);
1481         spin_unlock_irqrestore(&psig->siglock, flags);
1482 }
1483
1484 static void do_notify_parent_cldstop(struct task_struct *tsk, int why)
1485 {
1486         struct siginfo info;
1487         unsigned long flags;
1488         struct task_struct *parent;
1489         struct sighand_struct *sighand;
1490
1491         if (tsk->ptrace & PT_PTRACED)
1492                 parent = tsk->parent;
1493         else {
1494                 tsk = tsk->group_leader;
1495                 parent = tsk->real_parent;
1496         }
1497
1498         info.si_signo = SIGCHLD;
1499         info.si_errno = 0;
1500         info.si_pid = tsk->pid;
1501         info.si_uid = tsk->uid;
1502
1503         /* FIXME: find out whether or not this is supposed to be c*time. */
1504         info.si_utime = cputime_to_jiffies(tsk->utime);
1505         info.si_stime = cputime_to_jiffies(tsk->stime);
1506
1507         info.si_code = why;
1508         switch (why) {
1509         case CLD_CONTINUED:
1510                 info.si_status = SIGCONT;
1511                 break;
1512         case CLD_STOPPED:
1513                 info.si_status = tsk->signal->group_exit_code & 0x7f;
1514                 break;
1515         case CLD_TRAPPED:
1516                 info.si_status = tsk->exit_code & 0x7f;
1517                 break;
1518         default:
1519                 BUG();
1520         }
1521
1522         sighand = parent->sighand;
1523         spin_lock_irqsave(&sighand->siglock, flags);
1524         if (sighand->action[SIGCHLD-1].sa.sa_handler != SIG_IGN &&
1525             !(sighand->action[SIGCHLD-1].sa.sa_flags & SA_NOCLDSTOP))
1526                 __group_send_sig_info(SIGCHLD, &info, parent);
1527         /*
1528          * Even if SIGCHLD is not generated, we must wake up wait4 calls.
1529          */
1530         __wake_up_parent(tsk, parent);
1531         spin_unlock_irqrestore(&sighand->siglock, flags);
1532 }
1533
1534 static inline int may_ptrace_stop(void)
1535 {
1536         if (!likely(current->ptrace & PT_PTRACED))
1537                 return 0;
1538
1539         if (unlikely(current->parent == current->real_parent &&
1540                     (current->ptrace & PT_ATTACHED)))
1541                 return 0;
1542
1543         if (unlikely(current->signal == current->parent->signal) &&
1544             unlikely(current->signal->flags & SIGNAL_GROUP_EXIT))
1545                 return 0;
1546
1547         /*
1548          * Are we in the middle of do_coredump?
1549          * If so and our tracer is also part of the coredump stopping
1550          * is a deadlock situation, and pointless because our tracer
1551          * is dead so don't allow us to stop.
1552          * If SIGKILL was already sent before the caller unlocked
1553          * ->siglock we must see ->core_waiters != 0. Otherwise it
1554          * is safe to enter schedule().
1555          */
1556         if (unlikely(current->mm->core_waiters) &&
1557             unlikely(current->mm == current->parent->mm))
1558                 return 0;
1559
1560         return 1;
1561 }
1562
1563 /*
1564  * This must be called with current->sighand->siglock held.
1565  *
1566  * This should be the path for all ptrace stops.
1567  * We always set current->last_siginfo while stopped here.
1568  * That makes it a way to test a stopped process for
1569  * being ptrace-stopped vs being job-control-stopped.
1570  *
1571  * If we actually decide not to stop at all because the tracer is gone,
1572  * we leave nostop_code in current->exit_code.
1573  */
1574 static void ptrace_stop(int exit_code, int nostop_code, siginfo_t *info)
1575 {
1576         /*
1577          * If there is a group stop in progress,
1578          * we must participate in the bookkeeping.
1579          */
1580         if (current->signal->group_stop_count > 0)
1581                 --current->signal->group_stop_count;
1582
1583         current->last_siginfo = info;
1584         current->exit_code = exit_code;
1585
1586         /* Let the debugger run.  */
1587         set_current_state(TASK_TRACED);
1588         spin_unlock_irq(&current->sighand->siglock);
1589         try_to_freeze();
1590         read_lock(&tasklist_lock);
1591         if (may_ptrace_stop()) {
1592                 do_notify_parent_cldstop(current, CLD_TRAPPED);
1593                 read_unlock(&tasklist_lock);
1594                 schedule();
1595         } else {
1596                 /*
1597                  * By the time we got the lock, our tracer went away.
1598                  * Don't stop here.
1599                  */
1600                 read_unlock(&tasklist_lock);
1601                 set_current_state(TASK_RUNNING);
1602                 current->exit_code = nostop_code;
1603         }
1604
1605         /*
1606          * We are back.  Now reacquire the siglock before touching
1607          * last_siginfo, so that we are sure to have synchronized with
1608          * any signal-sending on another CPU that wants to examine it.
1609          */
1610         spin_lock_irq(&current->sighand->siglock);
1611         current->last_siginfo = NULL;
1612
1613         /*
1614          * Queued signals ignored us while we were stopped for tracing.
1615          * So check for any that we should take before resuming user mode.
1616          */
1617         recalc_sigpending();
1618 }
1619
1620 void ptrace_notify(int exit_code)
1621 {
1622         siginfo_t info;
1623
1624         BUG_ON((exit_code & (0x7f | ~0xffff)) != SIGTRAP);
1625
1626         memset(&info, 0, sizeof info);
1627         info.si_signo = SIGTRAP;
1628         info.si_code = exit_code;
1629         info.si_pid = current->pid;
1630         info.si_uid = current->uid;
1631
1632         /* Let the debugger run.  */
1633         spin_lock_irq(&current->sighand->siglock);
1634         ptrace_stop(exit_code, 0, &info);
1635         spin_unlock_irq(&current->sighand->siglock);
1636 }
1637
1638 static void
1639 finish_stop(int stop_count)
1640 {
1641         /*
1642          * If there are no other threads in the group, or if there is
1643          * a group stop in progress and we are the last to stop,
1644          * report to the parent.  When ptraced, every thread reports itself.
1645          */
1646         if (stop_count == 0 || (current->ptrace & PT_PTRACED)) {
1647                 read_lock(&tasklist_lock);
1648                 do_notify_parent_cldstop(current, CLD_STOPPED);
1649                 read_unlock(&tasklist_lock);
1650         }
1651
1652         schedule();
1653         /*
1654          * Now we don't run again until continued.
1655          */
1656         current->exit_code = 0;
1657 }
1658
1659 /*
1660  * This performs the stopping for SIGSTOP and other stop signals.
1661  * We have to stop all threads in the thread group.
1662  * Returns nonzero if we've actually stopped and released the siglock.
1663  * Returns zero if we didn't stop and still hold the siglock.
1664  */
1665 static int do_signal_stop(int signr)
1666 {
1667         struct signal_struct *sig = current->signal;
1668         int stop_count;
1669
1670         if (!likely(sig->flags & SIGNAL_STOP_DEQUEUED))
1671                 return 0;
1672
1673         if (sig->group_stop_count > 0) {
1674                 /*
1675                  * There is a group stop in progress.  We don't need to
1676                  * start another one.
1677                  */
1678                 stop_count = --sig->group_stop_count;
1679         } else {
1680                 /*
1681                  * There is no group stop already in progress.
1682                  * We must initiate one now.
1683                  */
1684                 struct task_struct *t;
1685
1686                 sig->group_exit_code = signr;
1687
1688                 stop_count = 0;
1689                 for (t = next_thread(current); t != current; t = next_thread(t))
1690                         /*
1691                          * Setting state to TASK_STOPPED for a group
1692                          * stop is always done with the siglock held,
1693                          * so this check has no races.
1694                          */
1695                         if (!t->exit_state &&
1696                             !(t->state & (TASK_STOPPED|TASK_TRACED))) {
1697                                 stop_count++;
1698                                 signal_wake_up(t, 0);
1699                         }
1700                 sig->group_stop_count = stop_count;
1701         }
1702
1703         if (stop_count == 0)
1704                 sig->flags = SIGNAL_STOP_STOPPED;
1705         current->exit_code = sig->group_exit_code;
1706         __set_current_state(TASK_STOPPED);
1707
1708         spin_unlock_irq(&current->sighand->siglock);
1709         finish_stop(stop_count);
1710         return 1;
1711 }
1712
1713 /*
1714  * Do appropriate magic when group_stop_count > 0.
1715  * We return nonzero if we stopped, after releasing the siglock.
1716  * We return zero if we still hold the siglock and should look
1717  * for another signal without checking group_stop_count again.
1718  */
1719 static int handle_group_stop(void)
1720 {
1721         int stop_count;
1722
1723         if (current->signal->group_exit_task == current) {
1724                 /*
1725                  * Group stop is so we can do a core dump,
1726                  * We are the initiating thread, so get on with it.
1727                  */
1728                 current->signal->group_exit_task = NULL;
1729                 return 0;
1730         }
1731
1732         if (current->signal->flags & SIGNAL_GROUP_EXIT)
1733                 /*
1734                  * Group stop is so another thread can do a core dump,
1735                  * or else we are racing against a death signal.
1736                  * Just punt the stop so we can get the next signal.
1737                  */
1738                 return 0;
1739
1740         /*
1741          * There is a group stop in progress.  We stop
1742          * without any associated signal being in our queue.
1743          */
1744         stop_count = --current->signal->group_stop_count;
1745         if (stop_count == 0)
1746                 current->signal->flags = SIGNAL_STOP_STOPPED;
1747         current->exit_code = current->signal->group_exit_code;
1748         set_current_state(TASK_STOPPED);
1749         spin_unlock_irq(&current->sighand->siglock);
1750         finish_stop(stop_count);
1751         return 1;
1752 }
1753
1754 int get_signal_to_deliver(siginfo_t *info, struct k_sigaction *return_ka,
1755                           struct pt_regs *regs, void *cookie)
1756 {
1757         sigset_t *mask = &current->blocked;
1758         int signr = 0;
1759
1760         try_to_freeze();
1761
1762 relock:
1763         spin_lock_irq(&current->sighand->siglock);
1764         for (;;) {
1765                 struct k_sigaction *ka;
1766
1767                 if (unlikely(current->signal->group_stop_count > 0) &&
1768                     handle_group_stop())
1769                         goto relock;
1770
1771                 signr = dequeue_signal(current, mask, info);
1772
1773                 if (!signr)
1774                         break; /* will return 0 */
1775
1776                 if ((current->ptrace & PT_PTRACED) && signr != SIGKILL) {
1777                         ptrace_signal_deliver(regs, cookie);
1778
1779                         /* Let the debugger run.  */
1780                         ptrace_stop(signr, signr, info);
1781
1782                         /* We're back.  Did the debugger cancel the sig?  */
1783                         signr = current->exit_code;
1784                         if (signr == 0)
1785                                 continue;
1786
1787                         current->exit_code = 0;
1788
1789                         /* Update the siginfo structure if the signal has
1790                            changed.  If the debugger wanted something
1791                            specific in the siginfo structure then it should
1792                            have updated *info via PTRACE_SETSIGINFO.  */
1793                         if (signr != info->si_signo) {
1794                                 info->si_signo = signr;
1795                                 info->si_errno = 0;
1796                                 info->si_code = SI_USER;
1797                                 info->si_pid = current->parent->pid;
1798                                 info->si_uid = current->parent->uid;
1799                         }
1800
1801                         /* If the (new) signal is now blocked, requeue it.  */
1802                         if (sigismember(&current->blocked, signr)) {
1803                                 specific_send_sig_info(signr, info, current);
1804                                 continue;
1805                         }
1806                 }
1807
1808                 ka = &current->sighand->action[signr-1];
1809                 if (ka->sa.sa_handler == SIG_IGN) /* Do nothing.  */
1810                         continue;
1811                 if (ka->sa.sa_handler != SIG_DFL) {
1812                         /* Run the handler.  */
1813                         *return_ka = *ka;
1814
1815                         if (ka->sa.sa_flags & SA_ONESHOT)
1816                                 ka->sa.sa_handler = SIG_DFL;
1817
1818                         break; /* will return non-zero "signr" value */
1819                 }
1820
1821                 /*
1822                  * Now we are doing the default action for this signal.
1823                  */
1824                 if (sig_kernel_ignore(signr)) /* Default is nothing. */
1825                         continue;
1826
1827                 /* Init gets no signals it doesn't want.  */
1828                 if (current == child_reaper)
1829                         continue;
1830
1831                 if (sig_kernel_stop(signr)) {
1832                         /*
1833                          * The default action is to stop all threads in
1834                          * the thread group.  The job control signals
1835                          * do nothing in an orphaned pgrp, but SIGSTOP
1836                          * always works.  Note that siglock needs to be
1837                          * dropped during the call to is_orphaned_pgrp()
1838                          * because of lock ordering with tasklist_lock.
1839                          * This allows an intervening SIGCONT to be posted.
1840                          * We need to check for that and bail out if necessary.
1841                          */
1842                         if (signr != SIGSTOP) {
1843                                 spin_unlock_irq(&current->sighand->siglock);
1844
1845                                 /* signals can be posted during this window */
1846
1847                                 if (is_orphaned_pgrp(process_group(current)))
1848                                         goto relock;
1849
1850                                 spin_lock_irq(&current->sighand->siglock);
1851                         }
1852
1853                         if (likely(do_signal_stop(signr))) {
1854                                 /* It released the siglock.  */
1855                                 goto relock;
1856                         }
1857
1858                         /*
1859                          * We didn't actually stop, due to a race
1860                          * with SIGCONT or something like that.
1861                          */
1862                         continue;
1863                 }
1864
1865                 spin_unlock_irq(&current->sighand->siglock);
1866
1867                 /*
1868                  * Anything else is fatal, maybe with a core dump.
1869                  */
1870                 current->flags |= PF_SIGNALED;
1871                 if (sig_kernel_coredump(signr)) {
1872                         /*
1873                          * If it was able to dump core, this kills all
1874                          * other threads in the group and synchronizes with
1875                          * their demise.  If we lost the race with another
1876                          * thread getting here, it set group_exit_code
1877                          * first and our do_group_exit call below will use
1878                          * that value and ignore the one we pass it.
1879                          */
1880                         do_coredump((long)signr, signr, regs);
1881                 }
1882
1883                 /*
1884                  * Death signals, no core dump.
1885                  */
1886                 do_group_exit(signr);
1887                 /* NOTREACHED */
1888         }
1889         spin_unlock_irq(&current->sighand->siglock);
1890         return signr;
1891 }
1892
1893 EXPORT_SYMBOL(recalc_sigpending);
1894 EXPORT_SYMBOL_GPL(dequeue_signal);
1895 EXPORT_SYMBOL(flush_signals);
1896 EXPORT_SYMBOL(force_sig);
1897 EXPORT_SYMBOL(kill_pg);
1898 EXPORT_SYMBOL(kill_proc);
1899 EXPORT_SYMBOL(ptrace_notify);
1900 EXPORT_SYMBOL(send_sig);
1901 EXPORT_SYMBOL(send_sig_info);
1902 EXPORT_SYMBOL(sigprocmask);
1903 EXPORT_SYMBOL(block_all_signals);
1904 EXPORT_SYMBOL(unblock_all_signals);
1905
1906
1907 /*
1908  * System call entry points.
1909  */
1910
1911 asmlinkage long sys_restart_syscall(void)
1912 {
1913         struct restart_block *restart = &current_thread_info()->restart_block;
1914         return restart->fn(restart);
1915 }
1916
1917 long do_no_restart_syscall(struct restart_block *param)
1918 {
1919         return -EINTR;
1920 }
1921
1922 /*
1923  * We don't need to get the kernel lock - this is all local to this
1924  * particular thread.. (and that's good, because this is _heavily_
1925  * used by various programs)
1926  */
1927
1928 /*
1929  * This is also useful for kernel threads that want to temporarily
1930  * (or permanently) block certain signals.
1931  *
1932  * NOTE! Unlike the user-mode sys_sigprocmask(), the kernel
1933  * interface happily blocks "unblockable" signals like SIGKILL
1934  * and friends.
1935  */
1936 int sigprocmask(int how, sigset_t *set, sigset_t *oldset)
1937 {
1938         int error;
1939
1940         spin_lock_irq(&current->sighand->siglock);
1941         if (oldset)
1942                 *oldset = current->blocked;
1943
1944         error = 0;
1945         switch (how) {
1946         case SIG_BLOCK:
1947                 sigorsets(&current->blocked, &current->blocked, set);
1948                 break;
1949         case SIG_UNBLOCK:
1950                 signandsets(&current->blocked, &current->blocked, set);
1951                 break;
1952         case SIG_SETMASK:
1953                 current->blocked = *set;
1954                 break;
1955         default:
1956                 error = -EINVAL;
1957         }
1958         recalc_sigpending();
1959         spin_unlock_irq(&current->sighand->siglock);
1960
1961         return error;
1962 }
1963
1964 asmlinkage long
1965 sys_rt_sigprocmask(int how, sigset_t __user *set, sigset_t __user *oset, size_t sigsetsize)
1966 {
1967         int error = -EINVAL;
1968         sigset_t old_set, new_set;
1969
1970         /* XXX: Don't preclude handling different sized sigset_t's.  */
1971         if (sigsetsize != sizeof(sigset_t))
1972                 goto out;
1973
1974         if (set) {
1975                 error = -EFAULT;
1976                 if (copy_from_user(&new_set, set, sizeof(*set)))
1977                         goto out;
1978                 sigdelsetmask(&new_set, sigmask(SIGKILL)|sigmask(SIGSTOP));
1979
1980                 error = sigprocmask(how, &new_set, &old_set);
1981                 if (error)
1982                         goto out;
1983                 if (oset)
1984                         goto set_old;
1985         } else if (oset) {
1986                 spin_lock_irq(&current->sighand->siglock);
1987                 old_set = current->blocked;
1988                 spin_unlock_irq(&current->sighand->siglock);
1989
1990         set_old:
1991                 error = -EFAULT;
1992                 if (copy_to_user(oset, &old_set, sizeof(*oset)))
1993                         goto out;
1994         }
1995         error = 0;
1996 out:
1997         return error;
1998 }
1999
2000 long do_sigpending(void __user *set, unsigned long sigsetsize)
2001 {
2002         long error = -EINVAL;
2003         sigset_t pending;
2004
2005         if (sigsetsize > sizeof(sigset_t))
2006                 goto out;
2007
2008         spin_lock_irq(&current->sighand->siglock);
2009         sigorsets(&pending, &current->pending.signal,
2010                   &current->signal->shared_pending.signal);
2011         spin_unlock_irq(&current->sighand->siglock);
2012
2013         /* Outside the lock because only this thread touches it.  */
2014         sigandsets(&pending, &current->blocked, &pending);
2015
2016         error = -EFAULT;
2017         if (!copy_to_user(set, &pending, sigsetsize))
2018                 error = 0;
2019
2020 out:
2021         return error;
2022 }       
2023
2024 asmlinkage long
2025 sys_rt_sigpending(sigset_t __user *set, size_t sigsetsize)
2026 {
2027         return do_sigpending(set, sigsetsize);
2028 }
2029
2030 #ifndef HAVE_ARCH_COPY_SIGINFO_TO_USER
2031
2032 int copy_siginfo_to_user(siginfo_t __user *to, siginfo_t *from)
2033 {
2034         int err;
2035
2036         if (!access_ok (VERIFY_WRITE, to, sizeof(siginfo_t)))
2037                 return -EFAULT;
2038         if (from->si_code < 0)
2039                 return __copy_to_user(to, from, sizeof(siginfo_t))
2040                         ? -EFAULT : 0;
2041         /*
2042          * If you change siginfo_t structure, please be sure
2043          * this code is fixed accordingly.
2044          * It should never copy any pad contained in the structure
2045          * to avoid security leaks, but must copy the generic
2046          * 3 ints plus the relevant union member.
2047          */
2048         err = __put_user(from->si_signo, &to->si_signo);
2049         err |= __put_user(from->si_errno, &to->si_errno);
2050         err |= __put_user((short)from->si_code, &to->si_code);
2051         switch (from->si_code & __SI_MASK) {
2052         case __SI_KILL:
2053                 err |= __put_user(from->si_pid, &to->si_pid);
2054                 err |= __put_user(from->si_uid, &to->si_uid);
2055                 break;
2056         case __SI_TIMER:
2057                  err |= __put_user(from->si_tid, &to->si_tid);
2058                  err |= __put_user(from->si_overrun, &to->si_overrun);
2059                  err |= __put_user(from->si_ptr, &to->si_ptr);
2060                 break;
2061         case __SI_POLL:
2062                 err |= __put_user(from->si_band, &to->si_band);
2063                 err |= __put_user(from->si_fd, &to->si_fd);
2064                 break;
2065         case __SI_FAULT:
2066                 err |= __put_user(from->si_addr, &to->si_addr);
2067 #ifdef __ARCH_SI_TRAPNO
2068                 err |= __put_user(from->si_trapno, &to->si_trapno);
2069 #endif
2070                 break;
2071         case __SI_CHLD:
2072                 err |= __put_user(from->si_pid, &to->si_pid);
2073                 err |= __put_user(from->si_uid, &to->si_uid);
2074                 err |= __put_user(from->si_status, &to->si_status);
2075                 err |= __put_user(from->si_utime, &to->si_utime);
2076                 err |= __put_user(from->si_stime, &to->si_stime);
2077                 break;
2078         case __SI_RT: /* This is not generated by the kernel as of now. */
2079         case __SI_MESGQ: /* But this is */
2080                 err |= __put_user(from->si_pid, &to->si_pid);
2081                 err |= __put_user(from->si_uid, &to->si_uid);
2082                 err |= __put_user(from->si_ptr, &to->si_ptr);
2083                 break;
2084         default: /* this is just in case for now ... */
2085                 err |= __put_user(from->si_pid, &to->si_pid);
2086                 err |= __put_user(from->si_uid, &to->si_uid);
2087                 break;
2088         }
2089         return err;
2090 }
2091
2092 #endif
2093
2094 asmlinkage long
2095 sys_rt_sigtimedwait(const sigset_t __user *uthese,
2096                     siginfo_t __user *uinfo,
2097                     const struct timespec __user *uts,
2098                     size_t sigsetsize)
2099 {
2100         int ret, sig;
2101         sigset_t these;
2102         struct timespec ts;
2103         siginfo_t info;
2104         long timeout = 0;
2105
2106         /* XXX: Don't preclude handling different sized sigset_t's.  */
2107         if (sigsetsize != sizeof(sigset_t))
2108                 return -EINVAL;
2109
2110         if (copy_from_user(&these, uthese, sizeof(these)))
2111                 return -EFAULT;
2112                 
2113         /*
2114          * Invert the set of allowed signals to get those we
2115          * want to block.
2116          */
2117         sigdelsetmask(&these, sigmask(SIGKILL)|sigmask(SIGSTOP));
2118         signotset(&these);
2119
2120         if (uts) {
2121                 if (copy_from_user(&ts, uts, sizeof(ts)))
2122                         return -EFAULT;
2123                 if (ts.tv_nsec >= 1000000000L || ts.tv_nsec < 0
2124                     || ts.tv_sec < 0)
2125                         return -EINVAL;
2126         }
2127
2128         spin_lock_irq(&current->sighand->siglock);
2129         sig = dequeue_signal(current, &these, &info);
2130         if (!sig) {
2131                 timeout = MAX_SCHEDULE_TIMEOUT;
2132                 if (uts)
2133                         timeout = (timespec_to_jiffies(&ts)
2134                                    + (ts.tv_sec || ts.tv_nsec));
2135
2136                 if (timeout) {
2137                         /* None ready -- temporarily unblock those we're
2138                          * interested while we are sleeping in so that we'll
2139                          * be awakened when they arrive.  */
2140                         current->real_blocked = current->blocked;
2141                         sigandsets(&current->blocked, &current->blocked, &these);
2142                         recalc_sigpending();
2143                         spin_unlock_irq(&current->sighand->siglock);
2144
2145                         timeout = schedule_timeout_interruptible(timeout);
2146
2147                         spin_lock_irq(&current->sighand->siglock);
2148                         sig = dequeue_signal(current, &these, &info);
2149                         current->blocked = current->real_blocked;
2150                         siginitset(&current->real_blocked, 0);
2151                         recalc_sigpending();
2152                 }
2153         }
2154         spin_unlock_irq(&current->sighand->siglock);
2155
2156         if (sig) {
2157                 ret = sig;
2158                 if (uinfo) {
2159                         if (copy_siginfo_to_user(uinfo, &info))
2160                                 ret = -EFAULT;
2161                 }
2162         } else {
2163                 ret = -EAGAIN;
2164                 if (timeout)
2165                         ret = -EINTR;
2166         }
2167
2168         return ret;
2169 }
2170
2171 asmlinkage long
2172 sys_kill(int pid, int sig)
2173 {
2174         struct siginfo info;
2175
2176         info.si_signo = sig;
2177         info.si_errno = 0;
2178         info.si_code = SI_USER;
2179         info.si_pid = current->tgid;
2180         info.si_uid = current->uid;
2181
2182         return kill_something_info(sig, &info, pid);
2183 }
2184
2185 static int do_tkill(int tgid, int pid, int sig)
2186 {
2187         int error;
2188         struct siginfo info;
2189         struct task_struct *p;
2190
2191         error = -ESRCH;
2192         info.si_signo = sig;
2193         info.si_errno = 0;
2194         info.si_code = SI_TKILL;
2195         info.si_pid = current->tgid;
2196         info.si_uid = current->uid;
2197
2198         read_lock(&tasklist_lock);
2199         p = find_task_by_pid(pid);
2200         if (p && (tgid <= 0 || p->tgid == tgid)) {
2201                 error = check_kill_permission(sig, &info, p);
2202                 /*
2203                  * The null signal is a permissions and process existence
2204                  * probe.  No signal is actually delivered.
2205                  */
2206                 if (!error && sig && p->sighand) {
2207                         spin_lock_irq(&p->sighand->siglock);
2208                         handle_stop_signal(sig, p);
2209                         error = specific_send_sig_info(sig, &info, p);
2210                         spin_unlock_irq(&p->sighand->siglock);
2211                 }
2212         }
2213         read_unlock(&tasklist_lock);
2214
2215         return error;
2216 }
2217
2218 /**
2219  *  sys_tgkill - send signal to one specific thread
2220  *  @tgid: the thread group ID of the thread
2221  *  @pid: the PID of the thread
2222  *  @sig: signal to be sent
2223  *
2224  *  This syscall also checks the tgid and returns -ESRCH even if the PID
2225  *  exists but it's not belonging to the target process anymore. This
2226  *  method solves the problem of threads exiting and PIDs getting reused.
2227  */
2228 asmlinkage long sys_tgkill(int tgid, int pid, int sig)
2229 {
2230         /* This is only valid for single tasks */
2231         if (pid <= 0 || tgid <= 0)
2232                 return -EINVAL;
2233
2234         return do_tkill(tgid, pid, sig);
2235 }
2236
2237 /*
2238  *  Send a signal to only one task, even if it's a CLONE_THREAD task.
2239  */
2240 asmlinkage long
2241 sys_tkill(int pid, int sig)
2242 {
2243         /* This is only valid for single tasks */
2244         if (pid <= 0)
2245                 return -EINVAL;
2246
2247         return do_tkill(0, pid, sig);
2248 }
2249
2250 asmlinkage long
2251 sys_rt_sigqueueinfo(int pid, int sig, siginfo_t __user *uinfo)
2252 {
2253         siginfo_t info;
2254
2255         if (copy_from_user(&info, uinfo, sizeof(siginfo_t)))
2256                 return -EFAULT;
2257
2258         /* Not even root can pretend to send signals from the kernel.
2259            Nor can they impersonate a kill(), which adds source info.  */
2260         if (info.si_code >= 0)
2261                 return -EPERM;
2262         info.si_signo = sig;
2263
2264         /* POSIX.1b doesn't mention process groups.  */
2265         return kill_proc_info(sig, &info, pid);
2266 }
2267
2268 int do_sigaction(int sig, struct k_sigaction *act, struct k_sigaction *oact)
2269 {
2270         struct k_sigaction *k;
2271         sigset_t mask;
2272
2273         if (!valid_signal(sig) || sig < 1 || (act && sig_kernel_only(sig)))
2274                 return -EINVAL;
2275
2276         k = &current->sighand->action[sig-1];
2277
2278         spin_lock_irq(&current->sighand->siglock);
2279         if (signal_pending(current)) {
2280                 /*
2281                  * If there might be a fatal signal pending on multiple
2282                  * threads, make sure we take it before changing the action.
2283                  */
2284                 spin_unlock_irq(&current->sighand->siglock);
2285                 return -ERESTARTNOINTR;
2286         }
2287
2288         if (oact)
2289                 *oact = *k;
2290
2291         if (act) {
2292                 sigdelsetmask(&act->sa.sa_mask,
2293                               sigmask(SIGKILL) | sigmask(SIGSTOP));
2294                 *k = *act;
2295                 /*
2296                  * POSIX 3.3.1.3:
2297                  *  "Setting a signal action to SIG_IGN for a signal that is
2298                  *   pending shall cause the pending signal to be discarded,
2299                  *   whether or not it is blocked."
2300                  *
2301                  *  "Setting a signal action to SIG_DFL for a signal that is
2302                  *   pending and whose default action is to ignore the signal
2303                  *   (for example, SIGCHLD), shall cause the pending signal to
2304                  *   be discarded, whether or not it is blocked"
2305                  */
2306                 if (act->sa.sa_handler == SIG_IGN ||
2307                    (act->sa.sa_handler == SIG_DFL && sig_kernel_ignore(sig))) {
2308                         struct task_struct *t = current;
2309                         sigemptyset(&mask);
2310                         sigaddset(&mask, sig);
2311                         rm_from_queue_full(&mask, &t->signal->shared_pending);
2312                         do {
2313                                 rm_from_queue_full(&mask, &t->pending);
2314                                 recalc_sigpending_tsk(t);
2315                                 t = next_thread(t);
2316                         } while (t != current);
2317                 }
2318         }
2319
2320         spin_unlock_irq(&current->sighand->siglock);
2321         return 0;
2322 }
2323
2324 int 
2325 do_sigaltstack (const stack_t __user *uss, stack_t __user *uoss, unsigned long sp)
2326 {
2327         stack_t oss;
2328         int error;
2329
2330         if (uoss) {
2331                 oss.ss_sp = (void __user *) current->sas_ss_sp;
2332                 oss.ss_size = current->sas_ss_size;
2333                 oss.ss_flags = sas_ss_flags(sp);
2334         }
2335
2336         if (uss) {
2337                 void __user *ss_sp;
2338                 size_t ss_size;
2339                 int ss_flags;
2340
2341                 error = -EFAULT;
2342                 if (!access_ok(VERIFY_READ, uss, sizeof(*uss))
2343                     || __get_user(ss_sp, &uss->ss_sp)
2344                     || __get_user(ss_flags, &uss->ss_flags)
2345                     || __get_user(ss_size, &uss->ss_size))
2346                         goto out;
2347
2348                 error = -EPERM;
2349                 if (on_sig_stack(sp))
2350                         goto out;
2351
2352                 error = -EINVAL;
2353                 /*
2354                  *
2355                  * Note - this code used to test ss_flags incorrectly
2356                  *        old code may have been written using ss_flags==0
2357                  *        to mean ss_flags==SS_ONSTACK (as this was the only
2358                  *        way that worked) - this fix preserves that older
2359                  *        mechanism
2360                  */
2361                 if (ss_flags != SS_DISABLE && ss_flags != SS_ONSTACK && ss_flags != 0)
2362                         goto out;
2363
2364                 if (ss_flags == SS_DISABLE) {
2365                         ss_size = 0;
2366                         ss_sp = NULL;
2367                 } else {
2368                         error = -ENOMEM;
2369                         if (ss_size < MINSIGSTKSZ)
2370                                 goto out;
2371                 }
2372
2373                 current->sas_ss_sp = (unsigned long) ss_sp;
2374                 current->sas_ss_size = ss_size;
2375         }
2376
2377         if (uoss) {
2378                 error = -EFAULT;
2379                 if (copy_to_user(uoss, &oss, sizeof(oss)))
2380                         goto out;
2381         }
2382
2383         error = 0;
2384 out:
2385         return error;
2386 }
2387
2388 #ifdef __ARCH_WANT_SYS_SIGPENDING
2389
2390 asmlinkage long
2391 sys_sigpending(old_sigset_t __user *set)
2392 {
2393         return do_sigpending(set, sizeof(*set));
2394 }
2395
2396 #endif
2397
2398 #ifdef __ARCH_WANT_SYS_SIGPROCMASK
2399 /* Some platforms have their own version with special arguments others
2400    support only sys_rt_sigprocmask.  */
2401
2402 asmlinkage long
2403 sys_sigprocmask(int how, old_sigset_t __user *set, old_sigset_t __user *oset)
2404 {
2405         int error;
2406         old_sigset_t old_set, new_set;
2407
2408         if (set) {
2409                 error = -EFAULT;
2410                 if (copy_from_user(&new_set, set, sizeof(*set)))
2411                         goto out;
2412                 new_set &= ~(sigmask(SIGKILL) | sigmask(SIGSTOP));
2413
2414                 spin_lock_irq(&current->sighand->siglock);
2415                 old_set = current->blocked.sig[0];
2416
2417                 error = 0;
2418                 switch (how) {
2419                 default:
2420                         error = -EINVAL;
2421                         break;
2422                 case SIG_BLOCK:
2423                         sigaddsetmask(&current->blocked, new_set);
2424                         break;
2425                 case SIG_UNBLOCK:
2426                         sigdelsetmask(&current->blocked, new_set);
2427                         break;
2428                 case SIG_SETMASK:
2429                         current->blocked.sig[0] = new_set;
2430                         break;
2431                 }
2432
2433                 recalc_sigpending();
2434                 spin_unlock_irq(&current->sighand->siglock);
2435                 if (error)
2436                         goto out;
2437                 if (oset)
2438                         goto set_old;
2439         } else if (oset) {
2440                 old_set = current->blocked.sig[0];
2441         set_old:
2442                 error = -EFAULT;
2443                 if (copy_to_user(oset, &old_set, sizeof(*oset)))
2444                         goto out;
2445         }
2446         error = 0;
2447 out:
2448         return error;
2449 }
2450 #endif /* __ARCH_WANT_SYS_SIGPROCMASK */
2451
2452 #ifdef __ARCH_WANT_SYS_RT_SIGACTION
2453 asmlinkage long
2454 sys_rt_sigaction(int sig,
2455                  const struct sigaction __user *act,
2456                  struct sigaction __user *oact,
2457                  size_t sigsetsize)
2458 {
2459         struct k_sigaction new_sa, old_sa;
2460         int ret = -EINVAL;
2461
2462         /* XXX: Don't preclude handling different sized sigset_t's.  */
2463         if (sigsetsize != sizeof(sigset_t))
2464                 goto out;
2465
2466         if (act) {
2467                 if (copy_from_user(&new_sa.sa, act, sizeof(new_sa.sa)))
2468                         return -EFAULT;
2469         }
2470
2471         ret = do_sigaction(sig, act ? &new_sa : NULL, oact ? &old_sa : NULL);
2472
2473         if (!ret && oact) {
2474                 if (copy_to_user(oact, &old_sa.sa, sizeof(old_sa.sa)))
2475                         return -EFAULT;
2476         }
2477 out:
2478         return ret;
2479 }
2480 #endif /* __ARCH_WANT_SYS_RT_SIGACTION */
2481
2482 #ifdef __ARCH_WANT_SYS_SGETMASK
2483
2484 /*
2485  * For backwards compatibility.  Functionality superseded by sigprocmask.
2486  */
2487 asmlinkage long
2488 sys_sgetmask(void)
2489 {
2490         /* SMP safe */
2491         return current->blocked.sig[0];
2492 }
2493
2494 asmlinkage long
2495 sys_ssetmask(int newmask)
2496 {
2497         int old;
2498
2499         spin_lock_irq(&current->sighand->siglock);
2500         old = current->blocked.sig[0];
2501
2502         siginitset(&current->blocked, newmask & ~(sigmask(SIGKILL)|
2503                                                   sigmask(SIGSTOP)));
2504         recalc_sigpending();
2505         spin_unlock_irq(&current->sighand->siglock);
2506
2507         return old;
2508 }
2509 #endif /* __ARCH_WANT_SGETMASK */
2510
2511 #ifdef __ARCH_WANT_SYS_SIGNAL
2512 /*
2513  * For backwards compatibility.  Functionality superseded by sigaction.
2514  */
2515 asmlinkage unsigned long
2516 sys_signal(int sig, __sighandler_t handler)
2517 {
2518         struct k_sigaction new_sa, old_sa;
2519         int ret;
2520
2521         new_sa.sa.sa_handler = handler;
2522         new_sa.sa.sa_flags = SA_ONESHOT | SA_NOMASK;
2523         sigemptyset(&new_sa.sa.sa_mask);
2524
2525         ret = do_sigaction(sig, &new_sa, &old_sa);
2526
2527         return ret ? ret : (unsigned long)old_sa.sa.sa_handler;
2528 }
2529 #endif /* __ARCH_WANT_SYS_SIGNAL */
2530
2531 #ifdef __ARCH_WANT_SYS_PAUSE
2532
2533 asmlinkage long
2534 sys_pause(void)
2535 {
2536         current->state = TASK_INTERRUPTIBLE;
2537         schedule();
2538         return -ERESTARTNOHAND;
2539 }
2540
2541 #endif
2542
2543 #ifdef __ARCH_WANT_SYS_RT_SIGSUSPEND
2544 asmlinkage long sys_rt_sigsuspend(sigset_t __user *unewset, size_t sigsetsize)
2545 {
2546         sigset_t newset;
2547
2548         /* XXX: Don't preclude handling different sized sigset_t's.  */
2549         if (sigsetsize != sizeof(sigset_t))
2550                 return -EINVAL;
2551
2552         if (copy_from_user(&newset, unewset, sizeof(newset)))
2553                 return -EFAULT;
2554         sigdelsetmask(&newset, sigmask(SIGKILL)|sigmask(SIGSTOP));
2555
2556         spin_lock_irq(&current->sighand->siglock);
2557         current->saved_sigmask = current->blocked;
2558         current->blocked = newset;
2559         recalc_sigpending();
2560         spin_unlock_irq(&current->sighand->siglock);
2561
2562         current->state = TASK_INTERRUPTIBLE;
2563         schedule();
2564         set_thread_flag(TIF_RESTORE_SIGMASK);
2565         return -ERESTARTNOHAND;
2566 }
2567 #endif /* __ARCH_WANT_SYS_RT_SIGSUSPEND */
2568
2569 void __init signals_init(void)
2570 {
2571         sigqueue_cachep =
2572                 kmem_cache_create("sigqueue",
2573                                   sizeof(struct sigqueue),
2574                                   __alignof__(struct sigqueue),
2575                                   SLAB_PANIC, NULL, NULL);
2576 }