module: make module_address_lookup safe
[sfrench/cifs-2.6.git] / kernel / module.c
1 /*
2    Copyright (C) 2002 Richard Henderson
3    Copyright (C) 2001 Rusty Russell, 2002 Rusty Russell IBM.
4
5     This program is free software; you can redistribute it and/or modify
6     it under the terms of the GNU General Public License as published by
7     the Free Software Foundation; either version 2 of the License, or
8     (at your option) any later version.
9
10     This program is distributed in the hope that it will be useful,
11     but WITHOUT ANY WARRANTY; without even the implied warranty of
12     MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
13     GNU General Public License for more details.
14
15     You should have received a copy of the GNU General Public License
16     along with this program; if not, write to the Free Software
17     Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
18 */
19 #include <linux/module.h>
20 #include <linux/moduleloader.h>
21 #include <linux/init.h>
22 #include <linux/kallsyms.h>
23 #include <linux/sysfs.h>
24 #include <linux/kernel.h>
25 #include <linux/slab.h>
26 #include <linux/vmalloc.h>
27 #include <linux/elf.h>
28 #include <linux/seq_file.h>
29 #include <linux/syscalls.h>
30 #include <linux/fcntl.h>
31 #include <linux/rcupdate.h>
32 #include <linux/capability.h>
33 #include <linux/cpu.h>
34 #include <linux/moduleparam.h>
35 #include <linux/errno.h>
36 #include <linux/err.h>
37 #include <linux/vermagic.h>
38 #include <linux/notifier.h>
39 #include <linux/sched.h>
40 #include <linux/stop_machine.h>
41 #include <linux/device.h>
42 #include <linux/string.h>
43 #include <linux/mutex.h>
44 #include <linux/unwind.h>
45 #include <asm/uaccess.h>
46 #include <asm/semaphore.h>
47 #include <asm/cacheflush.h>
48 #include <linux/license.h>
49
50 #if 0
51 #define DEBUGP printk
52 #else
53 #define DEBUGP(fmt , a...)
54 #endif
55
56 #ifndef ARCH_SHF_SMALL
57 #define ARCH_SHF_SMALL 0
58 #endif
59
60 /* If this is set, the section belongs in the init part of the module */
61 #define INIT_OFFSET_MASK (1UL << (BITS_PER_LONG-1))
62
63 /* List of modules, protected by module_mutex or preempt_disable
64  * (add/delete uses stop_machine). */
65 static DEFINE_MUTEX(module_mutex);
66 static LIST_HEAD(modules);
67
68 /* Waiting for a module to finish initializing? */
69 static DECLARE_WAIT_QUEUE_HEAD(module_wq);
70
71 static BLOCKING_NOTIFIER_HEAD(module_notify_list);
72
73 int register_module_notifier(struct notifier_block * nb)
74 {
75         return blocking_notifier_chain_register(&module_notify_list, nb);
76 }
77 EXPORT_SYMBOL(register_module_notifier);
78
79 int unregister_module_notifier(struct notifier_block * nb)
80 {
81         return blocking_notifier_chain_unregister(&module_notify_list, nb);
82 }
83 EXPORT_SYMBOL(unregister_module_notifier);
84
85 /* We require a truly strong try_module_get(): 0 means failure due to
86    ongoing or failed initialization etc. */
87 static inline int strong_try_module_get(struct module *mod)
88 {
89         if (mod && mod->state == MODULE_STATE_COMING)
90                 return -EBUSY;
91         if (try_module_get(mod))
92                 return 0;
93         else
94                 return -ENOENT;
95 }
96
97 static inline void add_taint_module(struct module *mod, unsigned flag)
98 {
99         add_taint(flag);
100         mod->taints |= flag;
101 }
102
103 /*
104  * A thread that wants to hold a reference to a module only while it
105  * is running can call this to safely exit.  nfsd and lockd use this.
106  */
107 void __module_put_and_exit(struct module *mod, long code)
108 {
109         module_put(mod);
110         do_exit(code);
111 }
112 EXPORT_SYMBOL(__module_put_and_exit);
113
114 /* Find a module section: 0 means not found. */
115 static unsigned int find_sec(Elf_Ehdr *hdr,
116                              Elf_Shdr *sechdrs,
117                              const char *secstrings,
118                              const char *name)
119 {
120         unsigned int i;
121
122         for (i = 1; i < hdr->e_shnum; i++)
123                 /* Alloc bit cleared means "ignore it." */
124                 if ((sechdrs[i].sh_flags & SHF_ALLOC)
125                     && strcmp(secstrings+sechdrs[i].sh_name, name) == 0)
126                         return i;
127         return 0;
128 }
129
130 /* Provided by the linker */
131 extern const struct kernel_symbol __start___ksymtab[];
132 extern const struct kernel_symbol __stop___ksymtab[];
133 extern const struct kernel_symbol __start___ksymtab_gpl[];
134 extern const struct kernel_symbol __stop___ksymtab_gpl[];
135 extern const struct kernel_symbol __start___ksymtab_gpl_future[];
136 extern const struct kernel_symbol __stop___ksymtab_gpl_future[];
137 extern const struct kernel_symbol __start___ksymtab_unused[];
138 extern const struct kernel_symbol __stop___ksymtab_unused[];
139 extern const struct kernel_symbol __start___ksymtab_unused_gpl[];
140 extern const struct kernel_symbol __stop___ksymtab_unused_gpl[];
141 extern const struct kernel_symbol __start___ksymtab_gpl_future[];
142 extern const struct kernel_symbol __stop___ksymtab_gpl_future[];
143 extern const unsigned long __start___kcrctab[];
144 extern const unsigned long __start___kcrctab_gpl[];
145 extern const unsigned long __start___kcrctab_gpl_future[];
146 extern const unsigned long __start___kcrctab_unused[];
147 extern const unsigned long __start___kcrctab_unused_gpl[];
148
149 #ifndef CONFIG_MODVERSIONS
150 #define symversion(base, idx) NULL
151 #else
152 #define symversion(base, idx) ((base != NULL) ? ((base) + (idx)) : NULL)
153 #endif
154
155 /* lookup symbol in given range of kernel_symbols */
156 static const struct kernel_symbol *lookup_symbol(const char *name,
157         const struct kernel_symbol *start,
158         const struct kernel_symbol *stop)
159 {
160         const struct kernel_symbol *ks = start;
161         for (; ks < stop; ks++)
162                 if (strcmp(ks->name, name) == 0)
163                         return ks;
164         return NULL;
165 }
166
167 static void printk_unused_warning(const char *name)
168 {
169         printk(KERN_WARNING "Symbol %s is marked as UNUSED, "
170                 "however this module is using it.\n", name);
171         printk(KERN_WARNING "This symbol will go away in the future.\n");
172         printk(KERN_WARNING "Please evalute if this is the right api to use, "
173                 "and if it really is, submit a report the linux kernel "
174                 "mailinglist together with submitting your code for "
175                 "inclusion.\n");
176 }
177
178 /* Find a symbol, return value, crc and module which owns it */
179 static unsigned long __find_symbol(const char *name,
180                                    struct module **owner,
181                                    const unsigned long **crc,
182                                    int gplok)
183 {
184         struct module *mod;
185         const struct kernel_symbol *ks;
186
187         /* Core kernel first. */
188         *owner = NULL;
189         ks = lookup_symbol(name, __start___ksymtab, __stop___ksymtab);
190         if (ks) {
191                 *crc = symversion(__start___kcrctab, (ks - __start___ksymtab));
192                 return ks->value;
193         }
194         if (gplok) {
195                 ks = lookup_symbol(name, __start___ksymtab_gpl,
196                                          __stop___ksymtab_gpl);
197                 if (ks) {
198                         *crc = symversion(__start___kcrctab_gpl,
199                                           (ks - __start___ksymtab_gpl));
200                         return ks->value;
201                 }
202         }
203         ks = lookup_symbol(name, __start___ksymtab_gpl_future,
204                                  __stop___ksymtab_gpl_future);
205         if (ks) {
206                 if (!gplok) {
207                         printk(KERN_WARNING "Symbol %s is being used "
208                                "by a non-GPL module, which will not "
209                                "be allowed in the future\n", name);
210                         printk(KERN_WARNING "Please see the file "
211                                "Documentation/feature-removal-schedule.txt "
212                                "in the kernel source tree for more "
213                                "details.\n");
214                 }
215                 *crc = symversion(__start___kcrctab_gpl_future,
216                                   (ks - __start___ksymtab_gpl_future));
217                 return ks->value;
218         }
219
220         ks = lookup_symbol(name, __start___ksymtab_unused,
221                                  __stop___ksymtab_unused);
222         if (ks) {
223                 printk_unused_warning(name);
224                 *crc = symversion(__start___kcrctab_unused,
225                                   (ks - __start___ksymtab_unused));
226                 return ks->value;
227         }
228
229         if (gplok)
230                 ks = lookup_symbol(name, __start___ksymtab_unused_gpl,
231                                  __stop___ksymtab_unused_gpl);
232         if (ks) {
233                 printk_unused_warning(name);
234                 *crc = symversion(__start___kcrctab_unused_gpl,
235                                   (ks - __start___ksymtab_unused_gpl));
236                 return ks->value;
237         }
238
239         /* Now try modules. */
240         list_for_each_entry(mod, &modules, list) {
241                 *owner = mod;
242                 ks = lookup_symbol(name, mod->syms, mod->syms + mod->num_syms);
243                 if (ks) {
244                         *crc = symversion(mod->crcs, (ks - mod->syms));
245                         return ks->value;
246                 }
247
248                 if (gplok) {
249                         ks = lookup_symbol(name, mod->gpl_syms,
250                                            mod->gpl_syms + mod->num_gpl_syms);
251                         if (ks) {
252                                 *crc = symversion(mod->gpl_crcs,
253                                                   (ks - mod->gpl_syms));
254                                 return ks->value;
255                         }
256                 }
257                 ks = lookup_symbol(name, mod->unused_syms, mod->unused_syms + mod->num_unused_syms);
258                 if (ks) {
259                         printk_unused_warning(name);
260                         *crc = symversion(mod->unused_crcs, (ks - mod->unused_syms));
261                         return ks->value;
262                 }
263
264                 if (gplok) {
265                         ks = lookup_symbol(name, mod->unused_gpl_syms,
266                                            mod->unused_gpl_syms + mod->num_unused_gpl_syms);
267                         if (ks) {
268                                 printk_unused_warning(name);
269                                 *crc = symversion(mod->unused_gpl_crcs,
270                                                   (ks - mod->unused_gpl_syms));
271                                 return ks->value;
272                         }
273                 }
274                 ks = lookup_symbol(name, mod->gpl_future_syms,
275                                    (mod->gpl_future_syms +
276                                     mod->num_gpl_future_syms));
277                 if (ks) {
278                         if (!gplok) {
279                                 printk(KERN_WARNING "Symbol %s is being used "
280                                        "by a non-GPL module, which will not "
281                                        "be allowed in the future\n", name);
282                                 printk(KERN_WARNING "Please see the file "
283                                        "Documentation/feature-removal-schedule.txt "
284                                        "in the kernel source tree for more "
285                                        "details.\n");
286                         }
287                         *crc = symversion(mod->gpl_future_crcs,
288                                           (ks - mod->gpl_future_syms));
289                         return ks->value;
290                 }
291         }
292         DEBUGP("Failed to find symbol %s\n", name);
293         return 0;
294 }
295
296 /* Search for module by name: must hold module_mutex. */
297 static struct module *find_module(const char *name)
298 {
299         struct module *mod;
300
301         list_for_each_entry(mod, &modules, list) {
302                 if (strcmp(mod->name, name) == 0)
303                         return mod;
304         }
305         return NULL;
306 }
307
308 #ifdef CONFIG_SMP
309 /* Number of blocks used and allocated. */
310 static unsigned int pcpu_num_used, pcpu_num_allocated;
311 /* Size of each block.  -ve means used. */
312 static int *pcpu_size;
313
314 static int split_block(unsigned int i, unsigned short size)
315 {
316         /* Reallocation required? */
317         if (pcpu_num_used + 1 > pcpu_num_allocated) {
318                 int *new;
319
320                 new = krealloc(pcpu_size, sizeof(new[0])*pcpu_num_allocated*2,
321                                GFP_KERNEL);
322                 if (!new)
323                         return 0;
324
325                 pcpu_num_allocated *= 2;
326                 pcpu_size = new;
327         }
328
329         /* Insert a new subblock */
330         memmove(&pcpu_size[i+1], &pcpu_size[i],
331                 sizeof(pcpu_size[0]) * (pcpu_num_used - i));
332         pcpu_num_used++;
333
334         pcpu_size[i+1] -= size;
335         pcpu_size[i] = size;
336         return 1;
337 }
338
339 static inline unsigned int block_size(int val)
340 {
341         if (val < 0)
342                 return -val;
343         return val;
344 }
345
346 /* Created by linker magic */
347 extern char __per_cpu_start[], __per_cpu_end[];
348
349 static void *percpu_modalloc(unsigned long size, unsigned long align,
350                              const char *name)
351 {
352         unsigned long extra;
353         unsigned int i;
354         void *ptr;
355
356         if (align > PAGE_SIZE) {
357                 printk(KERN_WARNING "%s: per-cpu alignment %li > %li\n",
358                        name, align, PAGE_SIZE);
359                 align = PAGE_SIZE;
360         }
361
362         ptr = __per_cpu_start;
363         for (i = 0; i < pcpu_num_used; ptr += block_size(pcpu_size[i]), i++) {
364                 /* Extra for alignment requirement. */
365                 extra = ALIGN((unsigned long)ptr, align) - (unsigned long)ptr;
366                 BUG_ON(i == 0 && extra != 0);
367
368                 if (pcpu_size[i] < 0 || pcpu_size[i] < extra + size)
369                         continue;
370
371                 /* Transfer extra to previous block. */
372                 if (pcpu_size[i-1] < 0)
373                         pcpu_size[i-1] -= extra;
374                 else
375                         pcpu_size[i-1] += extra;
376                 pcpu_size[i] -= extra;
377                 ptr += extra;
378
379                 /* Split block if warranted */
380                 if (pcpu_size[i] - size > sizeof(unsigned long))
381                         if (!split_block(i, size))
382                                 return NULL;
383
384                 /* Mark allocated */
385                 pcpu_size[i] = -pcpu_size[i];
386                 return ptr;
387         }
388
389         printk(KERN_WARNING "Could not allocate %lu bytes percpu data\n",
390                size);
391         return NULL;
392 }
393
394 static void percpu_modfree(void *freeme)
395 {
396         unsigned int i;
397         void *ptr = __per_cpu_start + block_size(pcpu_size[0]);
398
399         /* First entry is core kernel percpu data. */
400         for (i = 1; i < pcpu_num_used; ptr += block_size(pcpu_size[i]), i++) {
401                 if (ptr == freeme) {
402                         pcpu_size[i] = -pcpu_size[i];
403                         goto free;
404                 }
405         }
406         BUG();
407
408  free:
409         /* Merge with previous? */
410         if (pcpu_size[i-1] >= 0) {
411                 pcpu_size[i-1] += pcpu_size[i];
412                 pcpu_num_used--;
413                 memmove(&pcpu_size[i], &pcpu_size[i+1],
414                         (pcpu_num_used - i) * sizeof(pcpu_size[0]));
415                 i--;
416         }
417         /* Merge with next? */
418         if (i+1 < pcpu_num_used && pcpu_size[i+1] >= 0) {
419                 pcpu_size[i] += pcpu_size[i+1];
420                 pcpu_num_used--;
421                 memmove(&pcpu_size[i+1], &pcpu_size[i+2],
422                         (pcpu_num_used - (i+1)) * sizeof(pcpu_size[0]));
423         }
424 }
425
426 static unsigned int find_pcpusec(Elf_Ehdr *hdr,
427                                  Elf_Shdr *sechdrs,
428                                  const char *secstrings)
429 {
430         return find_sec(hdr, sechdrs, secstrings, ".data.percpu");
431 }
432
433 static int percpu_modinit(void)
434 {
435         pcpu_num_used = 2;
436         pcpu_num_allocated = 2;
437         pcpu_size = kmalloc(sizeof(pcpu_size[0]) * pcpu_num_allocated,
438                             GFP_KERNEL);
439         /* Static in-kernel percpu data (used). */
440         pcpu_size[0] = -(__per_cpu_end-__per_cpu_start);
441         /* Free room. */
442         pcpu_size[1] = PERCPU_ENOUGH_ROOM + pcpu_size[0];
443         if (pcpu_size[1] < 0) {
444                 printk(KERN_ERR "No per-cpu room for modules.\n");
445                 pcpu_num_used = 1;
446         }
447
448         return 0;
449 }
450 __initcall(percpu_modinit);
451 #else /* ... !CONFIG_SMP */
452 static inline void *percpu_modalloc(unsigned long size, unsigned long align,
453                                     const char *name)
454 {
455         return NULL;
456 }
457 static inline void percpu_modfree(void *pcpuptr)
458 {
459         BUG();
460 }
461 static inline unsigned int find_pcpusec(Elf_Ehdr *hdr,
462                                         Elf_Shdr *sechdrs,
463                                         const char *secstrings)
464 {
465         return 0;
466 }
467 static inline void percpu_modcopy(void *pcpudst, const void *src,
468                                   unsigned long size)
469 {
470         /* pcpusec should be 0, and size of that section should be 0. */
471         BUG_ON(size != 0);
472 }
473 #endif /* CONFIG_SMP */
474
475 #define MODINFO_ATTR(field)     \
476 static void setup_modinfo_##field(struct module *mod, const char *s)  \
477 {                                                                     \
478         mod->field = kstrdup(s, GFP_KERNEL);                          \
479 }                                                                     \
480 static ssize_t show_modinfo_##field(struct module_attribute *mattr,   \
481                         struct module *mod, char *buffer)             \
482 {                                                                     \
483         return sprintf(buffer, "%s\n", mod->field);                   \
484 }                                                                     \
485 static int modinfo_##field##_exists(struct module *mod)               \
486 {                                                                     \
487         return mod->field != NULL;                                    \
488 }                                                                     \
489 static void free_modinfo_##field(struct module *mod)                  \
490 {                                                                     \
491         kfree(mod->field);                                            \
492         mod->field = NULL;                                            \
493 }                                                                     \
494 static struct module_attribute modinfo_##field = {                    \
495         .attr = { .name = __stringify(field), .mode = 0444 },         \
496         .show = show_modinfo_##field,                                 \
497         .setup = setup_modinfo_##field,                               \
498         .test = modinfo_##field##_exists,                             \
499         .free = free_modinfo_##field,                                 \
500 };
501
502 MODINFO_ATTR(version);
503 MODINFO_ATTR(srcversion);
504
505 static char last_unloaded_module[MODULE_NAME_LEN+1];
506
507 #ifdef CONFIG_MODULE_UNLOAD
508 /* Init the unload section of the module. */
509 static void module_unload_init(struct module *mod)
510 {
511         unsigned int i;
512
513         INIT_LIST_HEAD(&mod->modules_which_use_me);
514         for (i = 0; i < NR_CPUS; i++)
515                 local_set(&mod->ref[i].count, 0);
516         /* Hold reference count during initialization. */
517         local_set(&mod->ref[raw_smp_processor_id()].count, 1);
518         /* Backwards compatibility macros put refcount during init. */
519         mod->waiter = current;
520 }
521
522 /* modules using other modules */
523 struct module_use
524 {
525         struct list_head list;
526         struct module *module_which_uses;
527 };
528
529 /* Does a already use b? */
530 static int already_uses(struct module *a, struct module *b)
531 {
532         struct module_use *use;
533
534         list_for_each_entry(use, &b->modules_which_use_me, list) {
535                 if (use->module_which_uses == a) {
536                         DEBUGP("%s uses %s!\n", a->name, b->name);
537                         return 1;
538                 }
539         }
540         DEBUGP("%s does not use %s!\n", a->name, b->name);
541         return 0;
542 }
543
544 /* Module a uses b */
545 static int use_module(struct module *a, struct module *b)
546 {
547         struct module_use *use;
548         int no_warn, err;
549
550         if (b == NULL || already_uses(a, b)) return 1;
551
552         /* If we're interrupted or time out, we fail. */
553         if (wait_event_interruptible_timeout(
554                     module_wq, (err = strong_try_module_get(b)) != -EBUSY,
555                     30 * HZ) <= 0) {
556                 printk("%s: gave up waiting for init of module %s.\n",
557                        a->name, b->name);
558                 return 0;
559         }
560
561         /* If strong_try_module_get() returned a different error, we fail. */
562         if (err)
563                 return 0;
564
565         DEBUGP("Allocating new usage for %s.\n", a->name);
566         use = kmalloc(sizeof(*use), GFP_ATOMIC);
567         if (!use) {
568                 printk("%s: out of memory loading\n", a->name);
569                 module_put(b);
570                 return 0;
571         }
572
573         use->module_which_uses = a;
574         list_add(&use->list, &b->modules_which_use_me);
575         no_warn = sysfs_create_link(b->holders_dir, &a->mkobj.kobj, a->name);
576         return 1;
577 }
578
579 /* Clear the unload stuff of the module. */
580 static void module_unload_free(struct module *mod)
581 {
582         struct module *i;
583
584         list_for_each_entry(i, &modules, list) {
585                 struct module_use *use;
586
587                 list_for_each_entry(use, &i->modules_which_use_me, list) {
588                         if (use->module_which_uses == mod) {
589                                 DEBUGP("%s unusing %s\n", mod->name, i->name);
590                                 module_put(i);
591                                 list_del(&use->list);
592                                 kfree(use);
593                                 sysfs_remove_link(i->holders_dir, mod->name);
594                                 /* There can be at most one match. */
595                                 break;
596                         }
597                 }
598         }
599 }
600
601 #ifdef CONFIG_MODULE_FORCE_UNLOAD
602 static inline int try_force_unload(unsigned int flags)
603 {
604         int ret = (flags & O_TRUNC);
605         if (ret)
606                 add_taint(TAINT_FORCED_RMMOD);
607         return ret;
608 }
609 #else
610 static inline int try_force_unload(unsigned int flags)
611 {
612         return 0;
613 }
614 #endif /* CONFIG_MODULE_FORCE_UNLOAD */
615
616 struct stopref
617 {
618         struct module *mod;
619         int flags;
620         int *forced;
621 };
622
623 /* Whole machine is stopped with interrupts off when this runs. */
624 static int __try_stop_module(void *_sref)
625 {
626         struct stopref *sref = _sref;
627
628         /* If it's not unused, quit unless we are told to block. */
629         if ((sref->flags & O_NONBLOCK) && module_refcount(sref->mod) != 0) {
630                 if (!(*sref->forced = try_force_unload(sref->flags)))
631                         return -EWOULDBLOCK;
632         }
633
634         /* Mark it as dying. */
635         sref->mod->state = MODULE_STATE_GOING;
636         return 0;
637 }
638
639 static int try_stop_module(struct module *mod, int flags, int *forced)
640 {
641         struct stopref sref = { mod, flags, forced };
642
643         return stop_machine_run(__try_stop_module, &sref, NR_CPUS);
644 }
645
646 unsigned int module_refcount(struct module *mod)
647 {
648         unsigned int i, total = 0;
649
650         for (i = 0; i < NR_CPUS; i++)
651                 total += local_read(&mod->ref[i].count);
652         return total;
653 }
654 EXPORT_SYMBOL(module_refcount);
655
656 /* This exists whether we can unload or not */
657 static void free_module(struct module *mod);
658
659 static void wait_for_zero_refcount(struct module *mod)
660 {
661         /* Since we might sleep for some time, drop the semaphore first */
662         mutex_unlock(&module_mutex);
663         for (;;) {
664                 DEBUGP("Looking at refcount...\n");
665                 set_current_state(TASK_UNINTERRUPTIBLE);
666                 if (module_refcount(mod) == 0)
667                         break;
668                 schedule();
669         }
670         current->state = TASK_RUNNING;
671         mutex_lock(&module_mutex);
672 }
673
674 asmlinkage long
675 sys_delete_module(const char __user *name_user, unsigned int flags)
676 {
677         struct module *mod;
678         char name[MODULE_NAME_LEN];
679         int ret, forced = 0;
680
681         if (!capable(CAP_SYS_MODULE))
682                 return -EPERM;
683
684         if (strncpy_from_user(name, name_user, MODULE_NAME_LEN-1) < 0)
685                 return -EFAULT;
686         name[MODULE_NAME_LEN-1] = '\0';
687
688         if (mutex_lock_interruptible(&module_mutex) != 0)
689                 return -EINTR;
690
691         mod = find_module(name);
692         if (!mod) {
693                 ret = -ENOENT;
694                 goto out;
695         }
696
697         if (!list_empty(&mod->modules_which_use_me)) {
698                 /* Other modules depend on us: get rid of them first. */
699                 ret = -EWOULDBLOCK;
700                 goto out;
701         }
702
703         /* Doing init or already dying? */
704         if (mod->state != MODULE_STATE_LIVE) {
705                 /* FIXME: if (force), slam module count and wake up
706                    waiter --RR */
707                 DEBUGP("%s already dying\n", mod->name);
708                 ret = -EBUSY;
709                 goto out;
710         }
711
712         /* If it has an init func, it must have an exit func to unload */
713         if (mod->init && !mod->exit) {
714                 forced = try_force_unload(flags);
715                 if (!forced) {
716                         /* This module can't be removed */
717                         ret = -EBUSY;
718                         goto out;
719                 }
720         }
721
722         /* Set this up before setting mod->state */
723         mod->waiter = current;
724
725         /* Stop the machine so refcounts can't move and disable module. */
726         ret = try_stop_module(mod, flags, &forced);
727         if (ret != 0)
728                 goto out;
729
730         /* Never wait if forced. */
731         if (!forced && module_refcount(mod) != 0)
732                 wait_for_zero_refcount(mod);
733
734         /* Final destruction now noone is using it. */
735         if (mod->exit != NULL) {
736                 mutex_unlock(&module_mutex);
737                 mod->exit();
738                 mutex_lock(&module_mutex);
739         }
740         /* Store the name of the last unloaded module for diagnostic purposes */
741         strlcpy(last_unloaded_module, mod->name, sizeof(last_unloaded_module));
742         free_module(mod);
743
744  out:
745         mutex_unlock(&module_mutex);
746         return ret;
747 }
748
749 static void print_unload_info(struct seq_file *m, struct module *mod)
750 {
751         struct module_use *use;
752         int printed_something = 0;
753
754         seq_printf(m, " %u ", module_refcount(mod));
755
756         /* Always include a trailing , so userspace can differentiate
757            between this and the old multi-field proc format. */
758         list_for_each_entry(use, &mod->modules_which_use_me, list) {
759                 printed_something = 1;
760                 seq_printf(m, "%s,", use->module_which_uses->name);
761         }
762
763         if (mod->init != NULL && mod->exit == NULL) {
764                 printed_something = 1;
765                 seq_printf(m, "[permanent],");
766         }
767
768         if (!printed_something)
769                 seq_printf(m, "-");
770 }
771
772 void __symbol_put(const char *symbol)
773 {
774         struct module *owner;
775         const unsigned long *crc;
776
777         preempt_disable();
778         if (!__find_symbol(symbol, &owner, &crc, 1))
779                 BUG();
780         module_put(owner);
781         preempt_enable();
782 }
783 EXPORT_SYMBOL(__symbol_put);
784
785 void symbol_put_addr(void *addr)
786 {
787         struct module *modaddr;
788
789         if (core_kernel_text((unsigned long)addr))
790                 return;
791
792         if (!(modaddr = module_text_address((unsigned long)addr)))
793                 BUG();
794         module_put(modaddr);
795 }
796 EXPORT_SYMBOL_GPL(symbol_put_addr);
797
798 static ssize_t show_refcnt(struct module_attribute *mattr,
799                            struct module *mod, char *buffer)
800 {
801         return sprintf(buffer, "%u\n", module_refcount(mod));
802 }
803
804 static struct module_attribute refcnt = {
805         .attr = { .name = "refcnt", .mode = 0444 },
806         .show = show_refcnt,
807 };
808
809 void module_put(struct module *module)
810 {
811         if (module) {
812                 unsigned int cpu = get_cpu();
813                 local_dec(&module->ref[cpu].count);
814                 /* Maybe they're waiting for us to drop reference? */
815                 if (unlikely(!module_is_live(module)))
816                         wake_up_process(module->waiter);
817                 put_cpu();
818         }
819 }
820 EXPORT_SYMBOL(module_put);
821
822 #else /* !CONFIG_MODULE_UNLOAD */
823 static void print_unload_info(struct seq_file *m, struct module *mod)
824 {
825         /* We don't know the usage count, or what modules are using. */
826         seq_printf(m, " - -");
827 }
828
829 static inline void module_unload_free(struct module *mod)
830 {
831 }
832
833 static inline int use_module(struct module *a, struct module *b)
834 {
835         return strong_try_module_get(b) == 0;
836 }
837
838 static inline void module_unload_init(struct module *mod)
839 {
840 }
841 #endif /* CONFIG_MODULE_UNLOAD */
842
843 static ssize_t show_initstate(struct module_attribute *mattr,
844                            struct module *mod, char *buffer)
845 {
846         const char *state = "unknown";
847
848         switch (mod->state) {
849         case MODULE_STATE_LIVE:
850                 state = "live";
851                 break;
852         case MODULE_STATE_COMING:
853                 state = "coming";
854                 break;
855         case MODULE_STATE_GOING:
856                 state = "going";
857                 break;
858         }
859         return sprintf(buffer, "%s\n", state);
860 }
861
862 static struct module_attribute initstate = {
863         .attr = { .name = "initstate", .mode = 0444 },
864         .show = show_initstate,
865 };
866
867 static struct module_attribute *modinfo_attrs[] = {
868         &modinfo_version,
869         &modinfo_srcversion,
870         &initstate,
871 #ifdef CONFIG_MODULE_UNLOAD
872         &refcnt,
873 #endif
874         NULL,
875 };
876
877 static const char vermagic[] = VERMAGIC_STRING;
878
879 #ifdef CONFIG_MODVERSIONS
880 static int check_version(Elf_Shdr *sechdrs,
881                          unsigned int versindex,
882                          const char *symname,
883                          struct module *mod, 
884                          const unsigned long *crc)
885 {
886         unsigned int i, num_versions;
887         struct modversion_info *versions;
888
889         /* Exporting module didn't supply crcs?  OK, we're already tainted. */
890         if (!crc)
891                 return 1;
892
893         versions = (void *) sechdrs[versindex].sh_addr;
894         num_versions = sechdrs[versindex].sh_size
895                 / sizeof(struct modversion_info);
896
897         for (i = 0; i < num_versions; i++) {
898                 if (strcmp(versions[i].name, symname) != 0)
899                         continue;
900
901                 if (versions[i].crc == *crc)
902                         return 1;
903                 printk("%s: disagrees about version of symbol %s\n",
904                        mod->name, symname);
905                 DEBUGP("Found checksum %lX vs module %lX\n",
906                        *crc, versions[i].crc);
907                 return 0;
908         }
909         /* Not in module's version table.  OK, but that taints the kernel. */
910         if (!(tainted & TAINT_FORCED_MODULE))
911                 printk("%s: no version for \"%s\" found: kernel tainted.\n",
912                        mod->name, symname);
913         add_taint_module(mod, TAINT_FORCED_MODULE);
914         return 1;
915 }
916
917 static inline int check_modstruct_version(Elf_Shdr *sechdrs,
918                                           unsigned int versindex,
919                                           struct module *mod)
920 {
921         const unsigned long *crc;
922         struct module *owner;
923
924         if (!__find_symbol("struct_module", &owner, &crc, 1))
925                 BUG();
926         return check_version(sechdrs, versindex, "struct_module", mod,
927                              crc);
928 }
929
930 /* First part is kernel version, which we ignore. */
931 static inline int same_magic(const char *amagic, const char *bmagic)
932 {
933         amagic += strcspn(amagic, " ");
934         bmagic += strcspn(bmagic, " ");
935         return strcmp(amagic, bmagic) == 0;
936 }
937 #else
938 static inline int check_version(Elf_Shdr *sechdrs,
939                                 unsigned int versindex,
940                                 const char *symname,
941                                 struct module *mod, 
942                                 const unsigned long *crc)
943 {
944         return 1;
945 }
946
947 static inline int check_modstruct_version(Elf_Shdr *sechdrs,
948                                           unsigned int versindex,
949                                           struct module *mod)
950 {
951         return 1;
952 }
953
954 static inline int same_magic(const char *amagic, const char *bmagic)
955 {
956         return strcmp(amagic, bmagic) == 0;
957 }
958 #endif /* CONFIG_MODVERSIONS */
959
960 /* Resolve a symbol for this module.  I.e. if we find one, record usage.
961    Must be holding module_mutex. */
962 static unsigned long resolve_symbol(Elf_Shdr *sechdrs,
963                                     unsigned int versindex,
964                                     const char *name,
965                                     struct module *mod)
966 {
967         struct module *owner;
968         unsigned long ret;
969         const unsigned long *crc;
970
971         ret = __find_symbol(name, &owner, &crc,
972                         !(mod->taints & TAINT_PROPRIETARY_MODULE));
973         if (ret) {
974                 /* use_module can fail due to OOM,
975                    or module initialization or unloading */
976                 if (!check_version(sechdrs, versindex, name, mod, crc) ||
977                     !use_module(mod, owner))
978                         ret = 0;
979         }
980         return ret;
981 }
982
983
984 /*
985  * /sys/module/foo/sections stuff
986  * J. Corbet <corbet@lwn.net>
987  */
988 #ifdef CONFIG_KALLSYMS
989 static ssize_t module_sect_show(struct module_attribute *mattr,
990                                 struct module *mod, char *buf)
991 {
992         struct module_sect_attr *sattr =
993                 container_of(mattr, struct module_sect_attr, mattr);
994         return sprintf(buf, "0x%lx\n", sattr->address);
995 }
996
997 static void free_sect_attrs(struct module_sect_attrs *sect_attrs)
998 {
999         int section;
1000
1001         for (section = 0; section < sect_attrs->nsections; section++)
1002                 kfree(sect_attrs->attrs[section].name);
1003         kfree(sect_attrs);
1004 }
1005
1006 static void add_sect_attrs(struct module *mod, unsigned int nsect,
1007                 char *secstrings, Elf_Shdr *sechdrs)
1008 {
1009         unsigned int nloaded = 0, i, size[2];
1010         struct module_sect_attrs *sect_attrs;
1011         struct module_sect_attr *sattr;
1012         struct attribute **gattr;
1013
1014         /* Count loaded sections and allocate structures */
1015         for (i = 0; i < nsect; i++)
1016                 if (sechdrs[i].sh_flags & SHF_ALLOC)
1017                         nloaded++;
1018         size[0] = ALIGN(sizeof(*sect_attrs)
1019                         + nloaded * sizeof(sect_attrs->attrs[0]),
1020                         sizeof(sect_attrs->grp.attrs[0]));
1021         size[1] = (nloaded + 1) * sizeof(sect_attrs->grp.attrs[0]);
1022         sect_attrs = kzalloc(size[0] + size[1], GFP_KERNEL);
1023         if (sect_attrs == NULL)
1024                 return;
1025
1026         /* Setup section attributes. */
1027         sect_attrs->grp.name = "sections";
1028         sect_attrs->grp.attrs = (void *)sect_attrs + size[0];
1029
1030         sect_attrs->nsections = 0;
1031         sattr = &sect_attrs->attrs[0];
1032         gattr = &sect_attrs->grp.attrs[0];
1033         for (i = 0; i < nsect; i++) {
1034                 if (! (sechdrs[i].sh_flags & SHF_ALLOC))
1035                         continue;
1036                 sattr->address = sechdrs[i].sh_addr;
1037                 sattr->name = kstrdup(secstrings + sechdrs[i].sh_name,
1038                                         GFP_KERNEL);
1039                 if (sattr->name == NULL)
1040                         goto out;
1041                 sect_attrs->nsections++;
1042                 sattr->mattr.show = module_sect_show;
1043                 sattr->mattr.store = NULL;
1044                 sattr->mattr.attr.name = sattr->name;
1045                 sattr->mattr.attr.mode = S_IRUGO;
1046                 *(gattr++) = &(sattr++)->mattr.attr;
1047         }
1048         *gattr = NULL;
1049
1050         if (sysfs_create_group(&mod->mkobj.kobj, &sect_attrs->grp))
1051                 goto out;
1052
1053         mod->sect_attrs = sect_attrs;
1054         return;
1055   out:
1056         free_sect_attrs(sect_attrs);
1057 }
1058
1059 static void remove_sect_attrs(struct module *mod)
1060 {
1061         if (mod->sect_attrs) {
1062                 sysfs_remove_group(&mod->mkobj.kobj,
1063                                    &mod->sect_attrs->grp);
1064                 /* We are positive that no one is using any sect attrs
1065                  * at this point.  Deallocate immediately. */
1066                 free_sect_attrs(mod->sect_attrs);
1067                 mod->sect_attrs = NULL;
1068         }
1069 }
1070
1071 /*
1072  * /sys/module/foo/notes/.section.name gives contents of SHT_NOTE sections.
1073  */
1074
1075 struct module_notes_attrs {
1076         struct kobject *dir;
1077         unsigned int notes;
1078         struct bin_attribute attrs[0];
1079 };
1080
1081 static ssize_t module_notes_read(struct kobject *kobj,
1082                                  struct bin_attribute *bin_attr,
1083                                  char *buf, loff_t pos, size_t count)
1084 {
1085         /*
1086          * The caller checked the pos and count against our size.
1087          */
1088         memcpy(buf, bin_attr->private + pos, count);
1089         return count;
1090 }
1091
1092 static void free_notes_attrs(struct module_notes_attrs *notes_attrs,
1093                              unsigned int i)
1094 {
1095         if (notes_attrs->dir) {
1096                 while (i-- > 0)
1097                         sysfs_remove_bin_file(notes_attrs->dir,
1098                                               &notes_attrs->attrs[i]);
1099                 kobject_del(notes_attrs->dir);
1100         }
1101         kfree(notes_attrs);
1102 }
1103
1104 static void add_notes_attrs(struct module *mod, unsigned int nsect,
1105                             char *secstrings, Elf_Shdr *sechdrs)
1106 {
1107         unsigned int notes, loaded, i;
1108         struct module_notes_attrs *notes_attrs;
1109         struct bin_attribute *nattr;
1110
1111         /* Count notes sections and allocate structures.  */
1112         notes = 0;
1113         for (i = 0; i < nsect; i++)
1114                 if ((sechdrs[i].sh_flags & SHF_ALLOC) &&
1115                     (sechdrs[i].sh_type == SHT_NOTE))
1116                         ++notes;
1117
1118         if (notes == 0)
1119                 return;
1120
1121         notes_attrs = kzalloc(sizeof(*notes_attrs)
1122                               + notes * sizeof(notes_attrs->attrs[0]),
1123                               GFP_KERNEL);
1124         if (notes_attrs == NULL)
1125                 return;
1126
1127         notes_attrs->notes = notes;
1128         nattr = &notes_attrs->attrs[0];
1129         for (loaded = i = 0; i < nsect; ++i) {
1130                 if (!(sechdrs[i].sh_flags & SHF_ALLOC))
1131                         continue;
1132                 if (sechdrs[i].sh_type == SHT_NOTE) {
1133                         nattr->attr.name = mod->sect_attrs->attrs[loaded].name;
1134                         nattr->attr.mode = S_IRUGO;
1135                         nattr->size = sechdrs[i].sh_size;
1136                         nattr->private = (void *) sechdrs[i].sh_addr;
1137                         nattr->read = module_notes_read;
1138                         ++nattr;
1139                 }
1140                 ++loaded;
1141         }
1142
1143         notes_attrs->dir = kobject_create_and_add("notes", &mod->mkobj.kobj);
1144         if (!notes_attrs->dir)
1145                 goto out;
1146
1147         for (i = 0; i < notes; ++i)
1148                 if (sysfs_create_bin_file(notes_attrs->dir,
1149                                           &notes_attrs->attrs[i]))
1150                         goto out;
1151
1152         mod->notes_attrs = notes_attrs;
1153         return;
1154
1155   out:
1156         free_notes_attrs(notes_attrs, i);
1157 }
1158
1159 static void remove_notes_attrs(struct module *mod)
1160 {
1161         if (mod->notes_attrs)
1162                 free_notes_attrs(mod->notes_attrs, mod->notes_attrs->notes);
1163 }
1164
1165 #else
1166
1167 static inline void add_sect_attrs(struct module *mod, unsigned int nsect,
1168                 char *sectstrings, Elf_Shdr *sechdrs)
1169 {
1170 }
1171
1172 static inline void remove_sect_attrs(struct module *mod)
1173 {
1174 }
1175
1176 static inline void add_notes_attrs(struct module *mod, unsigned int nsect,
1177                                    char *sectstrings, Elf_Shdr *sechdrs)
1178 {
1179 }
1180
1181 static inline void remove_notes_attrs(struct module *mod)
1182 {
1183 }
1184 #endif /* CONFIG_KALLSYMS */
1185
1186 #ifdef CONFIG_SYSFS
1187 int module_add_modinfo_attrs(struct module *mod)
1188 {
1189         struct module_attribute *attr;
1190         struct module_attribute *temp_attr;
1191         int error = 0;
1192         int i;
1193
1194         mod->modinfo_attrs = kzalloc((sizeof(struct module_attribute) *
1195                                         (ARRAY_SIZE(modinfo_attrs) + 1)),
1196                                         GFP_KERNEL);
1197         if (!mod->modinfo_attrs)
1198                 return -ENOMEM;
1199
1200         temp_attr = mod->modinfo_attrs;
1201         for (i = 0; (attr = modinfo_attrs[i]) && !error; i++) {
1202                 if (!attr->test ||
1203                     (attr->test && attr->test(mod))) {
1204                         memcpy(temp_attr, attr, sizeof(*temp_attr));
1205                         error = sysfs_create_file(&mod->mkobj.kobj,&temp_attr->attr);
1206                         ++temp_attr;
1207                 }
1208         }
1209         return error;
1210 }
1211
1212 void module_remove_modinfo_attrs(struct module *mod)
1213 {
1214         struct module_attribute *attr;
1215         int i;
1216
1217         for (i = 0; (attr = &mod->modinfo_attrs[i]); i++) {
1218                 /* pick a field to test for end of list */
1219                 if (!attr->attr.name)
1220                         break;
1221                 sysfs_remove_file(&mod->mkobj.kobj,&attr->attr);
1222                 if (attr->free)
1223                         attr->free(mod);
1224         }
1225         kfree(mod->modinfo_attrs);
1226 }
1227 #endif
1228
1229 #ifdef CONFIG_SYSFS
1230 int mod_sysfs_init(struct module *mod)
1231 {
1232         int err;
1233
1234         if (!module_sysfs_initialized) {
1235                 printk(KERN_ERR "%s: module sysfs not initialized\n",
1236                        mod->name);
1237                 err = -EINVAL;
1238                 goto out;
1239         }
1240         mod->mkobj.mod = mod;
1241
1242         memset(&mod->mkobj.kobj, 0, sizeof(mod->mkobj.kobj));
1243         mod->mkobj.kobj.kset = module_kset;
1244         err = kobject_init_and_add(&mod->mkobj.kobj, &module_ktype, NULL,
1245                                    "%s", mod->name);
1246         if (err)
1247                 kobject_put(&mod->mkobj.kobj);
1248
1249         /* delay uevent until full sysfs population */
1250 out:
1251         return err;
1252 }
1253
1254 int mod_sysfs_setup(struct module *mod,
1255                            struct kernel_param *kparam,
1256                            unsigned int num_params)
1257 {
1258         int err;
1259
1260         mod->holders_dir = kobject_create_and_add("holders", &mod->mkobj.kobj);
1261         if (!mod->holders_dir) {
1262                 err = -ENOMEM;
1263                 goto out_unreg;
1264         }
1265
1266         err = module_param_sysfs_setup(mod, kparam, num_params);
1267         if (err)
1268                 goto out_unreg_holders;
1269
1270         err = module_add_modinfo_attrs(mod);
1271         if (err)
1272                 goto out_unreg_param;
1273
1274         kobject_uevent(&mod->mkobj.kobj, KOBJ_ADD);
1275         return 0;
1276
1277 out_unreg_param:
1278         module_param_sysfs_remove(mod);
1279 out_unreg_holders:
1280         kobject_put(mod->holders_dir);
1281 out_unreg:
1282         kobject_put(&mod->mkobj.kobj);
1283         return err;
1284 }
1285 #endif
1286
1287 static void mod_kobject_remove(struct module *mod)
1288 {
1289         module_remove_modinfo_attrs(mod);
1290         module_param_sysfs_remove(mod);
1291         kobject_put(mod->mkobj.drivers_dir);
1292         kobject_put(mod->holders_dir);
1293         kobject_put(&mod->mkobj.kobj);
1294 }
1295
1296 /*
1297  * link the module with the whole machine is stopped with interrupts off
1298  * - this defends against kallsyms not taking locks
1299  */
1300 static int __link_module(void *_mod)
1301 {
1302         struct module *mod = _mod;
1303         list_add(&mod->list, &modules);
1304         return 0;
1305 }
1306
1307 /*
1308  * unlink the module with the whole machine is stopped with interrupts off
1309  * - this defends against kallsyms not taking locks
1310  */
1311 static int __unlink_module(void *_mod)
1312 {
1313         struct module *mod = _mod;
1314         list_del(&mod->list);
1315         return 0;
1316 }
1317
1318 /* Free a module, remove from lists, etc (must hold module_mutex). */
1319 static void free_module(struct module *mod)
1320 {
1321         /* Delete from various lists */
1322         stop_machine_run(__unlink_module, mod, NR_CPUS);
1323         remove_notes_attrs(mod);
1324         remove_sect_attrs(mod);
1325         mod_kobject_remove(mod);
1326
1327         unwind_remove_table(mod->unwind_info, 0);
1328
1329         /* Arch-specific cleanup. */
1330         module_arch_cleanup(mod);
1331
1332         /* Module unload stuff */
1333         module_unload_free(mod);
1334
1335         /* This may be NULL, but that's OK */
1336         module_free(mod, mod->module_init);
1337         kfree(mod->args);
1338         if (mod->percpu)
1339                 percpu_modfree(mod->percpu);
1340
1341         /* Free lock-classes: */
1342         lockdep_free_key_range(mod->module_core, mod->core_size);
1343
1344         /* Finally, free the core (containing the module structure) */
1345         module_free(mod, mod->module_core);
1346 }
1347
1348 void *__symbol_get(const char *symbol)
1349 {
1350         struct module *owner;
1351         unsigned long value;
1352         const unsigned long *crc;
1353
1354         preempt_disable();
1355         value = __find_symbol(symbol, &owner, &crc, 1);
1356         if (value && strong_try_module_get(owner) != 0)
1357                 value = 0;
1358         preempt_enable();
1359
1360         return (void *)value;
1361 }
1362 EXPORT_SYMBOL_GPL(__symbol_get);
1363
1364 /*
1365  * Ensure that an exported symbol [global namespace] does not already exist
1366  * in the kernel or in some other module's exported symbol table.
1367  */
1368 static int verify_export_symbols(struct module *mod)
1369 {
1370         const char *name = NULL;
1371         unsigned long i, ret = 0;
1372         struct module *owner;
1373         const unsigned long *crc;
1374
1375         for (i = 0; i < mod->num_syms; i++)
1376                 if (__find_symbol(mod->syms[i].name, &owner, &crc, 1)) {
1377                         name = mod->syms[i].name;
1378                         ret = -ENOEXEC;
1379                         goto dup;
1380                 }
1381
1382         for (i = 0; i < mod->num_gpl_syms; i++)
1383                 if (__find_symbol(mod->gpl_syms[i].name, &owner, &crc, 1)) {
1384                         name = mod->gpl_syms[i].name;
1385                         ret = -ENOEXEC;
1386                         goto dup;
1387                 }
1388
1389 dup:
1390         if (ret)
1391                 printk(KERN_ERR "%s: exports duplicate symbol %s (owned by %s)\n",
1392                         mod->name, name, module_name(owner));
1393
1394         return ret;
1395 }
1396
1397 /* Change all symbols so that st_value encodes the pointer directly. */
1398 static int simplify_symbols(Elf_Shdr *sechdrs,
1399                             unsigned int symindex,
1400                             const char *strtab,
1401                             unsigned int versindex,
1402                             unsigned int pcpuindex,
1403                             struct module *mod)
1404 {
1405         Elf_Sym *sym = (void *)sechdrs[symindex].sh_addr;
1406         unsigned long secbase;
1407         unsigned int i, n = sechdrs[symindex].sh_size / sizeof(Elf_Sym);
1408         int ret = 0;
1409
1410         for (i = 1; i < n; i++) {
1411                 switch (sym[i].st_shndx) {
1412                 case SHN_COMMON:
1413                         /* We compiled with -fno-common.  These are not
1414                            supposed to happen.  */
1415                         DEBUGP("Common symbol: %s\n", strtab + sym[i].st_name);
1416                         printk("%s: please compile with -fno-common\n",
1417                                mod->name);
1418                         ret = -ENOEXEC;
1419                         break;
1420
1421                 case SHN_ABS:
1422                         /* Don't need to do anything */
1423                         DEBUGP("Absolute symbol: 0x%08lx\n",
1424                                (long)sym[i].st_value);
1425                         break;
1426
1427                 case SHN_UNDEF:
1428                         sym[i].st_value
1429                           = resolve_symbol(sechdrs, versindex,
1430                                            strtab + sym[i].st_name, mod);
1431
1432                         /* Ok if resolved.  */
1433                         if (sym[i].st_value != 0)
1434                                 break;
1435                         /* Ok if weak.  */
1436                         if (ELF_ST_BIND(sym[i].st_info) == STB_WEAK)
1437                                 break;
1438
1439                         printk(KERN_WARNING "%s: Unknown symbol %s\n",
1440                                mod->name, strtab + sym[i].st_name);
1441                         ret = -ENOENT;
1442                         break;
1443
1444                 default:
1445                         /* Divert to percpu allocation if a percpu var. */
1446                         if (sym[i].st_shndx == pcpuindex)
1447                                 secbase = (unsigned long)mod->percpu;
1448                         else
1449                                 secbase = sechdrs[sym[i].st_shndx].sh_addr;
1450                         sym[i].st_value += secbase;
1451                         break;
1452                 }
1453         }
1454
1455         return ret;
1456 }
1457
1458 /* Update size with this section: return offset. */
1459 static long get_offset(unsigned long *size, Elf_Shdr *sechdr)
1460 {
1461         long ret;
1462
1463         ret = ALIGN(*size, sechdr->sh_addralign ?: 1);
1464         *size = ret + sechdr->sh_size;
1465         return ret;
1466 }
1467
1468 /* Lay out the SHF_ALLOC sections in a way not dissimilar to how ld
1469    might -- code, read-only data, read-write data, small data.  Tally
1470    sizes, and place the offsets into sh_entsize fields: high bit means it
1471    belongs in init. */
1472 static void layout_sections(struct module *mod,
1473                             const Elf_Ehdr *hdr,
1474                             Elf_Shdr *sechdrs,
1475                             const char *secstrings)
1476 {
1477         static unsigned long const masks[][2] = {
1478                 /* NOTE: all executable code must be the first section
1479                  * in this array; otherwise modify the text_size
1480                  * finder in the two loops below */
1481                 { SHF_EXECINSTR | SHF_ALLOC, ARCH_SHF_SMALL },
1482                 { SHF_ALLOC, SHF_WRITE | ARCH_SHF_SMALL },
1483                 { SHF_WRITE | SHF_ALLOC, ARCH_SHF_SMALL },
1484                 { ARCH_SHF_SMALL | SHF_ALLOC, 0 }
1485         };
1486         unsigned int m, i;
1487
1488         for (i = 0; i < hdr->e_shnum; i++)
1489                 sechdrs[i].sh_entsize = ~0UL;
1490
1491         DEBUGP("Core section allocation order:\n");
1492         for (m = 0; m < ARRAY_SIZE(masks); ++m) {
1493                 for (i = 0; i < hdr->e_shnum; ++i) {
1494                         Elf_Shdr *s = &sechdrs[i];
1495
1496                         if ((s->sh_flags & masks[m][0]) != masks[m][0]
1497                             || (s->sh_flags & masks[m][1])
1498                             || s->sh_entsize != ~0UL
1499                             || strncmp(secstrings + s->sh_name,
1500                                        ".init", 5) == 0)
1501                                 continue;
1502                         s->sh_entsize = get_offset(&mod->core_size, s);
1503                         DEBUGP("\t%s\n", secstrings + s->sh_name);
1504                 }
1505                 if (m == 0)
1506                         mod->core_text_size = mod->core_size;
1507         }
1508
1509         DEBUGP("Init section allocation order:\n");
1510         for (m = 0; m < ARRAY_SIZE(masks); ++m) {
1511                 for (i = 0; i < hdr->e_shnum; ++i) {
1512                         Elf_Shdr *s = &sechdrs[i];
1513
1514                         if ((s->sh_flags & masks[m][0]) != masks[m][0]
1515                             || (s->sh_flags & masks[m][1])
1516                             || s->sh_entsize != ~0UL
1517                             || strncmp(secstrings + s->sh_name,
1518                                        ".init", 5) != 0)
1519                                 continue;
1520                         s->sh_entsize = (get_offset(&mod->init_size, s)
1521                                          | INIT_OFFSET_MASK);
1522                         DEBUGP("\t%s\n", secstrings + s->sh_name);
1523                 }
1524                 if (m == 0)
1525                         mod->init_text_size = mod->init_size;
1526         }
1527 }
1528
1529 static void set_license(struct module *mod, const char *license)
1530 {
1531         if (!license)
1532                 license = "unspecified";
1533
1534         if (!license_is_gpl_compatible(license)) {
1535                 if (!(tainted & TAINT_PROPRIETARY_MODULE))
1536                         printk(KERN_WARNING "%s: module license '%s' taints "
1537                                 "kernel.\n", mod->name, license);
1538                 add_taint_module(mod, TAINT_PROPRIETARY_MODULE);
1539         }
1540 }
1541
1542 /* Parse tag=value strings from .modinfo section */
1543 static char *next_string(char *string, unsigned long *secsize)
1544 {
1545         /* Skip non-zero chars */
1546         while (string[0]) {
1547                 string++;
1548                 if ((*secsize)-- <= 1)
1549                         return NULL;
1550         }
1551
1552         /* Skip any zero padding. */
1553         while (!string[0]) {
1554                 string++;
1555                 if ((*secsize)-- <= 1)
1556                         return NULL;
1557         }
1558         return string;
1559 }
1560
1561 static char *get_modinfo(Elf_Shdr *sechdrs,
1562                          unsigned int info,
1563                          const char *tag)
1564 {
1565         char *p;
1566         unsigned int taglen = strlen(tag);
1567         unsigned long size = sechdrs[info].sh_size;
1568
1569         for (p = (char *)sechdrs[info].sh_addr; p; p = next_string(p, &size)) {
1570                 if (strncmp(p, tag, taglen) == 0 && p[taglen] == '=')
1571                         return p + taglen + 1;
1572         }
1573         return NULL;
1574 }
1575
1576 static void setup_modinfo(struct module *mod, Elf_Shdr *sechdrs,
1577                           unsigned int infoindex)
1578 {
1579         struct module_attribute *attr;
1580         int i;
1581
1582         for (i = 0; (attr = modinfo_attrs[i]); i++) {
1583                 if (attr->setup)
1584                         attr->setup(mod,
1585                                     get_modinfo(sechdrs,
1586                                                 infoindex,
1587                                                 attr->attr.name));
1588         }
1589 }
1590
1591 #ifdef CONFIG_KALLSYMS
1592 static int is_exported(const char *name, const struct module *mod)
1593 {
1594         if (!mod && lookup_symbol(name, __start___ksymtab, __stop___ksymtab))
1595                 return 1;
1596         else
1597                 if (mod && lookup_symbol(name, mod->syms, mod->syms + mod->num_syms))
1598                         return 1;
1599                 else
1600                         return 0;
1601 }
1602
1603 /* As per nm */
1604 static char elf_type(const Elf_Sym *sym,
1605                      Elf_Shdr *sechdrs,
1606                      const char *secstrings,
1607                      struct module *mod)
1608 {
1609         if (ELF_ST_BIND(sym->st_info) == STB_WEAK) {
1610                 if (ELF_ST_TYPE(sym->st_info) == STT_OBJECT)
1611                         return 'v';
1612                 else
1613                         return 'w';
1614         }
1615         if (sym->st_shndx == SHN_UNDEF)
1616                 return 'U';
1617         if (sym->st_shndx == SHN_ABS)
1618                 return 'a';
1619         if (sym->st_shndx >= SHN_LORESERVE)
1620                 return '?';
1621         if (sechdrs[sym->st_shndx].sh_flags & SHF_EXECINSTR)
1622                 return 't';
1623         if (sechdrs[sym->st_shndx].sh_flags & SHF_ALLOC
1624             && sechdrs[sym->st_shndx].sh_type != SHT_NOBITS) {
1625                 if (!(sechdrs[sym->st_shndx].sh_flags & SHF_WRITE))
1626                         return 'r';
1627                 else if (sechdrs[sym->st_shndx].sh_flags & ARCH_SHF_SMALL)
1628                         return 'g';
1629                 else
1630                         return 'd';
1631         }
1632         if (sechdrs[sym->st_shndx].sh_type == SHT_NOBITS) {
1633                 if (sechdrs[sym->st_shndx].sh_flags & ARCH_SHF_SMALL)
1634                         return 's';
1635                 else
1636                         return 'b';
1637         }
1638         if (strncmp(secstrings + sechdrs[sym->st_shndx].sh_name,
1639                     ".debug", strlen(".debug")) == 0)
1640                 return 'n';
1641         return '?';
1642 }
1643
1644 static void add_kallsyms(struct module *mod,
1645                          Elf_Shdr *sechdrs,
1646                          unsigned int symindex,
1647                          unsigned int strindex,
1648                          const char *secstrings)
1649 {
1650         unsigned int i;
1651
1652         mod->symtab = (void *)sechdrs[symindex].sh_addr;
1653         mod->num_symtab = sechdrs[symindex].sh_size / sizeof(Elf_Sym);
1654         mod->strtab = (void *)sechdrs[strindex].sh_addr;
1655
1656         /* Set types up while we still have access to sections. */
1657         for (i = 0; i < mod->num_symtab; i++)
1658                 mod->symtab[i].st_info
1659                         = elf_type(&mod->symtab[i], sechdrs, secstrings, mod);
1660 }
1661 #else
1662 static inline void add_kallsyms(struct module *mod,
1663                                 Elf_Shdr *sechdrs,
1664                                 unsigned int symindex,
1665                                 unsigned int strindex,
1666                                 const char *secstrings)
1667 {
1668 }
1669 #endif /* CONFIG_KALLSYMS */
1670
1671 /* Allocate and load the module: note that size of section 0 is always
1672    zero, and we rely on this for optional sections. */
1673 static struct module *load_module(void __user *umod,
1674                                   unsigned long len,
1675                                   const char __user *uargs)
1676 {
1677         Elf_Ehdr *hdr;
1678         Elf_Shdr *sechdrs;
1679         char *secstrings, *args, *modmagic, *strtab = NULL;
1680         unsigned int i;
1681         unsigned int symindex = 0;
1682         unsigned int strindex = 0;
1683         unsigned int setupindex;
1684         unsigned int exindex;
1685         unsigned int exportindex;
1686         unsigned int modindex;
1687         unsigned int obsparmindex;
1688         unsigned int infoindex;
1689         unsigned int gplindex;
1690         unsigned int crcindex;
1691         unsigned int gplcrcindex;
1692         unsigned int versindex;
1693         unsigned int pcpuindex;
1694         unsigned int gplfutureindex;
1695         unsigned int gplfuturecrcindex;
1696         unsigned int unwindex = 0;
1697         unsigned int unusedindex;
1698         unsigned int unusedcrcindex;
1699         unsigned int unusedgplindex;
1700         unsigned int unusedgplcrcindex;
1701         unsigned int markersindex;
1702         unsigned int markersstringsindex;
1703         struct module *mod;
1704         long err = 0;
1705         void *percpu = NULL, *ptr = NULL; /* Stops spurious gcc warning */
1706         struct exception_table_entry *extable;
1707         mm_segment_t old_fs;
1708
1709         DEBUGP("load_module: umod=%p, len=%lu, uargs=%p\n",
1710                umod, len, uargs);
1711         if (len < sizeof(*hdr))
1712                 return ERR_PTR(-ENOEXEC);
1713
1714         /* Suck in entire file: we'll want most of it. */
1715         /* vmalloc barfs on "unusual" numbers.  Check here */
1716         if (len > 64 * 1024 * 1024 || (hdr = vmalloc(len)) == NULL)
1717                 return ERR_PTR(-ENOMEM);
1718         if (copy_from_user(hdr, umod, len) != 0) {
1719                 err = -EFAULT;
1720                 goto free_hdr;
1721         }
1722
1723         /* Sanity checks against insmoding binaries or wrong arch,
1724            weird elf version */
1725         if (memcmp(hdr->e_ident, ELFMAG, 4) != 0
1726             || hdr->e_type != ET_REL
1727             || !elf_check_arch(hdr)
1728             || hdr->e_shentsize != sizeof(*sechdrs)) {
1729                 err = -ENOEXEC;
1730                 goto free_hdr;
1731         }
1732
1733         if (len < hdr->e_shoff + hdr->e_shnum * sizeof(Elf_Shdr))
1734                 goto truncated;
1735
1736         /* Convenience variables */
1737         sechdrs = (void *)hdr + hdr->e_shoff;
1738         secstrings = (void *)hdr + sechdrs[hdr->e_shstrndx].sh_offset;
1739         sechdrs[0].sh_addr = 0;
1740
1741         for (i = 1; i < hdr->e_shnum; i++) {
1742                 if (sechdrs[i].sh_type != SHT_NOBITS
1743                     && len < sechdrs[i].sh_offset + sechdrs[i].sh_size)
1744                         goto truncated;
1745
1746                 /* Mark all sections sh_addr with their address in the
1747                    temporary image. */
1748                 sechdrs[i].sh_addr = (size_t)hdr + sechdrs[i].sh_offset;
1749
1750                 /* Internal symbols and strings. */
1751                 if (sechdrs[i].sh_type == SHT_SYMTAB) {
1752                         symindex = i;
1753                         strindex = sechdrs[i].sh_link;
1754                         strtab = (char *)hdr + sechdrs[strindex].sh_offset;
1755                 }
1756 #ifndef CONFIG_MODULE_UNLOAD
1757                 /* Don't load .exit sections */
1758                 if (strncmp(secstrings+sechdrs[i].sh_name, ".exit", 5) == 0)
1759                         sechdrs[i].sh_flags &= ~(unsigned long)SHF_ALLOC;
1760 #endif
1761         }
1762
1763         modindex = find_sec(hdr, sechdrs, secstrings,
1764                             ".gnu.linkonce.this_module");
1765         if (!modindex) {
1766                 printk(KERN_WARNING "No module found in object\n");
1767                 err = -ENOEXEC;
1768                 goto free_hdr;
1769         }
1770         mod = (void *)sechdrs[modindex].sh_addr;
1771
1772         if (symindex == 0) {
1773                 printk(KERN_WARNING "%s: module has no symbols (stripped?)\n",
1774                        mod->name);
1775                 err = -ENOEXEC;
1776                 goto free_hdr;
1777         }
1778
1779         /* Optional sections */
1780         exportindex = find_sec(hdr, sechdrs, secstrings, "__ksymtab");
1781         gplindex = find_sec(hdr, sechdrs, secstrings, "__ksymtab_gpl");
1782         gplfutureindex = find_sec(hdr, sechdrs, secstrings, "__ksymtab_gpl_future");
1783         unusedindex = find_sec(hdr, sechdrs, secstrings, "__ksymtab_unused");
1784         unusedgplindex = find_sec(hdr, sechdrs, secstrings, "__ksymtab_unused_gpl");
1785         crcindex = find_sec(hdr, sechdrs, secstrings, "__kcrctab");
1786         gplcrcindex = find_sec(hdr, sechdrs, secstrings, "__kcrctab_gpl");
1787         gplfuturecrcindex = find_sec(hdr, sechdrs, secstrings, "__kcrctab_gpl_future");
1788         unusedcrcindex = find_sec(hdr, sechdrs, secstrings, "__kcrctab_unused");
1789         unusedgplcrcindex = find_sec(hdr, sechdrs, secstrings, "__kcrctab_unused_gpl");
1790         setupindex = find_sec(hdr, sechdrs, secstrings, "__param");
1791         exindex = find_sec(hdr, sechdrs, secstrings, "__ex_table");
1792         obsparmindex = find_sec(hdr, sechdrs, secstrings, "__obsparm");
1793         versindex = find_sec(hdr, sechdrs, secstrings, "__versions");
1794         infoindex = find_sec(hdr, sechdrs, secstrings, ".modinfo");
1795         pcpuindex = find_pcpusec(hdr, sechdrs, secstrings);
1796 #ifdef ARCH_UNWIND_SECTION_NAME
1797         unwindex = find_sec(hdr, sechdrs, secstrings, ARCH_UNWIND_SECTION_NAME);
1798 #endif
1799
1800         /* Don't keep modinfo section */
1801         sechdrs[infoindex].sh_flags &= ~(unsigned long)SHF_ALLOC;
1802 #ifdef CONFIG_KALLSYMS
1803         /* Keep symbol and string tables for decoding later. */
1804         sechdrs[symindex].sh_flags |= SHF_ALLOC;
1805         sechdrs[strindex].sh_flags |= SHF_ALLOC;
1806 #endif
1807         if (unwindex)
1808                 sechdrs[unwindex].sh_flags |= SHF_ALLOC;
1809
1810         /* Check module struct version now, before we try to use module. */
1811         if (!check_modstruct_version(sechdrs, versindex, mod)) {
1812                 err = -ENOEXEC;
1813                 goto free_hdr;
1814         }
1815
1816         modmagic = get_modinfo(sechdrs, infoindex, "vermagic");
1817         /* This is allowed: modprobe --force will invalidate it. */
1818         if (!modmagic) {
1819                 add_taint_module(mod, TAINT_FORCED_MODULE);
1820                 printk(KERN_WARNING "%s: no version magic, tainting kernel.\n",
1821                        mod->name);
1822         } else if (!same_magic(modmagic, vermagic)) {
1823                 printk(KERN_ERR "%s: version magic '%s' should be '%s'\n",
1824                        mod->name, modmagic, vermagic);
1825                 err = -ENOEXEC;
1826                 goto free_hdr;
1827         }
1828
1829         /* Now copy in args */
1830         args = strndup_user(uargs, ~0UL >> 1);
1831         if (IS_ERR(args)) {
1832                 err = PTR_ERR(args);
1833                 goto free_hdr;
1834         }
1835
1836         if (find_module(mod->name)) {
1837                 err = -EEXIST;
1838                 goto free_mod;
1839         }
1840
1841         mod->state = MODULE_STATE_COMING;
1842
1843         /* Allow arches to frob section contents and sizes.  */
1844         err = module_frob_arch_sections(hdr, sechdrs, secstrings, mod);
1845         if (err < 0)
1846                 goto free_mod;
1847
1848         if (pcpuindex) {
1849                 /* We have a special allocation for this section. */
1850                 percpu = percpu_modalloc(sechdrs[pcpuindex].sh_size,
1851                                          sechdrs[pcpuindex].sh_addralign,
1852                                          mod->name);
1853                 if (!percpu) {
1854                         err = -ENOMEM;
1855                         goto free_mod;
1856                 }
1857                 sechdrs[pcpuindex].sh_flags &= ~(unsigned long)SHF_ALLOC;
1858                 mod->percpu = percpu;
1859         }
1860
1861         /* Determine total sizes, and put offsets in sh_entsize.  For now
1862            this is done generically; there doesn't appear to be any
1863            special cases for the architectures. */
1864         layout_sections(mod, hdr, sechdrs, secstrings);
1865
1866         /* Do the allocs. */
1867         ptr = module_alloc(mod->core_size);
1868         if (!ptr) {
1869                 err = -ENOMEM;
1870                 goto free_percpu;
1871         }
1872         memset(ptr, 0, mod->core_size);
1873         mod->module_core = ptr;
1874
1875         ptr = module_alloc(mod->init_size);
1876         if (!ptr && mod->init_size) {
1877                 err = -ENOMEM;
1878                 goto free_core;
1879         }
1880         memset(ptr, 0, mod->init_size);
1881         mod->module_init = ptr;
1882
1883         /* Transfer each section which specifies SHF_ALLOC */
1884         DEBUGP("final section addresses:\n");
1885         for (i = 0; i < hdr->e_shnum; i++) {
1886                 void *dest;
1887
1888                 if (!(sechdrs[i].sh_flags & SHF_ALLOC))
1889                         continue;
1890
1891                 if (sechdrs[i].sh_entsize & INIT_OFFSET_MASK)
1892                         dest = mod->module_init
1893                                 + (sechdrs[i].sh_entsize & ~INIT_OFFSET_MASK);
1894                 else
1895                         dest = mod->module_core + sechdrs[i].sh_entsize;
1896
1897                 if (sechdrs[i].sh_type != SHT_NOBITS)
1898                         memcpy(dest, (void *)sechdrs[i].sh_addr,
1899                                sechdrs[i].sh_size);
1900                 /* Update sh_addr to point to copy in image. */
1901                 sechdrs[i].sh_addr = (unsigned long)dest;
1902                 DEBUGP("\t0x%lx %s\n", sechdrs[i].sh_addr, secstrings + sechdrs[i].sh_name);
1903         }
1904         /* Module has been moved. */
1905         mod = (void *)sechdrs[modindex].sh_addr;
1906
1907         /* Now we've moved module, initialize linked lists, etc. */
1908         module_unload_init(mod);
1909
1910         /* add kobject, so we can reference it. */
1911         err = mod_sysfs_init(mod);
1912         if (err)
1913                 goto free_unload;
1914
1915         /* Set up license info based on the info section */
1916         set_license(mod, get_modinfo(sechdrs, infoindex, "license"));
1917
1918         if (strcmp(mod->name, "ndiswrapper") == 0)
1919                 add_taint(TAINT_PROPRIETARY_MODULE);
1920         if (strcmp(mod->name, "driverloader") == 0)
1921                 add_taint_module(mod, TAINT_PROPRIETARY_MODULE);
1922
1923         /* Set up MODINFO_ATTR fields */
1924         setup_modinfo(mod, sechdrs, infoindex);
1925
1926         /* Fix up syms, so that st_value is a pointer to location. */
1927         err = simplify_symbols(sechdrs, symindex, strtab, versindex, pcpuindex,
1928                                mod);
1929         if (err < 0)
1930                 goto cleanup;
1931
1932         /* Set up EXPORTed & EXPORT_GPLed symbols (section 0 is 0 length) */
1933         mod->num_syms = sechdrs[exportindex].sh_size / sizeof(*mod->syms);
1934         mod->syms = (void *)sechdrs[exportindex].sh_addr;
1935         if (crcindex)
1936                 mod->crcs = (void *)sechdrs[crcindex].sh_addr;
1937         mod->num_gpl_syms = sechdrs[gplindex].sh_size / sizeof(*mod->gpl_syms);
1938         mod->gpl_syms = (void *)sechdrs[gplindex].sh_addr;
1939         if (gplcrcindex)
1940                 mod->gpl_crcs = (void *)sechdrs[gplcrcindex].sh_addr;
1941         mod->num_gpl_future_syms = sechdrs[gplfutureindex].sh_size /
1942                                         sizeof(*mod->gpl_future_syms);
1943         mod->num_unused_syms = sechdrs[unusedindex].sh_size /
1944                                         sizeof(*mod->unused_syms);
1945         mod->num_unused_gpl_syms = sechdrs[unusedgplindex].sh_size /
1946                                         sizeof(*mod->unused_gpl_syms);
1947         mod->gpl_future_syms = (void *)sechdrs[gplfutureindex].sh_addr;
1948         if (gplfuturecrcindex)
1949                 mod->gpl_future_crcs = (void *)sechdrs[gplfuturecrcindex].sh_addr;
1950
1951         mod->unused_syms = (void *)sechdrs[unusedindex].sh_addr;
1952         if (unusedcrcindex)
1953                 mod->unused_crcs = (void *)sechdrs[unusedcrcindex].sh_addr;
1954         mod->unused_gpl_syms = (void *)sechdrs[unusedgplindex].sh_addr;
1955         if (unusedgplcrcindex)
1956                 mod->unused_crcs = (void *)sechdrs[unusedgplcrcindex].sh_addr;
1957
1958 #ifdef CONFIG_MODVERSIONS
1959         if ((mod->num_syms && !crcindex) ||
1960             (mod->num_gpl_syms && !gplcrcindex) ||
1961             (mod->num_gpl_future_syms && !gplfuturecrcindex) ||
1962             (mod->num_unused_syms && !unusedcrcindex) ||
1963             (mod->num_unused_gpl_syms && !unusedgplcrcindex)) {
1964                 printk(KERN_WARNING "%s: No versions for exported symbols."
1965                        " Tainting kernel.\n", mod->name);
1966                 add_taint_module(mod, TAINT_FORCED_MODULE);
1967         }
1968 #endif
1969         markersindex = find_sec(hdr, sechdrs, secstrings, "__markers");
1970         markersstringsindex = find_sec(hdr, sechdrs, secstrings,
1971                                         "__markers_strings");
1972
1973         /* Now do relocations. */
1974         for (i = 1; i < hdr->e_shnum; i++) {
1975                 const char *strtab = (char *)sechdrs[strindex].sh_addr;
1976                 unsigned int info = sechdrs[i].sh_info;
1977
1978                 /* Not a valid relocation section? */
1979                 if (info >= hdr->e_shnum)
1980                         continue;
1981
1982                 /* Don't bother with non-allocated sections */
1983                 if (!(sechdrs[info].sh_flags & SHF_ALLOC))
1984                         continue;
1985
1986                 if (sechdrs[i].sh_type == SHT_REL)
1987                         err = apply_relocate(sechdrs, strtab, symindex, i,mod);
1988                 else if (sechdrs[i].sh_type == SHT_RELA)
1989                         err = apply_relocate_add(sechdrs, strtab, symindex, i,
1990                                                  mod);
1991                 if (err < 0)
1992                         goto cleanup;
1993         }
1994 #ifdef CONFIG_MARKERS
1995         mod->markers = (void *)sechdrs[markersindex].sh_addr;
1996         mod->num_markers =
1997                 sechdrs[markersindex].sh_size / sizeof(*mod->markers);
1998 #endif
1999
2000         /* Find duplicate symbols */
2001         err = verify_export_symbols(mod);
2002
2003         if (err < 0)
2004                 goto cleanup;
2005
2006         /* Set up and sort exception table */
2007         mod->num_exentries = sechdrs[exindex].sh_size / sizeof(*mod->extable);
2008         mod->extable = extable = (void *)sechdrs[exindex].sh_addr;
2009         sort_extable(extable, extable + mod->num_exentries);
2010
2011         /* Finally, copy percpu area over. */
2012         percpu_modcopy(mod->percpu, (void *)sechdrs[pcpuindex].sh_addr,
2013                        sechdrs[pcpuindex].sh_size);
2014
2015         add_kallsyms(mod, sechdrs, symindex, strindex, secstrings);
2016
2017 #ifdef CONFIG_MARKERS
2018         if (!mod->taints)
2019                 marker_update_probe_range(mod->markers,
2020                         mod->markers + mod->num_markers, NULL, NULL);
2021 #endif
2022         err = module_finalize(hdr, sechdrs, mod);
2023         if (err < 0)
2024                 goto cleanup;
2025
2026         /* flush the icache in correct context */
2027         old_fs = get_fs();
2028         set_fs(KERNEL_DS);
2029
2030         /*
2031          * Flush the instruction cache, since we've played with text.
2032          * Do it before processing of module parameters, so the module
2033          * can provide parameter accessor functions of its own.
2034          */
2035         if (mod->module_init)
2036                 flush_icache_range((unsigned long)mod->module_init,
2037                                    (unsigned long)mod->module_init
2038                                    + mod->init_size);
2039         flush_icache_range((unsigned long)mod->module_core,
2040                            (unsigned long)mod->module_core + mod->core_size);
2041
2042         set_fs(old_fs);
2043
2044         mod->args = args;
2045         if (obsparmindex)
2046                 printk(KERN_WARNING "%s: Ignoring obsolete parameters\n",
2047                        mod->name);
2048
2049         /* Now sew it into the lists so we can get lockdep and oops
2050          * info during argument parsing.  Noone should access us, since
2051          * strong_try_module_get() will fail. */
2052         stop_machine_run(__link_module, mod, NR_CPUS);
2053
2054         /* Size of section 0 is 0, so this works well if no params */
2055         err = parse_args(mod->name, mod->args,
2056                          (struct kernel_param *)
2057                          sechdrs[setupindex].sh_addr,
2058                          sechdrs[setupindex].sh_size
2059                          / sizeof(struct kernel_param),
2060                          NULL);
2061         if (err < 0)
2062                 goto unlink;
2063
2064         err = mod_sysfs_setup(mod,
2065                               (struct kernel_param *)
2066                               sechdrs[setupindex].sh_addr,
2067                               sechdrs[setupindex].sh_size
2068                               / sizeof(struct kernel_param));
2069         if (err < 0)
2070                 goto unlink;
2071         add_sect_attrs(mod, hdr->e_shnum, secstrings, sechdrs);
2072         add_notes_attrs(mod, hdr->e_shnum, secstrings, sechdrs);
2073
2074         /* Size of section 0 is 0, so this works well if no unwind info. */
2075         mod->unwind_info = unwind_add_table(mod,
2076                                             (void *)sechdrs[unwindex].sh_addr,
2077                                             sechdrs[unwindex].sh_size);
2078
2079         /* Get rid of temporary copy */
2080         vfree(hdr);
2081
2082         /* Done! */
2083         return mod;
2084
2085  unlink:
2086         stop_machine_run(__unlink_module, mod, NR_CPUS);
2087         module_arch_cleanup(mod);
2088  cleanup:
2089         kobject_del(&mod->mkobj.kobj);
2090         kobject_put(&mod->mkobj.kobj);
2091  free_unload:
2092         module_unload_free(mod);
2093         module_free(mod, mod->module_init);
2094  free_core:
2095         module_free(mod, mod->module_core);
2096  free_percpu:
2097         if (percpu)
2098                 percpu_modfree(percpu);
2099  free_mod:
2100         kfree(args);
2101  free_hdr:
2102         vfree(hdr);
2103         return ERR_PTR(err);
2104
2105  truncated:
2106         printk(KERN_ERR "Module len %lu truncated\n", len);
2107         err = -ENOEXEC;
2108         goto free_hdr;
2109 }
2110
2111 /* This is where the real work happens */
2112 asmlinkage long
2113 sys_init_module(void __user *umod,
2114                 unsigned long len,
2115                 const char __user *uargs)
2116 {
2117         struct module *mod;
2118         int ret = 0;
2119
2120         /* Must have permission */
2121         if (!capable(CAP_SYS_MODULE))
2122                 return -EPERM;
2123
2124         /* Only one module load at a time, please */
2125         if (mutex_lock_interruptible(&module_mutex) != 0)
2126                 return -EINTR;
2127
2128         /* Do all the hard work */
2129         mod = load_module(umod, len, uargs);
2130         if (IS_ERR(mod)) {
2131                 mutex_unlock(&module_mutex);
2132                 return PTR_ERR(mod);
2133         }
2134
2135         /* Drop lock so they can recurse */
2136         mutex_unlock(&module_mutex);
2137
2138         blocking_notifier_call_chain(&module_notify_list,
2139                         MODULE_STATE_COMING, mod);
2140
2141         /* Start the module */
2142         if (mod->init != NULL)
2143                 ret = mod->init();
2144         if (ret < 0) {
2145                 /* Init routine failed: abort.  Try to protect us from
2146                    buggy refcounters. */
2147                 mod->state = MODULE_STATE_GOING;
2148                 synchronize_sched();
2149                 module_put(mod);
2150                 mutex_lock(&module_mutex);
2151                 free_module(mod);
2152                 mutex_unlock(&module_mutex);
2153                 wake_up(&module_wq);
2154                 return ret;
2155         }
2156
2157         /* Now it's a first class citizen! */
2158         mutex_lock(&module_mutex);
2159         mod->state = MODULE_STATE_LIVE;
2160         /* Drop initial reference. */
2161         module_put(mod);
2162         unwind_remove_table(mod->unwind_info, 1);
2163         module_free(mod, mod->module_init);
2164         mod->module_init = NULL;
2165         mod->init_size = 0;
2166         mod->init_text_size = 0;
2167         mutex_unlock(&module_mutex);
2168         wake_up(&module_wq);
2169
2170         return 0;
2171 }
2172
2173 static inline int within(unsigned long addr, void *start, unsigned long size)
2174 {
2175         return ((void *)addr >= start && (void *)addr < start + size);
2176 }
2177
2178 #ifdef CONFIG_KALLSYMS
2179 /*
2180  * This ignores the intensely annoying "mapping symbols" found
2181  * in ARM ELF files: $a, $t and $d.
2182  */
2183 static inline int is_arm_mapping_symbol(const char *str)
2184 {
2185         return str[0] == '$' && strchr("atd", str[1])
2186                && (str[2] == '\0' || str[2] == '.');
2187 }
2188
2189 static const char *get_ksymbol(struct module *mod,
2190                                unsigned long addr,
2191                                unsigned long *size,
2192                                unsigned long *offset)
2193 {
2194         unsigned int i, best = 0;
2195         unsigned long nextval;
2196
2197         /* At worse, next value is at end of module */
2198         if (within(addr, mod->module_init, mod->init_size))
2199                 nextval = (unsigned long)mod->module_init+mod->init_text_size;
2200         else
2201                 nextval = (unsigned long)mod->module_core+mod->core_text_size;
2202
2203         /* Scan for closest preceeding symbol, and next symbol. (ELF
2204            starts real symbols at 1). */
2205         for (i = 1; i < mod->num_symtab; i++) {
2206                 if (mod->symtab[i].st_shndx == SHN_UNDEF)
2207                         continue;
2208
2209                 /* We ignore unnamed symbols: they're uninformative
2210                  * and inserted at a whim. */
2211                 if (mod->symtab[i].st_value <= addr
2212                     && mod->symtab[i].st_value > mod->symtab[best].st_value
2213                     && *(mod->strtab + mod->symtab[i].st_name) != '\0'
2214                     && !is_arm_mapping_symbol(mod->strtab + mod->symtab[i].st_name))
2215                         best = i;
2216                 if (mod->symtab[i].st_value > addr
2217                     && mod->symtab[i].st_value < nextval
2218                     && *(mod->strtab + mod->symtab[i].st_name) != '\0'
2219                     && !is_arm_mapping_symbol(mod->strtab + mod->symtab[i].st_name))
2220                         nextval = mod->symtab[i].st_value;
2221         }
2222
2223         if (!best)
2224                 return NULL;
2225
2226         if (size)
2227                 *size = nextval - mod->symtab[best].st_value;
2228         if (offset)
2229                 *offset = addr - mod->symtab[best].st_value;
2230         return mod->strtab + mod->symtab[best].st_name;
2231 }
2232
2233 /* For kallsyms to ask for address resolution.  NULL means not found.  Careful
2234  * not to lock to avoid deadlock on oopses, simply disable preemption. */
2235 char *module_address_lookup(unsigned long addr,
2236                             unsigned long *size,
2237                             unsigned long *offset,
2238                             char **modname,
2239                             char *namebuf)
2240 {
2241         struct module *mod;
2242         const char *ret = NULL;
2243
2244         preempt_disable();
2245         list_for_each_entry(mod, &modules, list) {
2246                 if (within(addr, mod->module_init, mod->init_size)
2247                     || within(addr, mod->module_core, mod->core_size)) {
2248                         if (modname)
2249                                 *modname = mod->name;
2250                         ret = get_ksymbol(mod, addr, size, offset);
2251                         break;
2252                 }
2253         }
2254         /* Make a copy in here where it's safe */
2255         if (ret) {
2256                 strncpy(namebuf, ret, KSYM_NAME_LEN - 1);
2257                 ret = namebuf;
2258         }
2259         preempt_enable();
2260         return (char *)ret;
2261 }
2262
2263 int lookup_module_symbol_name(unsigned long addr, char *symname)
2264 {
2265         struct module *mod;
2266
2267         preempt_disable();
2268         list_for_each_entry(mod, &modules, list) {
2269                 if (within(addr, mod->module_init, mod->init_size) ||
2270                     within(addr, mod->module_core, mod->core_size)) {
2271                         const char *sym;
2272
2273                         sym = get_ksymbol(mod, addr, NULL, NULL);
2274                         if (!sym)
2275                                 goto out;
2276                         strlcpy(symname, sym, KSYM_NAME_LEN);
2277                         preempt_enable();
2278                         return 0;
2279                 }
2280         }
2281 out:
2282         preempt_enable();
2283         return -ERANGE;
2284 }
2285
2286 int lookup_module_symbol_attrs(unsigned long addr, unsigned long *size,
2287                         unsigned long *offset, char *modname, char *name)
2288 {
2289         struct module *mod;
2290
2291         preempt_disable();
2292         list_for_each_entry(mod, &modules, list) {
2293                 if (within(addr, mod->module_init, mod->init_size) ||
2294                     within(addr, mod->module_core, mod->core_size)) {
2295                         const char *sym;
2296
2297                         sym = get_ksymbol(mod, addr, size, offset);
2298                         if (!sym)
2299                                 goto out;
2300                         if (modname)
2301                                 strlcpy(modname, mod->name, MODULE_NAME_LEN);
2302                         if (name)
2303                                 strlcpy(name, sym, KSYM_NAME_LEN);
2304                         preempt_enable();
2305                         return 0;
2306                 }
2307         }
2308 out:
2309         preempt_enable();
2310         return -ERANGE;
2311 }
2312
2313 int module_get_kallsym(unsigned int symnum, unsigned long *value, char *type,
2314                         char *name, char *module_name, int *exported)
2315 {
2316         struct module *mod;
2317
2318         preempt_disable();
2319         list_for_each_entry(mod, &modules, list) {
2320                 if (symnum < mod->num_symtab) {
2321                         *value = mod->symtab[symnum].st_value;
2322                         *type = mod->symtab[symnum].st_info;
2323                         strlcpy(name, mod->strtab + mod->symtab[symnum].st_name,
2324                                 KSYM_NAME_LEN);
2325                         strlcpy(module_name, mod->name, MODULE_NAME_LEN);
2326                         *exported = is_exported(name, mod);
2327                         preempt_enable();
2328                         return 0;
2329                 }
2330                 symnum -= mod->num_symtab;
2331         }
2332         preempt_enable();
2333         return -ERANGE;
2334 }
2335
2336 static unsigned long mod_find_symname(struct module *mod, const char *name)
2337 {
2338         unsigned int i;
2339
2340         for (i = 0; i < mod->num_symtab; i++)
2341                 if (strcmp(name, mod->strtab+mod->symtab[i].st_name) == 0 &&
2342                     mod->symtab[i].st_info != 'U')
2343                         return mod->symtab[i].st_value;
2344         return 0;
2345 }
2346
2347 /* Look for this name: can be of form module:name. */
2348 unsigned long module_kallsyms_lookup_name(const char *name)
2349 {
2350         struct module *mod;
2351         char *colon;
2352         unsigned long ret = 0;
2353
2354         /* Don't lock: we're in enough trouble already. */
2355         preempt_disable();
2356         if ((colon = strchr(name, ':')) != NULL) {
2357                 *colon = '\0';
2358                 if ((mod = find_module(name)) != NULL)
2359                         ret = mod_find_symname(mod, colon+1);
2360                 *colon = ':';
2361         } else {
2362                 list_for_each_entry(mod, &modules, list)
2363                         if ((ret = mod_find_symname(mod, name)) != 0)
2364                                 break;
2365         }
2366         preempt_enable();
2367         return ret;
2368 }
2369 #endif /* CONFIG_KALLSYMS */
2370
2371 /* Called by the /proc file system to return a list of modules. */
2372 static void *m_start(struct seq_file *m, loff_t *pos)
2373 {
2374         mutex_lock(&module_mutex);
2375         return seq_list_start(&modules, *pos);
2376 }
2377
2378 static void *m_next(struct seq_file *m, void *p, loff_t *pos)
2379 {
2380         return seq_list_next(p, &modules, pos);
2381 }
2382
2383 static void m_stop(struct seq_file *m, void *p)
2384 {
2385         mutex_unlock(&module_mutex);
2386 }
2387
2388 static char *module_flags(struct module *mod, char *buf)
2389 {
2390         int bx = 0;
2391
2392         if (mod->taints ||
2393             mod->state == MODULE_STATE_GOING ||
2394             mod->state == MODULE_STATE_COMING) {
2395                 buf[bx++] = '(';
2396                 if (mod->taints & TAINT_PROPRIETARY_MODULE)
2397                         buf[bx++] = 'P';
2398                 if (mod->taints & TAINT_FORCED_MODULE)
2399                         buf[bx++] = 'F';
2400                 /*
2401                  * TAINT_FORCED_RMMOD: could be added.
2402                  * TAINT_UNSAFE_SMP, TAINT_MACHINE_CHECK, TAINT_BAD_PAGE don't
2403                  * apply to modules.
2404                  */
2405
2406                 /* Show a - for module-is-being-unloaded */
2407                 if (mod->state == MODULE_STATE_GOING)
2408                         buf[bx++] = '-';
2409                 /* Show a + for module-is-being-loaded */
2410                 if (mod->state == MODULE_STATE_COMING)
2411                         buf[bx++] = '+';
2412                 buf[bx++] = ')';
2413         }
2414         buf[bx] = '\0';
2415
2416         return buf;
2417 }
2418
2419 static int m_show(struct seq_file *m, void *p)
2420 {
2421         struct module *mod = list_entry(p, struct module, list);
2422         char buf[8];
2423
2424         seq_printf(m, "%s %lu",
2425                    mod->name, mod->init_size + mod->core_size);
2426         print_unload_info(m, mod);
2427
2428         /* Informative for users. */
2429         seq_printf(m, " %s",
2430                    mod->state == MODULE_STATE_GOING ? "Unloading":
2431                    mod->state == MODULE_STATE_COMING ? "Loading":
2432                    "Live");
2433         /* Used by oprofile and other similar tools. */
2434         seq_printf(m, " 0x%p", mod->module_core);
2435
2436         /* Taints info */
2437         if (mod->taints)
2438                 seq_printf(m, " %s", module_flags(mod, buf));
2439
2440         seq_printf(m, "\n");
2441         return 0;
2442 }
2443
2444 /* Format: modulename size refcount deps address
2445
2446    Where refcount is a number or -, and deps is a comma-separated list
2447    of depends or -.
2448 */
2449 const struct seq_operations modules_op = {
2450         .start  = m_start,
2451         .next   = m_next,
2452         .stop   = m_stop,
2453         .show   = m_show
2454 };
2455
2456 /* Given an address, look for it in the module exception tables. */
2457 const struct exception_table_entry *search_module_extables(unsigned long addr)
2458 {
2459         const struct exception_table_entry *e = NULL;
2460         struct module *mod;
2461
2462         preempt_disable();
2463         list_for_each_entry(mod, &modules, list) {
2464                 if (mod->num_exentries == 0)
2465                         continue;
2466
2467                 e = search_extable(mod->extable,
2468                                    mod->extable + mod->num_exentries - 1,
2469                                    addr);
2470                 if (e)
2471                         break;
2472         }
2473         preempt_enable();
2474
2475         /* Now, if we found one, we are running inside it now, hence
2476            we cannot unload the module, hence no refcnt needed. */
2477         return e;
2478 }
2479
2480 /*
2481  * Is this a valid module address?
2482  */
2483 int is_module_address(unsigned long addr)
2484 {
2485         struct module *mod;
2486
2487         preempt_disable();
2488
2489         list_for_each_entry(mod, &modules, list) {
2490                 if (within(addr, mod->module_core, mod->core_size)) {
2491                         preempt_enable();
2492                         return 1;
2493                 }
2494         }
2495
2496         preempt_enable();
2497
2498         return 0;
2499 }
2500
2501
2502 /* Is this a valid kernel address? */
2503 struct module *__module_text_address(unsigned long addr)
2504 {
2505         struct module *mod;
2506
2507         list_for_each_entry(mod, &modules, list)
2508                 if (within(addr, mod->module_init, mod->init_text_size)
2509                     || within(addr, mod->module_core, mod->core_text_size))
2510                         return mod;
2511         return NULL;
2512 }
2513
2514 struct module *module_text_address(unsigned long addr)
2515 {
2516         struct module *mod;
2517
2518         preempt_disable();
2519         mod = __module_text_address(addr);
2520         preempt_enable();
2521
2522         return mod;
2523 }
2524
2525 /* Don't grab lock, we're oopsing. */
2526 void print_modules(void)
2527 {
2528         struct module *mod;
2529         char buf[8];
2530
2531         printk("Modules linked in:");
2532         list_for_each_entry(mod, &modules, list)
2533                 printk(" %s%s", mod->name, module_flags(mod, buf));
2534         if (last_unloaded_module[0])
2535                 printk(" [last unloaded: %s]", last_unloaded_module);
2536         printk("\n");
2537 }
2538
2539 #ifdef CONFIG_MODVERSIONS
2540 /* Generate the signature for struct module here, too, for modversions. */
2541 void struct_module(struct module *mod) { return; }
2542 EXPORT_SYMBOL(struct_module);
2543 #endif
2544
2545 #ifdef CONFIG_MARKERS
2546 void module_update_markers(struct module *probe_module, int *refcount)
2547 {
2548         struct module *mod;
2549
2550         mutex_lock(&module_mutex);
2551         list_for_each_entry(mod, &modules, list)
2552                 if (!mod->taints)
2553                         marker_update_probe_range(mod->markers,
2554                                 mod->markers + mod->num_markers,
2555                                 probe_module, refcount);
2556         mutex_unlock(&module_mutex);
2557 }
2558 #endif