3d0a589d92c40ebcf33882bf9d1b331894953037
[sfrench/cifs-2.6.git] / arch / x86 / mm / ioremap.c
1 /*
2  * Re-map IO memory to kernel address space so that we can access it.
3  * This is needed for high PCI addresses that aren't mapped in the
4  * 640k-1MB IO memory area on PC's
5  *
6  * (C) Copyright 1995 1996 Linus Torvalds
7  */
8
9 #include <linux/bootmem.h>
10 #include <linux/init.h>
11 #include <linux/io.h>
12 #include <linux/module.h>
13 #include <linux/slab.h>
14 #include <linux/vmalloc.h>
15
16 #include <asm/cacheflush.h>
17 #include <asm/e820.h>
18 #include <asm/fixmap.h>
19 #include <asm/pgtable.h>
20 #include <asm/tlbflush.h>
21 #include <asm/pgalloc.h>
22
23 enum ioremap_mode {
24         IOR_MODE_UNCACHED,
25         IOR_MODE_CACHED,
26 };
27
28 #ifdef CONFIG_X86_64
29
30 unsigned long __phys_addr(unsigned long x)
31 {
32         if (x >= __START_KERNEL_map)
33                 return x - __START_KERNEL_map + phys_base;
34         return x - PAGE_OFFSET;
35 }
36 EXPORT_SYMBOL(__phys_addr);
37
38 static inline int phys_addr_valid(unsigned long addr)
39 {
40         return addr < (1UL << boot_cpu_data.x86_phys_bits);
41 }
42
43 #else
44
45 static inline int phys_addr_valid(unsigned long addr)
46 {
47         return 1;
48 }
49
50 #endif
51
52 int page_is_ram(unsigned long pagenr)
53 {
54         unsigned long addr, end;
55         int i;
56
57         /*
58          * A special case is the first 4Kb of memory;
59          * This is a BIOS owned area, not kernel ram, but generally
60          * not listed as such in the E820 table.
61          */
62         if (pagenr == 0)
63                 return 0;
64
65         /*
66          * Second special case: Some BIOSen report the PC BIOS
67          * area (640->1Mb) as ram even though it is not.
68          */
69         if (pagenr >= (BIOS_BEGIN >> PAGE_SHIFT) &&
70                     pagenr < (BIOS_END >> PAGE_SHIFT))
71                 return 0;
72
73         for (i = 0; i < e820.nr_map; i++) {
74                 /*
75                  * Not usable memory:
76                  */
77                 if (e820.map[i].type != E820_RAM)
78                         continue;
79                 addr = (e820.map[i].addr + PAGE_SIZE-1) >> PAGE_SHIFT;
80                 end = (e820.map[i].addr + e820.map[i].size) >> PAGE_SHIFT;
81
82
83                 if ((pagenr >= addr) && (pagenr < end))
84                         return 1;
85         }
86         return 0;
87 }
88
89 /*
90  * Fix up the linear direct mapping of the kernel to avoid cache attribute
91  * conflicts.
92  */
93 static int ioremap_change_attr(unsigned long vaddr, unsigned long size,
94                                enum ioremap_mode mode)
95 {
96         unsigned long nrpages = size >> PAGE_SHIFT;
97         int err;
98
99         switch (mode) {
100         case IOR_MODE_UNCACHED:
101         default:
102                 err = set_memory_uc(vaddr, nrpages);
103                 break;
104         case IOR_MODE_CACHED:
105                 err = set_memory_wb(vaddr, nrpages);
106                 break;
107         }
108
109         return err;
110 }
111
112 /*
113  * Remap an arbitrary physical address space into the kernel virtual
114  * address space. Needed when the kernel wants to access high addresses
115  * directly.
116  *
117  * NOTE! We need to allow non-page-aligned mappings too: we will obviously
118  * have to convert them into an offset in a page-aligned mapping, but the
119  * caller shouldn't need to know that small detail.
120  */
121 static void __iomem *__ioremap(resource_size_t phys_addr, unsigned long size,
122                                enum ioremap_mode mode)
123 {
124         unsigned long pfn, offset, last_addr, vaddr;
125         struct vm_struct *area;
126         pgprot_t prot;
127
128         /* Don't allow wraparound or zero size */
129         last_addr = phys_addr + size - 1;
130         if (!size || last_addr < phys_addr)
131                 return NULL;
132
133         if (!phys_addr_valid(phys_addr)) {
134                 printk(KERN_WARNING "ioremap: invalid physical address %lx\n",
135                        phys_addr);
136                 WARN_ON_ONCE(1);
137                 return NULL;
138         }
139
140         /*
141          * Don't remap the low PCI/ISA area, it's always mapped..
142          */
143         if (phys_addr >= ISA_START_ADDRESS && last_addr < ISA_END_ADDRESS)
144                 return (__force void __iomem *)phys_to_virt(phys_addr);
145
146         /*
147          * Don't allow anybody to remap normal RAM that we're using..
148          */
149         for (pfn = phys_addr >> PAGE_SHIFT;
150                                 (pfn << PAGE_SHIFT) < last_addr; pfn++) {
151
152                 int is_ram = page_is_ram(pfn);
153
154                 if (is_ram && pfn_valid(pfn) && !PageReserved(pfn_to_page(pfn)))
155                         return NULL;
156                 WARN_ON_ONCE(is_ram);
157         }
158
159         switch (mode) {
160         case IOR_MODE_UNCACHED:
161         default:
162                 /*
163                  * FIXME: we will use UC MINUS for now, as video fb drivers
164                  * depend on it. Upcoming ioremap_wc() will fix this behavior.
165                  */
166                 prot = PAGE_KERNEL_UC_MINUS;
167                 break;
168         case IOR_MODE_CACHED:
169                 prot = PAGE_KERNEL;
170                 break;
171         }
172
173         /*
174          * Mappings have to be page-aligned
175          */
176         offset = phys_addr & ~PAGE_MASK;
177         phys_addr &= PAGE_MASK;
178         size = PAGE_ALIGN(last_addr+1) - phys_addr;
179
180         /*
181          * Ok, go for it..
182          */
183         area = get_vm_area(size, VM_IOREMAP);
184         if (!area)
185                 return NULL;
186         area->phys_addr = phys_addr;
187         vaddr = (unsigned long) area->addr;
188         if (ioremap_page_range(vaddr, vaddr + size, phys_addr, prot)) {
189                 free_vm_area(area);
190                 return NULL;
191         }
192
193         if (ioremap_change_attr(vaddr, size, mode) < 0) {
194                 vunmap(area->addr);
195                 return NULL;
196         }
197
198         return (void __iomem *) (vaddr + offset);
199 }
200
201 /**
202  * ioremap_nocache     -   map bus memory into CPU space
203  * @offset:    bus address of the memory
204  * @size:      size of the resource to map
205  *
206  * ioremap_nocache performs a platform specific sequence of operations to
207  * make bus memory CPU accessible via the readb/readw/readl/writeb/
208  * writew/writel functions and the other mmio helpers. The returned
209  * address is not guaranteed to be usable directly as a virtual
210  * address.
211  *
212  * This version of ioremap ensures that the memory is marked uncachable
213  * on the CPU as well as honouring existing caching rules from things like
214  * the PCI bus. Note that there are other caches and buffers on many
215  * busses. In particular driver authors should read up on PCI writes
216  *
217  * It's useful if some control registers are in such an area and
218  * write combining or read caching is not desirable:
219  *
220  * Must be freed with iounmap.
221  */
222 void __iomem *ioremap_nocache(resource_size_t phys_addr, unsigned long size)
223 {
224         return __ioremap(phys_addr, size, IOR_MODE_UNCACHED);
225 }
226 EXPORT_SYMBOL(ioremap_nocache);
227
228 void __iomem *ioremap_cache(resource_size_t phys_addr, unsigned long size)
229 {
230         return __ioremap(phys_addr, size, IOR_MODE_CACHED);
231 }
232 EXPORT_SYMBOL(ioremap_cache);
233
234 /**
235  * iounmap - Free a IO remapping
236  * @addr: virtual address from ioremap_*
237  *
238  * Caller must ensure there is only one unmapping for the same pointer.
239  */
240 void iounmap(volatile void __iomem *addr)
241 {
242         struct vm_struct *p, *o;
243
244         if ((void __force *)addr <= high_memory)
245                 return;
246
247         /*
248          * __ioremap special-cases the PCI/ISA range by not instantiating a
249          * vm_area and by simply returning an address into the kernel mapping
250          * of ISA space.   So handle that here.
251          */
252         if (addr >= phys_to_virt(ISA_START_ADDRESS) &&
253             addr < phys_to_virt(ISA_END_ADDRESS))
254                 return;
255
256         addr = (volatile void __iomem *)
257                 (PAGE_MASK & (unsigned long __force)addr);
258
259         /* Use the vm area unlocked, assuming the caller
260            ensures there isn't another iounmap for the same address
261            in parallel. Reuse of the virtual address is prevented by
262            leaving it in the global lists until we're done with it.
263            cpa takes care of the direct mappings. */
264         read_lock(&vmlist_lock);
265         for (p = vmlist; p; p = p->next) {
266                 if (p->addr == addr)
267                         break;
268         }
269         read_unlock(&vmlist_lock);
270
271         if (!p) {
272                 printk(KERN_ERR "iounmap: bad address %p\n", addr);
273                 dump_stack();
274                 return;
275         }
276
277         /* Finally remove it */
278         o = remove_vm_area((void *)addr);
279         BUG_ON(p != o || o == NULL);
280         kfree(p);
281 }
282 EXPORT_SYMBOL(iounmap);
283
284 #ifdef CONFIG_X86_32
285
286 int __initdata early_ioremap_debug;
287
288 static int __init early_ioremap_debug_setup(char *str)
289 {
290         early_ioremap_debug = 1;
291
292         return 0;
293 }
294 early_param("early_ioremap_debug", early_ioremap_debug_setup);
295
296 static __initdata int after_paging_init;
297 static pte_t bm_pte[PAGE_SIZE/sizeof(pte_t)]
298                 __section(.bss.page_aligned);
299
300 static inline pmd_t * __init early_ioremap_pmd(unsigned long addr)
301 {
302         /* Don't assume we're using swapper_pg_dir at this point */
303         pgd_t *base = __va(read_cr3());
304         pgd_t *pgd = &base[pgd_index(addr)];
305         pud_t *pud = pud_offset(pgd, addr);
306         pmd_t *pmd = pmd_offset(pud, addr);
307
308         return pmd;
309 }
310
311 static inline pte_t * __init early_ioremap_pte(unsigned long addr)
312 {
313         return &bm_pte[pte_index(addr)];
314 }
315
316 void __init early_ioremap_init(void)
317 {
318         pmd_t *pmd;
319
320         if (early_ioremap_debug)
321                 printk(KERN_INFO "early_ioremap_init()\n");
322
323         pmd = early_ioremap_pmd(fix_to_virt(FIX_BTMAP_BEGIN));
324         memset(bm_pte, 0, sizeof(bm_pte));
325         pmd_populate_kernel(&init_mm, pmd, bm_pte);
326
327         /*
328          * The boot-ioremap range spans multiple pmds, for which
329          * we are not prepared:
330          */
331         if (pmd != early_ioremap_pmd(fix_to_virt(FIX_BTMAP_END))) {
332                 WARN_ON(1);
333                 printk(KERN_WARNING "pmd %p != %p\n",
334                        pmd, early_ioremap_pmd(fix_to_virt(FIX_BTMAP_END)));
335                 printk(KERN_WARNING "fix_to_virt(FIX_BTMAP_BEGIN): %08lx\n",
336                         fix_to_virt(FIX_BTMAP_BEGIN));
337                 printk(KERN_WARNING "fix_to_virt(FIX_BTMAP_END):   %08lx\n",
338                         fix_to_virt(FIX_BTMAP_END));
339
340                 printk(KERN_WARNING "FIX_BTMAP_END:       %d\n", FIX_BTMAP_END);
341                 printk(KERN_WARNING "FIX_BTMAP_BEGIN:     %d\n",
342                        FIX_BTMAP_BEGIN);
343         }
344 }
345
346 void __init early_ioremap_clear(void)
347 {
348         pmd_t *pmd;
349
350         if (early_ioremap_debug)
351                 printk(KERN_INFO "early_ioremap_clear()\n");
352
353         pmd = early_ioremap_pmd(fix_to_virt(FIX_BTMAP_BEGIN));
354         pmd_clear(pmd);
355         paravirt_release_pt(__pa(bm_pte) >> PAGE_SHIFT);
356         __flush_tlb_all();
357 }
358
359 void __init early_ioremap_reset(void)
360 {
361         enum fixed_addresses idx;
362         unsigned long addr, phys;
363         pte_t *pte;
364
365         after_paging_init = 1;
366         for (idx = FIX_BTMAP_BEGIN; idx >= FIX_BTMAP_END; idx--) {
367                 addr = fix_to_virt(idx);
368                 pte = early_ioremap_pte(addr);
369                 if (pte_present(*pte)) {
370                         phys = pte_val(*pte) & PAGE_MASK;
371                         set_fixmap(idx, phys);
372                 }
373         }
374 }
375
376 static void __init __early_set_fixmap(enum fixed_addresses idx,
377                                    unsigned long phys, pgprot_t flags)
378 {
379         unsigned long addr = __fix_to_virt(idx);
380         pte_t *pte;
381
382         if (idx >= __end_of_fixed_addresses) {
383                 BUG();
384                 return;
385         }
386         pte = early_ioremap_pte(addr);
387         if (pgprot_val(flags))
388                 set_pte(pte, pfn_pte(phys >> PAGE_SHIFT, flags));
389         else
390                 pte_clear(NULL, addr, pte);
391         __flush_tlb_one(addr);
392 }
393
394 static inline void __init early_set_fixmap(enum fixed_addresses idx,
395                                         unsigned long phys)
396 {
397         if (after_paging_init)
398                 set_fixmap(idx, phys);
399         else
400                 __early_set_fixmap(idx, phys, PAGE_KERNEL);
401 }
402
403 static inline void __init early_clear_fixmap(enum fixed_addresses idx)
404 {
405         if (after_paging_init)
406                 clear_fixmap(idx);
407         else
408                 __early_set_fixmap(idx, 0, __pgprot(0));
409 }
410
411
412 int __initdata early_ioremap_nested;
413
414 static int __init check_early_ioremap_leak(void)
415 {
416         if (!early_ioremap_nested)
417                 return 0;
418
419         printk(KERN_WARNING
420                "Debug warning: early ioremap leak of %d areas detected.\n",
421                early_ioremap_nested);
422         printk(KERN_WARNING
423                "please boot with early_ioremap_debug and report the dmesg.\n");
424         WARN_ON(1);
425
426         return 1;
427 }
428 late_initcall(check_early_ioremap_leak);
429
430 void __init *early_ioremap(unsigned long phys_addr, unsigned long size)
431 {
432         unsigned long offset, last_addr;
433         unsigned int nrpages, nesting;
434         enum fixed_addresses idx0, idx;
435
436         WARN_ON(system_state != SYSTEM_BOOTING);
437
438         nesting = early_ioremap_nested;
439         if (early_ioremap_debug) {
440                 printk(KERN_INFO "early_ioremap(%08lx, %08lx) [%d] => ",
441                        phys_addr, size, nesting);
442                 dump_stack();
443         }
444
445         /* Don't allow wraparound or zero size */
446         last_addr = phys_addr + size - 1;
447         if (!size || last_addr < phys_addr) {
448                 WARN_ON(1);
449                 return NULL;
450         }
451
452         if (nesting >= FIX_BTMAPS_NESTING) {
453                 WARN_ON(1);
454                 return NULL;
455         }
456         early_ioremap_nested++;
457         /*
458          * Mappings have to be page-aligned
459          */
460         offset = phys_addr & ~PAGE_MASK;
461         phys_addr &= PAGE_MASK;
462         size = PAGE_ALIGN(last_addr) - phys_addr;
463
464         /*
465          * Mappings have to fit in the FIX_BTMAP area.
466          */
467         nrpages = size >> PAGE_SHIFT;
468         if (nrpages > NR_FIX_BTMAPS) {
469                 WARN_ON(1);
470                 return NULL;
471         }
472
473         /*
474          * Ok, go for it..
475          */
476         idx0 = FIX_BTMAP_BEGIN - NR_FIX_BTMAPS*nesting;
477         idx = idx0;
478         while (nrpages > 0) {
479                 early_set_fixmap(idx, phys_addr);
480                 phys_addr += PAGE_SIZE;
481                 --idx;
482                 --nrpages;
483         }
484         if (early_ioremap_debug)
485                 printk(KERN_CONT "%08lx + %08lx\n", offset, fix_to_virt(idx0));
486
487         return (void *) (offset + fix_to_virt(idx0));
488 }
489
490 void __init early_iounmap(void *addr, unsigned long size)
491 {
492         unsigned long virt_addr;
493         unsigned long offset;
494         unsigned int nrpages;
495         enum fixed_addresses idx;
496         unsigned int nesting;
497
498         nesting = --early_ioremap_nested;
499         WARN_ON(nesting < 0);
500
501         if (early_ioremap_debug) {
502                 printk(KERN_INFO "early_iounmap(%p, %08lx) [%d]\n", addr,
503                        size, nesting);
504                 dump_stack();
505         }
506
507         virt_addr = (unsigned long)addr;
508         if (virt_addr < fix_to_virt(FIX_BTMAP_BEGIN)) {
509                 WARN_ON(1);
510                 return;
511         }
512         offset = virt_addr & ~PAGE_MASK;
513         nrpages = PAGE_ALIGN(offset + size - 1) >> PAGE_SHIFT;
514
515         idx = FIX_BTMAP_BEGIN - NR_FIX_BTMAPS*nesting;
516         while (nrpages > 0) {
517                 early_clear_fixmap(idx);
518                 --idx;
519                 --nrpages;
520         }
521 }
522
523 void __this_fixmap_does_not_exist(void)
524 {
525         WARN_ON(1);
526 }
527
528 #endif /* CONFIG_X86_32 */