Merge branch 'locking-core-for-linus' of git://git.kernel.org/pub/scm/linux/kernel...
[sfrench/cifs-2.6.git] / fs / afs / inode.c
1 /*
2  * Copyright (c) 2002 Red Hat, Inc. All rights reserved.
3  *
4  * This software may be freely redistributed under the terms of the
5  * GNU General Public License.
6  *
7  * You should have received a copy of the GNU General Public License
8  * along with this program; if not, write to the Free Software
9  * Foundation, Inc., 675 Mass Ave, Cambridge, MA 02139, USA.
10  *
11  * Authors: David Woodhouse <dwmw2@infradead.org>
12  *          David Howells <dhowells@redhat.com>
13  *
14  */
15
16 #include <linux/kernel.h>
17 #include <linux/module.h>
18 #include <linux/init.h>
19 #include <linux/fs.h>
20 #include <linux/pagemap.h>
21 #include <linux/sched.h>
22 #include <linux/mount.h>
23 #include <linux/namei.h>
24 #include <linux/iversion.h>
25 #include "internal.h"
26
27 static const struct inode_operations afs_symlink_inode_operations = {
28         .get_link       = page_get_link,
29         .listxattr      = afs_listxattr,
30 };
31
32 /*
33  * Initialise an inode from the vnode status.
34  */
35 static int afs_inode_init_from_status(struct afs_vnode *vnode, struct key *key)
36 {
37         struct inode *inode = AFS_VNODE_TO_I(vnode);
38
39         _debug("FS: ft=%d lk=%d sz=%llu ver=%Lu mod=%hu",
40                vnode->status.type,
41                vnode->status.nlink,
42                (unsigned long long) vnode->status.size,
43                vnode->status.data_version,
44                vnode->status.mode);
45
46         read_seqlock_excl(&vnode->cb_lock);
47
48         afs_update_inode_from_status(vnode, &vnode->status, NULL,
49                                      AFS_VNODE_NOT_YET_SET);
50
51         switch (vnode->status.type) {
52         case AFS_FTYPE_FILE:
53                 inode->i_mode   = S_IFREG | vnode->status.mode;
54                 inode->i_op     = &afs_file_inode_operations;
55                 inode->i_fop    = &afs_file_operations;
56                 inode->i_mapping->a_ops = &afs_fs_aops;
57                 break;
58         case AFS_FTYPE_DIR:
59                 inode->i_mode   = S_IFDIR | vnode->status.mode;
60                 inode->i_op     = &afs_dir_inode_operations;
61                 inode->i_fop    = &afs_dir_file_operations;
62                 inode->i_mapping->a_ops = &afs_dir_aops;
63                 break;
64         case AFS_FTYPE_SYMLINK:
65                 /* Symlinks with a mode of 0644 are actually mountpoints. */
66                 if ((vnode->status.mode & 0777) == 0644) {
67                         inode->i_flags |= S_AUTOMOUNT;
68
69                         set_bit(AFS_VNODE_MOUNTPOINT, &vnode->flags);
70
71                         inode->i_mode   = S_IFDIR | 0555;
72                         inode->i_op     = &afs_mntpt_inode_operations;
73                         inode->i_fop    = &afs_mntpt_file_operations;
74                         inode->i_mapping->a_ops = &afs_fs_aops;
75                 } else {
76                         inode->i_mode   = S_IFLNK | vnode->status.mode;
77                         inode->i_op     = &afs_symlink_inode_operations;
78                         inode->i_mapping->a_ops = &afs_fs_aops;
79                 }
80                 inode_nohighmem(inode);
81                 break;
82         default:
83                 printk("kAFS: AFS vnode with undefined type\n");
84                 read_sequnlock_excl(&vnode->cb_lock);
85                 return afs_protocol_error(NULL, -EBADMSG, afs_eproto_file_type);
86         }
87
88         inode->i_blocks         = 0;
89         vnode->invalid_before   = vnode->status.data_version;
90
91         read_sequnlock_excl(&vnode->cb_lock);
92         return 0;
93 }
94
95 /*
96  * Fetch file status from the volume.
97  */
98 int afs_fetch_status(struct afs_vnode *vnode, struct key *key, bool new_inode)
99 {
100         struct afs_fs_cursor fc;
101         int ret;
102
103         _enter("%s,{%llx:%llu.%u,S=%lx}",
104                vnode->volume->name,
105                vnode->fid.vid, vnode->fid.vnode, vnode->fid.unique,
106                vnode->flags);
107
108         ret = -ERESTARTSYS;
109         if (afs_begin_vnode_operation(&fc, vnode, key)) {
110                 while (afs_select_fileserver(&fc)) {
111                         fc.cb_break = afs_calc_vnode_cb_break(vnode);
112                         afs_fs_fetch_file_status(&fc, NULL, new_inode);
113                 }
114
115                 afs_check_for_remote_deletion(&fc, fc.vnode);
116                 afs_vnode_commit_status(&fc, vnode, fc.cb_break);
117                 ret = afs_end_vnode_operation(&fc);
118         }
119
120         _leave(" = %d", ret);
121         return ret;
122 }
123
124 /*
125  * iget5() comparator
126  */
127 int afs_iget5_test(struct inode *inode, void *opaque)
128 {
129         struct afs_iget_data *data = opaque;
130         struct afs_vnode *vnode = AFS_FS_I(inode);
131
132         return memcmp(&vnode->fid, &data->fid, sizeof(data->fid)) == 0;
133 }
134
135 /*
136  * iget5() comparator for inode created by autocell operations
137  *
138  * These pseudo inodes don't match anything.
139  */
140 static int afs_iget5_pseudo_dir_test(struct inode *inode, void *opaque)
141 {
142         return 0;
143 }
144
145 /*
146  * iget5() inode initialiser
147  */
148 static int afs_iget5_set(struct inode *inode, void *opaque)
149 {
150         struct afs_iget_data *data = opaque;
151         struct afs_vnode *vnode = AFS_FS_I(inode);
152
153         vnode->fid = data->fid;
154         vnode->volume = data->volume;
155
156         /* YFS supports 96-bit vnode IDs, but Linux only supports
157          * 64-bit inode numbers.
158          */
159         inode->i_ino = data->fid.vnode;
160         inode->i_generation = data->fid.unique;
161         return 0;
162 }
163
164 /*
165  * Create an inode for a dynamic root directory or an autocell dynamic
166  * automount dir.
167  */
168 struct inode *afs_iget_pseudo_dir(struct super_block *sb, bool root)
169 {
170         struct afs_iget_data data;
171         struct afs_super_info *as;
172         struct afs_vnode *vnode;
173         struct inode *inode;
174         static atomic_t afs_autocell_ino;
175
176         _enter("");
177
178         as = sb->s_fs_info;
179         if (as->volume) {
180                 data.volume = as->volume;
181                 data.fid.vid = as->volume->vid;
182         }
183         if (root) {
184                 data.fid.vnode = 1;
185                 data.fid.unique = 1;
186         } else {
187                 data.fid.vnode = atomic_inc_return(&afs_autocell_ino);
188                 data.fid.unique = 0;
189         }
190
191         inode = iget5_locked(sb, data.fid.vnode,
192                              afs_iget5_pseudo_dir_test, afs_iget5_set,
193                              &data);
194         if (!inode) {
195                 _leave(" = -ENOMEM");
196                 return ERR_PTR(-ENOMEM);
197         }
198
199         _debug("GOT INODE %p { ino=%lu, vl=%llx, vn=%llx, u=%x }",
200                inode, inode->i_ino, data.fid.vid, data.fid.vnode,
201                data.fid.unique);
202
203         vnode = AFS_FS_I(inode);
204
205         /* there shouldn't be an existing inode */
206         BUG_ON(!(inode->i_state & I_NEW));
207
208         inode->i_size           = 0;
209         inode->i_mode           = S_IFDIR | S_IRUGO | S_IXUGO;
210         if (root) {
211                 inode->i_op     = &afs_dynroot_inode_operations;
212                 inode->i_fop    = &afs_dynroot_file_operations;
213         } else {
214                 inode->i_op     = &afs_autocell_inode_operations;
215         }
216         set_nlink(inode, 2);
217         inode->i_uid            = GLOBAL_ROOT_UID;
218         inode->i_gid            = GLOBAL_ROOT_GID;
219         inode->i_ctime = inode->i_atime = inode->i_mtime = current_time(inode);
220         inode->i_blocks         = 0;
221         inode_set_iversion_raw(inode, 0);
222         inode->i_generation     = 0;
223
224         set_bit(AFS_VNODE_PSEUDODIR, &vnode->flags);
225         if (!root) {
226                 set_bit(AFS_VNODE_MOUNTPOINT, &vnode->flags);
227                 inode->i_flags |= S_AUTOMOUNT;
228         }
229
230         inode->i_flags |= S_NOATIME;
231         unlock_new_inode(inode);
232         _leave(" = %p", inode);
233         return inode;
234 }
235
236 /*
237  * Get a cache cookie for an inode.
238  */
239 static void afs_get_inode_cache(struct afs_vnode *vnode)
240 {
241 #ifdef CONFIG_AFS_FSCACHE
242         struct {
243                 u32 vnode_id;
244                 u32 unique;
245                 u32 vnode_id_ext[2];    /* Allow for a 96-bit key */
246         } __packed key;
247         struct afs_vnode_cache_aux aux;
248
249         if (vnode->status.type == AFS_FTYPE_DIR) {
250                 vnode->cache = NULL;
251                 return;
252         }
253
254         key.vnode_id            = vnode->fid.vnode;
255         key.unique              = vnode->fid.unique;
256         key.vnode_id_ext[0]     = vnode->fid.vnode >> 32;
257         key.vnode_id_ext[1]     = vnode->fid.vnode_hi;
258         aux.data_version        = vnode->status.data_version;
259
260         vnode->cache = fscache_acquire_cookie(vnode->volume->cache,
261                                               &afs_vnode_cache_index_def,
262                                               &key, sizeof(key),
263                                               &aux, sizeof(aux),
264                                               vnode, vnode->status.size, true);
265 #endif
266 }
267
268 /*
269  * inode retrieval
270  */
271 struct inode *afs_iget(struct super_block *sb, struct key *key,
272                        struct afs_fid *fid, struct afs_file_status *status,
273                        struct afs_callback *cb, struct afs_cb_interest *cbi)
274 {
275         struct afs_iget_data data = { .fid = *fid };
276         struct afs_super_info *as;
277         struct afs_vnode *vnode;
278         struct inode *inode;
279         int ret;
280
281         _enter(",{%llx:%llu.%u},,", fid->vid, fid->vnode, fid->unique);
282
283         as = sb->s_fs_info;
284         data.volume = as->volume;
285
286         inode = iget5_locked(sb, fid->vnode, afs_iget5_test, afs_iget5_set,
287                              &data);
288         if (!inode) {
289                 _leave(" = -ENOMEM");
290                 return ERR_PTR(-ENOMEM);
291         }
292
293         _debug("GOT INODE %p { vl=%llx vn=%llx, u=%x }",
294                inode, fid->vid, fid->vnode, fid->unique);
295
296         vnode = AFS_FS_I(inode);
297
298         /* deal with an existing inode */
299         if (!(inode->i_state & I_NEW)) {
300                 _leave(" = %p", inode);
301                 return inode;
302         }
303
304         if (!status) {
305                 /* it's a remotely extant inode */
306                 ret = afs_fetch_status(vnode, key, true);
307                 if (ret < 0)
308                         goto bad_inode;
309         } else {
310                 /* it's an inode we just created */
311                 memcpy(&vnode->status, status, sizeof(vnode->status));
312
313                 if (!cb) {
314                         /* it's a symlink we just created (the fileserver
315                          * didn't give us a callback) */
316                         vnode->cb_version = 0;
317                         vnode->cb_type = 0;
318                         vnode->cb_expires_at = ktime_get();
319                 } else {
320                         vnode->cb_version = cb->version;
321                         vnode->cb_type = cb->type;
322                         vnode->cb_expires_at = cb->expires_at;
323                         vnode->cb_interest = afs_get_cb_interest(cbi);
324                         set_bit(AFS_VNODE_CB_PROMISED, &vnode->flags);
325                 }
326
327                 vnode->cb_expires_at += ktime_get_real_seconds();
328         }
329
330         ret = afs_inode_init_from_status(vnode, key);
331         if (ret < 0)
332                 goto bad_inode;
333
334         afs_get_inode_cache(vnode);
335
336         /* success */
337         clear_bit(AFS_VNODE_UNSET, &vnode->flags);
338         inode->i_flags |= S_NOATIME;
339         unlock_new_inode(inode);
340         _leave(" = %p [CB { v=%u t=%u }]", inode, vnode->cb_version, vnode->cb_type);
341         return inode;
342
343         /* failure */
344 bad_inode:
345         iget_failed(inode);
346         _leave(" = %d [bad]", ret);
347         return ERR_PTR(ret);
348 }
349
350 /*
351  * mark the data attached to an inode as obsolete due to a write on the server
352  * - might also want to ditch all the outstanding writes and dirty pages
353  */
354 void afs_zap_data(struct afs_vnode *vnode)
355 {
356         _enter("{%llx:%llu}", vnode->fid.vid, vnode->fid.vnode);
357
358 #ifdef CONFIG_AFS_FSCACHE
359         fscache_invalidate(vnode->cache);
360 #endif
361
362         /* nuke all the non-dirty pages that aren't locked, mapped or being
363          * written back in a regular file and completely discard the pages in a
364          * directory or symlink */
365         if (S_ISREG(vnode->vfs_inode.i_mode))
366                 invalidate_remote_inode(&vnode->vfs_inode);
367         else
368                 invalidate_inode_pages2(vnode->vfs_inode.i_mapping);
369 }
370
371 /*
372  * validate a vnode/inode
373  * - there are several things we need to check
374  *   - parent dir data changes (rm, rmdir, rename, mkdir, create, link,
375  *     symlink)
376  *   - parent dir metadata changed (security changes)
377  *   - dentry data changed (write, truncate)
378  *   - dentry metadata changed (security changes)
379  */
380 int afs_validate(struct afs_vnode *vnode, struct key *key)
381 {
382         time64_t now = ktime_get_real_seconds();
383         bool valid;
384         int ret;
385
386         _enter("{v={%llx:%llu} fl=%lx},%x",
387                vnode->fid.vid, vnode->fid.vnode, vnode->flags,
388                key_serial(key));
389
390         /* Quickly check the callback state.  Ideally, we'd use read_seqbegin
391          * here, but we have no way to pass the net namespace to the RCU
392          * cleanup for the server record.
393          */
394         read_seqlock_excl(&vnode->cb_lock);
395
396         if (test_bit(AFS_VNODE_CB_PROMISED, &vnode->flags)) {
397                 if (vnode->cb_s_break != vnode->cb_interest->server->cb_s_break ||
398                     vnode->cb_v_break != vnode->volume->cb_v_break) {
399                         vnode->cb_s_break = vnode->cb_interest->server->cb_s_break;
400                         vnode->cb_v_break = vnode->volume->cb_v_break;
401                         valid = false;
402                 } else if (vnode->status.type == AFS_FTYPE_DIR &&
403                            (!test_bit(AFS_VNODE_DIR_VALID, &vnode->flags) ||
404                             vnode->cb_expires_at - 10 <= now)) {
405                         valid = false;
406                 } else if (test_bit(AFS_VNODE_ZAP_DATA, &vnode->flags) ||
407                            vnode->cb_expires_at - 10 <= now) {
408                         valid = false;
409                 } else {
410                         valid = true;
411                 }
412         } else if (test_bit(AFS_VNODE_DELETED, &vnode->flags)) {
413                 valid = true;
414         } else {
415                 vnode->cb_v_break = vnode->volume->cb_v_break;
416                 valid = false;
417         }
418
419         read_sequnlock_excl(&vnode->cb_lock);
420
421         if (test_bit(AFS_VNODE_DELETED, &vnode->flags))
422                 clear_nlink(&vnode->vfs_inode);
423
424         if (valid)
425                 goto valid;
426
427         down_write(&vnode->validate_lock);
428
429         /* if the promise has expired, we need to check the server again to get
430          * a new promise - note that if the (parent) directory's metadata was
431          * changed then the security may be different and we may no longer have
432          * access */
433         if (!test_bit(AFS_VNODE_CB_PROMISED, &vnode->flags)) {
434                 _debug("not promised");
435                 ret = afs_fetch_status(vnode, key, false);
436                 if (ret < 0) {
437                         if (ret == -ENOENT) {
438                                 set_bit(AFS_VNODE_DELETED, &vnode->flags);
439                                 ret = -ESTALE;
440                         }
441                         goto error_unlock;
442                 }
443                 _debug("new promise [fl=%lx]", vnode->flags);
444         }
445
446         if (test_bit(AFS_VNODE_DELETED, &vnode->flags)) {
447                 _debug("file already deleted");
448                 ret = -ESTALE;
449                 goto error_unlock;
450         }
451
452         /* if the vnode's data version number changed then its contents are
453          * different */
454         if (test_and_clear_bit(AFS_VNODE_ZAP_DATA, &vnode->flags))
455                 afs_zap_data(vnode);
456         up_write(&vnode->validate_lock);
457 valid:
458         _leave(" = 0");
459         return 0;
460
461 error_unlock:
462         up_write(&vnode->validate_lock);
463         _leave(" = %d", ret);
464         return ret;
465 }
466
467 /*
468  * read the attributes of an inode
469  */
470 int afs_getattr(const struct path *path, struct kstat *stat,
471                 u32 request_mask, unsigned int query_flags)
472 {
473         struct inode *inode = d_inode(path->dentry);
474         struct afs_vnode *vnode = AFS_FS_I(inode);
475         int seq = 0;
476
477         _enter("{ ino=%lu v=%u }", inode->i_ino, inode->i_generation);
478
479         do {
480                 read_seqbegin_or_lock(&vnode->cb_lock, &seq);
481                 generic_fillattr(inode, stat);
482         } while (need_seqretry(&vnode->cb_lock, seq));
483
484         done_seqretry(&vnode->cb_lock, seq);
485         return 0;
486 }
487
488 /*
489  * discard an AFS inode
490  */
491 int afs_drop_inode(struct inode *inode)
492 {
493         _enter("");
494
495         if (test_bit(AFS_VNODE_PSEUDODIR, &AFS_FS_I(inode)->flags))
496                 return generic_delete_inode(inode);
497         else
498                 return generic_drop_inode(inode);
499 }
500
501 /*
502  * clear an AFS inode
503  */
504 void afs_evict_inode(struct inode *inode)
505 {
506         struct afs_vnode *vnode;
507
508         vnode = AFS_FS_I(inode);
509
510         _enter("{%llx:%llu.%d}",
511                vnode->fid.vid,
512                vnode->fid.vnode,
513                vnode->fid.unique);
514
515         _debug("CLEAR INODE %p", inode);
516
517         ASSERTCMP(inode->i_ino, ==, vnode->fid.vnode);
518
519         truncate_inode_pages_final(&inode->i_data);
520         clear_inode(inode);
521
522         if (vnode->cb_interest) {
523                 afs_put_cb_interest(afs_i2net(inode), vnode->cb_interest);
524                 vnode->cb_interest = NULL;
525         }
526
527         while (!list_empty(&vnode->wb_keys)) {
528                 struct afs_wb_key *wbk = list_entry(vnode->wb_keys.next,
529                                                     struct afs_wb_key, vnode_link);
530                 list_del(&wbk->vnode_link);
531                 afs_put_wb_key(wbk);
532         }
533
534 #ifdef CONFIG_AFS_FSCACHE
535         {
536                 struct afs_vnode_cache_aux aux;
537
538                 aux.data_version = vnode->status.data_version;
539                 fscache_relinquish_cookie(vnode->cache, &aux,
540                                           test_bit(AFS_VNODE_DELETED, &vnode->flags));
541                 vnode->cache = NULL;
542         }
543 #endif
544
545         afs_put_permits(rcu_access_pointer(vnode->permit_cache));
546         key_put(vnode->lock_key);
547         vnode->lock_key = NULL;
548         _leave("");
549 }
550
551 /*
552  * set the attributes of an inode
553  */
554 int afs_setattr(struct dentry *dentry, struct iattr *attr)
555 {
556         struct afs_fs_cursor fc;
557         struct afs_vnode *vnode = AFS_FS_I(d_inode(dentry));
558         struct key *key;
559         int ret;
560
561         _enter("{%llx:%llu},{n=%pd},%x",
562                vnode->fid.vid, vnode->fid.vnode, dentry,
563                attr->ia_valid);
564
565         if (!(attr->ia_valid & (ATTR_SIZE | ATTR_MODE | ATTR_UID | ATTR_GID |
566                                 ATTR_MTIME))) {
567                 _leave(" = 0 [unsupported]");
568                 return 0;
569         }
570
571         /* flush any dirty data outstanding on a regular file */
572         if (S_ISREG(vnode->vfs_inode.i_mode))
573                 filemap_write_and_wait(vnode->vfs_inode.i_mapping);
574
575         if (attr->ia_valid & ATTR_FILE) {
576                 key = afs_file_key(attr->ia_file);
577         } else {
578                 key = afs_request_key(vnode->volume->cell);
579                 if (IS_ERR(key)) {
580                         ret = PTR_ERR(key);
581                         goto error;
582                 }
583         }
584
585         ret = -ERESTARTSYS;
586         if (afs_begin_vnode_operation(&fc, vnode, key)) {
587                 while (afs_select_fileserver(&fc)) {
588                         fc.cb_break = afs_calc_vnode_cb_break(vnode);
589                         afs_fs_setattr(&fc, attr);
590                 }
591
592                 afs_check_for_remote_deletion(&fc, fc.vnode);
593                 afs_vnode_commit_status(&fc, vnode, fc.cb_break);
594                 ret = afs_end_vnode_operation(&fc);
595         }
596
597         if (!(attr->ia_valid & ATTR_FILE))
598                 key_put(key);
599
600 error:
601         _leave(" = %d", ret);
602         return ret;
603 }