kernel BUG at fs/nfs/namespace.c:108! - can be triggered by bad server
authorNeil Brown <neilb@suse.de>
Thu, 1 Nov 2007 05:50:20 +0000 (16:50 +1100)
committerTrond Myklebust <Trond.Myklebust@netapp.com>
Sat, 17 Nov 2007 18:08:48 +0000 (13:08 -0500)
commit4c1fe2f78a08e2c514a39c91a0eb7b55bbd3c0d2
treec420262ec489f3257afcbb5457168da0ce9cc53c
parenteda4f9b7996e5520934ca2a7310b363463a4e3b0
kernel BUG at fs/nfs/namespace.c:108! - can be triggered by bad server

Hi Trond,

I have discovered that the BUG_ON in nfs_follow_mountpoint:

BUG_ON(IS_ROOT(dentry));

can be triggered by a misbehaving server.

What happens is the client does a lookup and discoveres that the named
directory has a different fsid, so it initiates a mount.
It then performs a GETATTR on the mounted directory and gets a
different fsid again (due to a bug in the NFS server).
This causes nfs_follow_mountpoint to be called on the newly mounted
root, which triggers the BUG_ON.

To duplicate this, have a directory which contains some mountpoints,
and export that directory with the "crossmnt" flag using nfs-utils
1.1.1 (or 1.1.0 I think)

The GETATTR on the root of the mounted filesystem will return the
information for the top exportpoint, while a lookup will return the
correct information.  This difference causes the NFS client to BUG.

I think the best way to fix this is to trap this possibility early, so
just before completing the mount in the NFS client, check that it isn't
going to use nfs_mountpoint_inode_operations.
As long as i_op will never change once set (is that true?), this
should be adequately safe.

The following patch shows a possible approach, and it works for me.
i.e. when the NFS server is misbehaving, I get ESTALE on those
mountpoints, while when the NFS server is working correctly, I get
correct behaviour on the client.

NeilBrown

Signed-off-by: Neil Brown <neilb@suse.de>
Signed-off-by: Trond Myklebust <Trond.Myklebust@netapp.com>
fs/nfs/super.c