Btrfs: deal with duplciates during extent_map insertion in btrfs_get_extent
authorChris Mason <clm@fb.com>
Sat, 19 Sep 2015 18:28:25 +0000 (11:28 -0700)
committerChris Mason <clm@fb.com>
Fri, 3 Jun 2016 19:32:34 +0000 (12:32 -0700)
commit8dff9c85341032767d7b519217a79ea04cd676b0
treefb6fada259a38e9eb68660b4f0e3376714b890d4
parentf881dd29bf31fb9e8072a3a47c834fa804f7d249
Btrfs: deal with duplciates during extent_map insertion in btrfs_get_extent

When dealing with inline extents, btrfs_get_extent will incorrectly try
to insert a duplicate extent_map.  The dup hits -EEXIST from
add_extent_map, but then we try to merge with the existing one and end
up trying to insert a zero length extent_map.

This actually works most of the time, except when there are extent maps
past the end of the inline extent.  rocksdb will trigger this sometimes
because it preallocates an extent and then truncates down.

Josef made a script to trigger with xfs_io:

#!/bin/bash

xfs_io -f -c "pwrite 0 1000" inline
xfs_io -c "falloc -k 4k 1M" inline
xfs_io -c "pread 0 1000" -c "fadvise -d 0 1000" -c "pread 0 1000" inline
xfs_io -c "fadvise -d 0 1000" inline
cat inline

You'll get EIOs trying to read inline after this because add_extent_map
is returning EEXIST

Signed-off-by: Chris Mason <clm@fb.com>
fs/btrfs/inode.c