block: fix race between set_blocksize and read paths (c0e473a0) · Commits · git / linux-net

block/bdev.c

+17 −0

Original line number	Diff line number	Diff line
		@@ -169,10 +169,27 @@ int set_blocksize(struct file *file, int size)

		/* Don't change the size if it is same as current */
		if (inode->i_blkbits != blksize_bits(size)) {
		/*
		* Flush and truncate the pagecache before we reconfigure the
		* mapping geometry because folio sizes are variable now. If a
		* reader has already allocated a folio whose size is smaller
		* than the new min_order but invokes readahead after the new
		* min_order becomes visible, readahead will think there are
		* "zero" blocks per folio and crash. Take the inode and
		* invalidation locks to avoid racing with
		* read/write/fallocate.
		*/
		inode_lock(inode);
		filemap_invalidate_lock(inode->i_mapping);

		sync_blockdev(bdev);
		kill_bdev(bdev);

		inode->i_blkbits = blksize_bits(size);
		mapping_set_folio_min_order(inode->i_mapping, get_order(size));
		kill_bdev(bdev);
		filemap_invalidate_unlock(inode->i_mapping);
		inode_unlock(inode);
		}
		return 0;
		}

block/blk-zoned.c

+4 −1

Original line number	Diff line number	Diff line
		@@ -343,6 +343,7 @@ int blkdev_zone_mgmt_ioctl(struct block_device *bdev, blk_mode_t mode,
		op = REQ_OP_ZONE_RESET;

		/* Invalidate the page cache, including dirty pages. */
		inode_lock(bdev->bd_mapping->host);
		filemap_invalidate_lock(bdev->bd_mapping);
		ret = blkdev_truncate_zone_range(bdev, mode, &zrange);
		if (ret)
		@@ -364,8 +365,10 @@ int blkdev_zone_mgmt_ioctl(struct block_device *bdev, blk_mode_t mode,
		ret = blkdev_zone_mgmt(bdev, op, zrange.sector, zrange.nr_sectors);

		fail:
		if (cmd == BLKRESETZONE)
		if (cmd == BLKRESETZONE) {
		filemap_invalidate_unlock(bdev->bd_mapping);
		inode_unlock(bdev->bd_mapping->host);
		}

		return ret;
		}

block/fops.c

+16 −0

Original line number	Diff line number	Diff line
		@@ -746,7 +746,14 @@ static ssize_t blkdev_write_iter(struct kiocb iocb, struct iov_iter from)
		ret = direct_write_fallback(iocb, from, ret,
		blkdev_buffered_write(iocb, from));
		} else {
		/*
		* Take i_rwsem and invalidate_lock to avoid racing with
		* set_blocksize changing i_blkbits/folio order and punching
		* out the pagecache.
		*/
		inode_lock_shared(bd_inode);
		ret = blkdev_buffered_write(iocb, from);
		inode_unlock_shared(bd_inode);
		}

		if (ret > 0)
		@@ -757,6 +764,7 @@ static ssize_t blkdev_write_iter(struct kiocb iocb, struct iov_iter from)

		static ssize_t blkdev_read_iter(struct kiocb iocb, struct iov_iter to)
		{
		struct inode *bd_inode = bdev_file_inode(iocb->ki_filp);
		struct block_device *bdev = I_BDEV(iocb->ki_filp->f_mapping->host);
		loff_t size = bdev_nr_bytes(bdev);
		loff_t pos = iocb->ki_pos;
		@@ -793,7 +801,13 @@ static ssize_t blkdev_read_iter(struct kiocb iocb, struct iov_iter to)
		goto reexpand;
		}

		/*
		* Take i_rwsem and invalidate_lock to avoid racing with set_blocksize
		* changing i_blkbits/folio order and punching out the pagecache.
		*/
		inode_lock_shared(bd_inode);
		ret = filemap_read(iocb, to, ret);
		inode_unlock_shared(bd_inode);

		reexpand:
		if (unlikely(shorted))
		@@ -836,6 +850,7 @@ static long blkdev_fallocate(struct file *file, int mode, loff_t start,
		if ((start \| len) & (bdev_logical_block_size(bdev) - 1))
		return -EINVAL;

		inode_lock(inode);
		filemap_invalidate_lock(inode->i_mapping);

		/*
		@@ -868,6 +883,7 @@ static long blkdev_fallocate(struct file *file, int mode, loff_t start,

		fail:
		filemap_invalidate_unlock(inode->i_mapping);
		inode_unlock(inode);
		return error;
		}

block/ioctl.c

+6 −0

Original line number	Diff line number	Diff line
		@@ -142,6 +142,7 @@ static int blk_ioctl_discard(struct block_device *bdev, blk_mode_t mode,
		if (err)
		return err;

		inode_lock(bdev->bd_mapping->host);
		filemap_invalidate_lock(bdev->bd_mapping);
		err = truncate_bdev_range(bdev, mode, start, start + len - 1);
		if (err)
		@@ -174,6 +175,7 @@ static int blk_ioctl_discard(struct block_device *bdev, blk_mode_t mode,
		blk_finish_plug(&plug);
		fail:
		filemap_invalidate_unlock(bdev->bd_mapping);
		inode_unlock(bdev->bd_mapping->host);
		return err;
		}

		@@ -199,12 +201,14 @@ static int blk_ioctl_secure_erase(struct block_device *bdev, blk_mode_t mode,
		end > bdev_nr_bytes(bdev))
		return -EINVAL;

		inode_lock(bdev->bd_mapping->host);
		filemap_invalidate_lock(bdev->bd_mapping);
		err = truncate_bdev_range(bdev, mode, start, end - 1);
		if (!err)
		err = blkdev_issue_secure_erase(bdev, start >> 9, len >> 9,
		GFP_KERNEL);
		filemap_invalidate_unlock(bdev->bd_mapping);
		inode_unlock(bdev->bd_mapping->host);
		return err;
		}

		@@ -236,6 +240,7 @@ static int blk_ioctl_zeroout(struct block_device *bdev, blk_mode_t mode,
		return -EINVAL;

		/* Invalidate the page cache, including dirty pages */
		inode_lock(bdev->bd_mapping->host);
		filemap_invalidate_lock(bdev->bd_mapping);
		err = truncate_bdev_range(bdev, mode, start, end);
		if (err)
		@@ -246,6 +251,7 @@ static int blk_ioctl_zeroout(struct block_device *bdev, blk_mode_t mode,

		fail:
		filemap_invalidate_unlock(bdev->bd_mapping);
		inode_unlock(bdev->bd_mapping->host);
		return err;
		}